Home Start Back Next End
  
42
dijumlahkan untuk semua objek. Pada setiap tahap, dua klaster dengan
kenaikan yang terkecil di dalam overall sum of squares within cluster
distances
digabung. In the centroids method, jarak antara dua klaster
merupakan jarak antara centroids (rata-rata dari seluruh variabel),
seperti ditunjukkan Gambar 2.4. Setiap objek dikelompokkan, centroid
baru dihitung. Kenyataan menunjukkan, metode hirarki, rata-rata
linkage, dan metode Ward lebih baik daripada metode lainnya.
b.
Pengklasteran non-hierarki
Jenis prosedur pengklasteran kedua adalah metode pengklasteran
non-hierarki, yang sering disebut dengan K-means clustering. Metode
ini meliputi sequential threshold, parallel threshold, dan optimising
partitioning. Di dalam sequential threshold method, suatu pusat klaster
dipilih dan semua objek dalam suatu prespesified threshold value dari
pusat, digabung bersama. Kemudian suatu pusat klaster yang baru atau
seed dipilih, dan proses diulangi, untuk titik-titik yang belum
diklasterkan (dikelompokkan) atau the unclustered points.
Segera setelah suatu objek diklasterkan dengan seeds
selanjutnya. The parallel threshold method
berlaku sama. Kecuali
bahwa beberapa pusat klaster dipilih secara simultan dan objek dalam
threshold level
dikelompokkan dengan pusat terdekat. The optimizing
partitioning method
berbeda dari prosedur dua threshold, dimana
objek selanjutnya di reassigned
ke klaster untuk mengoptimalkan
Word to PDF Converter | Word to HTML Converter