43
suatu kriteria menyeluruh, seperti
average within cluster distance
utnuk sejumlah klaster tertentu.
Dua kelemahan dari prosedur non-hierarki ialah bahwa
banyaknya klaster yang ahrus disebutkan atau ditentukan sebelumnya
dan pemilihan pusat klaster sembarang (arbitary). Lebih lanjut, hasil
pengklasteran mungkin tergantung pada bagaimana pusat (centers)
dipilih. Banyak program non-hirarki, memilih k objek yang pertama,
tanpa ada nilai yang hilang sebagai pusat klaster awal (k = banyakanya
klaster). Jadi hasil pengklasteran mungkin tergantung pada urutan
observasi dalam data. Bagaimanapun juga pengklasteran non-hirerarki
lebih cepat daripada metode hierarki dan lebih menguntungkan kalau
jumlah objek atau observasi besar sekali (sampel besar).
Telah disarankan bahwa metode hierarkis dan non-hierarkis
dipergunakan secara berdampingan (in tandem). Pertama, suatu pemecahan
pengklasteran awal, diperoleh dengan menggunakan prosedur hierarkis,
seperti, misalnya average linkage method atau Ward. Banyaknya klaster dan
centroid klaster yang diperoleh dipergunakan sebagai input untuk optimizing
partitioning method. Pilihan suatu metode pengklasteran dan pilihan suatu
ukuran jarak, berkaitan satu sama lain. Sebagai contoh, jarak eucledean yang
dikuadratkan (squared
eucledean
distance) harus dipergunakan dengan
metode Ward
dan centroid. Beberapa prosedur non-hierarki juga
menggunakan jarak eucledean yang dikuadratkan.
|