Home Start Back Next End
  
52
Ketidakpekaan untuk mengorder masukan dokumen.
Dimensi yang tinggi.
Kemampuan penafsiran dan penggunaan.
2.9.3
Masalah-masalah
Ada banyak masalah-masalah dengan Clustering. Seperti:
Teknik Clustering terkini tidak menunjukkan semua persyaratan yang cukup.
Menghadapi
dengan
banyak
dimensi
dan
banyak
item-item
data
yang
problematis karena waktu kompleks.
Keefektifan  dari 
metode-metode  bergantung  pada  penjelasan  ”jarak”  (untuk
distance-based Clustering).
Jika
ukuran
jarak
yang
”jelas”
tidak
muncul,
kita
harus
menjelaskan
jarak
ini,
yang tidak akan selalu mudah, terutama dalam ruang multi-dimensi.
Hasil dari algoritma Clustering (yang dalam kebanyakan masalah dapat berubah-
ubah) dapat ditafsir dalam cara-cara berbeda.
2.9.4
Tipe-tipe Clustering
Terdapat
dua
jenis
algoritma
pengelompokan
data
antara
lain
pengelompokkan
hierarkis dan pengelompokan partisional (http://en.wikipedia.org/wiki/Cluster_analysis).
Clustering
dua
arah,
co-clustering atau
biclustering
adalah
metode
pengelompokkan
dimana
bukan
hanya
obyek
yang
dikelompokkan tetapi
juga
sifat-sifat
dari
obyek,
contohnya, jika data direpresentasikan dalam sebuah matriks data,
maka baris dan kolom
akan dikelompokkan secara bersamaan.
2.9.4.1 Hierarchical Clustering
Word to PDF Converter | Word to HTML Converter