|
54
Prosedur
pengelompokan
hierarkis agglomerative
menghasilkan serangkaian
pembagian data, P
n
,
P
n-1
,
....... , P1 . P
n
yang pertama berisi n kelompok obyek tunggal, P1
berisi kelompok tunggal yang berisi semua permasalahan n.
Pada tiap tahap tertentu
metode
ini bekerja sama dengan dua
cluster
yang paling
mirip. Perbedaan
antara metode
timbul
karena cara yang berbeda-beda
dalam
menetapkan jarak (atau kemiripan) antar cluster.
Beberapa tehnik agglomerative akan dijelaskan dibawah ini.
Single Linkage Clustering
Salah
satu
metode
pengelompokan
hierarkis
agglomerative
yang
paling
sederhana
adalah pertalian tunggal,
dikenal
juga
dengan tehnik
tetangga terdekat
(nearest
neighbor).
Pendefinisian
sifat
dari
metode
ini
adalah
bahwa
jarak
antar
kelompok
ditetapkan sebagai
jarak
antara
pasangan
obyek
terdekat,
dimana
hanya
pasangan
yang berisikan satu obyek dari tiap kelompok yang dipertimbangkan.
Dalam metode pertalian tunggal, D(r,s) dirumuskan sebagai :
D(r,s) = Min { d(i,j) :dimana obyek i didalam cluster r dan obyek j didalam cluster
s}
Disini
jarak
antara
pasangan obyek
(i,j)
yang
mungin
dihitung,
dimana
obyek
i
didalam cluster r dan obyek j didalam
cluster s. Nilai
minimum dari jarak
ini adalah
jarak
antara
cluster
r
dan
s.
Dengan
kata
lain,
jarak
antara
dua
cluster
adalah
nilai
dari link terpendek antar cluster. Pada tiap tahap dari hierarchical clustering, cluster r
dan s, untuk D(r,s) minimum, digabungkan.
|