Home Start Back Next End
  
59
2.9.4.2.1
K-Means Clustering
K-means
(MacQueen,1967)
adalah
salah
satu
algoritma
unsupervised
learning
paling
sederhana
yang
menyelesaikan
masalah
pengelompokan yang
umum
dikenal.
Prosedurnya
mengikuti
cara
yang
sederhana
dan
mudah 
untuk
mengklasifikasikan 
set
data   yang   diberikan  
melalui 
sejumlah 
tertentu 
cluster 
(diasumsikan 
k   cluster)
menentukan prioritas.
Gagasan
utamanya
adalah
untuk
menetapkan k
centroid,
satu
untuk
masing-
masing
cluster.
Centroid
ini
seharusnya ditempatkan dalam
cara
yang
cerdik
karena
lokasi
yang
berbeda
menyebabkan hasil
yang
berbeda
pula.
Jadi,
pilihan
terbaik
untuk
menempatkannya sejauh
mungkin
satu
sama
lain.
Langkah
selanjutnya
adalah
menjadikan tiap point
masuk dalam
set
data
yang
diberikan dan
mengasosiasikannya ke
centroid terdekat. Ketika tidak ada point
yang pending,
langkah pertama
sempurna dan
groupage
awal
selesai.
Pada
titik
ini
kita
perlu
mengkalkulasi
ulang
k
centroid
baru
sebagai
barycenter dari
cluster
yang
didapat
dari
tahap
sebelumnya.
Setelah
kita
mendapatkan k
centroid baru
ini,
ikatan
baru
harus dilakukan antara data
set
point yang
sama
dan
centroid
baru
terdekat.
Perulangan
dilakukan.
Dari
hasil
perulangan
ini
kita
mungkin
memperhatikan
bahwa k
centroid
mengubah
lokasinya
langkah
demi
langkah
hingga akhirnya tidak ada lagi perubahan yang bisa dilakukan. Dengan kata lain centroid
tidak bergerak lagi.
Algoritma
ini
bertujuan pada
peminimalan sebuah
fungsi obyektif, dalam
hal
ini
fungsi error kuadrat. Fungsi obyektifnya :
Word to PDF Converter | Word to HTML Converter