2008100331SIBab2 - page 54 of 58

Page 54 of 58

Home Start Back Next End

59

2.9.4.2.1

K-Means Clustering

K-means

(MacQueen,1967)

adalah

salah

satu

algoritma

unsupervised

learning

paling

sederhana

yang

menyelesaikan

masalah

pengelompokan yang

umum

dikenal.

Prosedurnya

mengikuti

cara

yang

sederhana

dan

mudah

untuk

mengklasifikasikan

set

data yang diberikan

melalui

sejumlah

tertentu

cluster

(diasumsikan

k cluster)

menentukan prioritas.

Gagasan

utamanya

adalah

untuk

menetapkan k

centroid,

satu

untuk

masing-

masing

cluster.

Centroid

ini

seharusnya ditempatkan dalam

cara

yang

cerdik

karena

lokasi

yang

berbeda

menyebabkan hasil

yang

berbeda

pula.

Jadi,

pilihan

terbaik

untuk

menempatkannya sejauh

mungkin

satu

sama

lain.

Langkah

selanjutnya

adalah

menjadikan tiap point

masuk dalam

set

data

yang

diberikan dan

mengasosiasikannya ke

centroid terdekat. Ketika tidak ada point

yang pending,

langkah pertama

sempurna dan

groupage

awal

selesai.

Pada

titik

ini

kita

perlu

mengkalkulasi

ulang

k

centroid

baru

sebagai

barycenter dari

cluster

yang

didapat

dari

tahap

sebelumnya.

Setelah

kita

mendapatkan k

centroid baru

ini,

ikatan

baru

harus dilakukan antara data

set

point yang

sama

dan

centroid

baru

terdekat.

Perulangan

dilakukan.

Dari

hasil

perulangan

ini

kita

mungkin

memperhatikan

bahwa k

centroid

mengubah

lokasinya

langkah

demi

langkah

hingga akhirnya tidak ada lagi perubahan yang bisa dilakukan. Dengan kata lain centroid

tidak bergerak lagi.

Algoritma

ini

bertujuan pada

peminimalan sebuah

fungsi obyektif, dalam

hal

ini

fungsi error kuadrat. Fungsi obyektifnya :