23
historik dan
menggunakan nilai prediksi dari
record
yang
terdekat dengan
record
yang belum diklasifikasi.
Nearest
neighbor
adalah
salah
satu
teknik
data
mining yang
paling
mudah
untuk
digunakan dan
dimengerti karena
memiliki
cara
kerja
yang
hampir sama dengan cara
orang berpikir -
dengan
mendeteksi contoh-contoh
yang memiliki kecocokan paling dekat.
Algoritma prediksi nearest
neighbor dapat dinyatakan sebagai berikut:
Objek-objek
yang
saling
berdekatan akan
mempunyai
nilai
prediksi
yang
sama.
Karena
itu,
bila
anda
tahu
nilai
prediksi dari
salah
satu
objek,
maka
anda dapat memprediksikan nilai dari nearest
neighbor.
Teknik
nearest
neighbor
digunakan
untuk
menemukan dokumen-
dokumen
lain
yang
berbagi
karakteristik-karakteristik penting
dengan
dokumen-dokumen yang telah ditandai sebagai dokumen yang menarik.
c). Clustering
Clustering
adalah
suatu
metode
dimana
data
yang
berkarakteristik
sama saling dikumpulkan
dalam
grup. Clustering
kadang digunakan
untuk
mensegmentasikan
pasar,
yang
sangat
berguna
bagi
orang-orang
pemasaran.
Cluster
membangun
seluruh
record
yang
terdapat
didalam
cluster
yang
memiliki nilai
yang
serupa
dari
predictor
tertentu
yang
dikelompokkan.
Membentuk
cluster
yang
homogen
yang
terdapat
nilai
predictor
yang
sama
adalah
sulit
untuk
dilakukan
jika
terdapat
banyak
predictor dan
/
atau
predictor
memiliki
nilai
yang
berbeda
(high
|