Home Start Back Next End
  
23
historik dan
menggunakan nilai prediksi dari
record
yang
“terdekat” dengan
record
yang belum diklasifikasi.
Nearest
neighbor
adalah
salah
satu
teknik
data
mining yang
paling
mudah
untuk
digunakan dan
dimengerti karena
memiliki
cara
kerja
yang
hampir sama dengan cara
orang berpikir -
dengan
mendeteksi contoh-contoh
yang memiliki kecocokan paling dekat.
Algoritma prediksi nearest
neighbor dapat dinyatakan sebagai berikut:
Objek-objek
yang
saling
“berdekatan” akan
mempunyai
nilai
prediksi
yang
sama.
Karena
itu,
bila
anda
tahu
nilai
prediksi dari
salah
satu
objek,
maka
anda dapat memprediksikan nilai dari nearest
neighbor.
Teknik
nearest
neighbor
digunakan
untuk
menemukan dokumen-
dokumen
lain
yang
berbagi
karakteristik-karakteristik penting
dengan
dokumen-dokumen yang telah ditandai sebagai dokumen yang menarik.
c). Clustering
Clustering
adalah
suatu
metode
dimana
data
yang
berkarakteristik
sama  saling  dikumpulkan 
dalam 
grup.  Clustering 
kadang  digunakan
untuk
mensegmentasikan
pasar,
yang
sangat
berguna
bagi
orang-orang
pemasaran.
Cluster
membangun
seluruh
record
yang
terdapat
didalam
cluster
yang
memiliki nilai
yang
serupa
dari
predictor
tertentu
yang
dikelompokkan.
Membentuk
cluster
yang
homogen
yang
terdapat
nilai
predictor 
yang
sama
adalah
sulit
untuk
dilakukan
jika
terdapat
banyak
predictor   dan 
atau 
predictor  
memiliki 
nilai 
yang 
berbeda 
(high
Word to PDF Converter | Word to HTML Converter