24
cardinality). Dapat
dipastikan
cluster
yang
homogen
dibentuk
dari
memecah cluster
yang lebih kecil dan homogen.
Batasan penting dalam clustering
adalah jumlah cluster
yang
masuk
akal
yang
terbentuk.
Yang
dimaksud
dengan
masuk
akal
ini
ditetapkan
oleh
pengguna, namun
sulit
untuk
mengukur
cluster
yang
tidak
bisa
diterima
(terlalu
generalisasi)
dan
banyak
cluster
dan
record
asli
yang
juga
tidak
diterima.
Banyak
algoritma clustering
memperbolehkan
pengguna untuk
memilih
jumlah
kelompok
yang
ingin
dilihat
terbentuk
dari
basisdata,
atau
mereka
menyediakan pengguna
sebuah
pengatur
dimana
mereka
dapat
membentuk
banyak
atau
sedikit
jumlah
kelompok
secara interaktif setelah clustering
terbentuk.
Sedangkan teknik baru terdiri dari:
a.
Decision Tree
Decision
tree
adalah
sebuah
predictive
model yang
dapat
dilihat
sebagai
tree.
Khususnya
masing-masing cabang
dari
tree
mengklasifikasikan pertanyaan
dan
daun
tree
merupakan
partisi
dari
dataset
dengan
klasifikasinya
masing-masing. Decision
tree
mewakili
serangkaian
pertanyaan-pertanyaan.
Jika
pertanyaan-pertanyaan
tersebut
dipilih
sangat
baik,
serangkaian pertanyaan pendek
cukup
untuk
menggolongkan secara akurat sebuah record
yang masuk.
Decision tree
merupakan tools yang paling bagus dan paling
terkenal
untuk
klasifikasi
dan prediksi.
Daya
tariknya
adalah
metode
|