|
19
Missing Value
Nilai null
yang terdapat dalam data set
dapat mengganggu pembuatan
mining yang dilakukan. Ada 6 (enam) metode yang dapat digunakan dalam
mengolah nilai null yang terdapat dalam data, yaitu :
a.
Ignore the tuple: tidak menggunakan tuple yang memiliki nilai null.
b.
Fill in the missing value manually: mengisi sendiri nilai null
yang
terdapat dalam data.
c.
Use global constant to fill in the missing value: mengganti nilai null
dengan label constant, seperti Unknown.
d.
Use the attribute mean to fill in the missing value: mengganti nilai
null dengan rata-rata yang dimiliki atribut.
e.
Use the attribute mean for all samples belonging to the same class
the given tuple: mengganti nilai null
dengan nilai rata-rata yang
dimilik atribut berdasarkan target kelas yang dicari.
f.
Use the most probable value to fill in the missing value: mengganti
nilai null
dengan nilai yang paling mungkin muncul berdasarkan
atribut target kelas yang dicari.
4.
Modeling
Tujuan dari pemodelan data mining
adalah untuk mencari hasil dari berbagai
situasi yang ada. Alat perangkat lunak untuk data mining seperti visualisasi
(men-split
data dan membangun hubungan) dan analisis kluster (untuk
mengidentifikasikan variabel
berjalan dengan baik secara bersamaan) dapat
berguna untuk analisis awal model yang akan digunakan. Pembagian
data ke
dalam set pelatihan dan pengujian juga diperlukan untuk pemodelan.
5.
Evaluation
Hasil model
harus dievaluasi
sesuai
tujuan bisnis
pada tahap pertama
(pemahaman bisnis). Evaluasi dilakukan dari hasil visualisasi dan perhitungan
statistik pengujian berdasarkan pemodelan yang dibuat. Pada akhir dari tahap
ini, keputusan penggunaan hasil data mining telah ditentukan.
6.
Deployment
Pembuatan dari model bukanlah akhir dari proyek data mining. Meskipun
tujuan dari pemodelan adalah untuk meningkatkan pengetahuan dari data,
pengetahuan data tersebut perlu dibangun dengan terorganisasi dan dibuat
pada satu bentuk yang dapat digunakan oleh pengguna.
|