![]() 15
merepresentasikan sebuah atribut. P(H) disebut prior probability H, contoh dalam kasus ini
adalah probabilitas kelas yang mendeklarasikan normal. P(X) merupakan prior probability X,
contoh untuk probabilitas sebuah atribut protocol_type. P(H|X) adalah posterior probability
yang merefleksikan probabilitas munculnya kelas normal terhadap data atribut protocol_type.
P(X|H) menunjukkan kemungkinan munculnya prediktor X (protocol_type) pada kelas
normal. Dan begitu juga seterusnya untuk proses menghitung probabilitas ke-empat kelas
lainnya.
Dari tugas
tugas data mining
yang telah di jelaskan, perbandingan antara
Classification
dan Clustering
menurut (Han & Kamber, Data Mining : Concept and
Techniques Second Edition, 2006) lebih spesifik digambarkan sebagai berikut :
Classification
Clustering
1.
Menganalisis label kelas dari
data objek.
1. menganalisis data objek tanpa
ada label kelas.
2.
Label kelas ada atau terlihat
jelas pada training data.
2.label kelas tidak ada atau tidak
terlihat pada training data.
3.
Bertujuan untuk
mengelompokan pada kelas
kelas yang telah ditentukan.
3.bertujuan untuk
mengelompokan dan
menentukan label kelas dari tiap
cluster yang telah terbentuk
|