![]() 16
4.
Proses Klasifikasi berdasarkan
pada menemukan sebuah model
atau fungsi yang
menggambarkan dan
membedakan data kelas atau
konsep, dengan tujuan untuk
dapat menggunakan model
untuk memprediksi objek kelas
yang kelas labelnya belum
diketahui. Model tersebut
berdasarkan pada analisis dari
training data
(data objek yang
kelas labelnya telah diketahui.)
4. Proses Clustering berdasarkan
pada prinsip: objek yang ada di
dalam satu cluster memiliki
kemiripan yang tinggi dari pada
yang lainnya, tetapi sangat
berbeda dengan objek yang ada
pada cluster lainnya.
di atas, maka ditentukan
teknik data mining
yang digunakan, yaitu classification. Karena adanya penggunaan label
kelas pada data yang digunakan yaitu antara jantung dan tidak jantung sehingga bisa
membantu analisa pada data pasien baru yang kelas labelnya belum diketahui.
dengan memanfaatkan metodologi
CRISP-DM. Metodologi initerdiridarienam tahapprosessiklus. Metodologi ini membuat data
mining
yang besar dapat dilakukan dengan lebih cepat, lebih ekonomis, dan mudah untuk
diatur. Bahkan, datamining
yang berukuran kecil pun
dapat memperoleh keuntungan dari
CRISP-DM (Olson & Dursun, 2008). Berikut adalah enam tahap yang disebut sebagai siklus:
1.
Business understanding
Business understanding
meliputi penentuan
tujuan bisnis, menilai
situasi saat
ini, menetapkan tujuan data mining, dan mengembangkan rencana proyek.
2.
Data understanding
Setelah
tujuan bisnis
dan
rencana proyek
ditetapkan, Data understanding
mempertimbangkan
persyaratan
data.
Langkah inidapat mencakup
|