Start Back Next End
  
17
pengumpulan
data awal, deskripsi data, eksplorasi data, dan
verifikasi
data
yang berkualitas. 
3.
Data preparation
Setelah sumber data telah tersedia untuk diidentifikasi. Data tersebut perlu
untuk dipilih, dibersihkan, dibangun ke dalam model yang diinginkan, dan
diformat.
Pembersihan data
dan transformasi
data dalam
penyusunan
pemodelan data perlu terjadi ditahap ini.
Gambar 2.6 Greedy (heuristic) methods for attribute subset selection.
Sumber: (Han, Kamber, & Pei, Data Mining Concepts and Techniques
3rd Edition, 2011)
Terdapat beberapa teknik dalam mengolah data seperti Data Transformation,
Data Reduction dan Data Cleaning, diantaranya :
Generalization
Mengubah data atribut
low level menjadi atribut high level, contoh: atribut
numerical menjadi ordinal.
Attribute construction
Penambahan atribut baru untuk kepentingan proses mining.
Attribute subset selection
Word to PDF Converter | Word to HTML Converter