Start Back Next End
  
12
kualitas data. Ini memberikan insentif balik  bagi Data preprocessing
dan
selanjutnya menguraikan tugas utama dalam data preprocessing .
Data Quality: Data memiliki kualitas jika data tersebut memenuhi
persyaratan
dari penggunaan yang data yang dimaksudkan. Faktor-faktor
yang terdiri dari kualitas data seperti akurasi, kelengkapan, konsistensi,
ketepatan waktu, kepercayaan, dan interpretability. Banyak alasan yang
memungkinkan untuk data yang tidak akurat (yaitu, memiliki nilai atribut
yang salah). Kesalahan dalam transmisi data juga dapat terjadi. Kualitas data
tergantung pada tujuan penggunaan data. Ketepatan waktu juga
mempengaruhi kualitas data.
Major Tasks in Data Preprocessing: Langkah-langkah utama yang
terlibat dalam preprocessing
data, yaitu data pembersihan, integrasi data,
reduksi data, dan transformasi data. Pembersihan data bekerja untuk
"membersihkan" data dengan mengisi nilai-nilai yang hilang, smoothing
noisy
data, mengidentifikasi atau menghapus outlier, dan menyelesaikan
inkonsistensi . Langkah pre-processing
yang berguna adalah menjalankan
data dengan pembersihan data.
Gambar 2.6 Bentuk Data preprocessing
Sumber: Han dan Kamber, 2011, p87
2.3.2
Data Cleaning
Pembersihan data (atau data cleansing)
ber-upaya untuk mengisi
nilai-nilai yang hilang, menghaluskan noisy data, mengidentifikasi outlier
,
dan inkonsistensi yang benar dalam data.
Word to PDF Converter | Word to HTML Converter