Home Start Back Next End
  
11
2.1.8 Tahapan dalam preprocessing
Ekstraksi. 
Data-data 
yang 
dikumpulkan  dalam 
proses 
transaksi 
sering 
kali
ditempatkan
pada
lokasi
yang
berbeda-beda. Maka
dari
itu
dibutuhkan
kemampuan dari sistem
untuk dapat
mengumpulkan data dengan cepat. Jika data
tersebut
disimpan
dalam
kantor
regional,
sering
kali
data
tersebut
diupload
ke
sebuah server
yang
lebih terpusat. Data dapat diringkas terlebih dahulu
sebelum
dikirimkan ke tempat penyimpanan pusat.
Seleksi
&
Pembersihan.
Proses
pembersihan
data,
dimana
informasi
yang
tidak
dibutuhkan
harus
dibuang.
Data
dikonfigurasi
ulang
untuk
memastikan
format
yang
konsisten karena
berasal
dari
berbagai
sumber.
Data-data
yang
telah
terkumpul selanjutnya akan
mengalami proses
pembersihan. Proses
pembersihan
data
dilakukan
untuk
membuang
record
yang
keliru,
menstandarkan atribut-
atribut,
merasionalisasi struktur
data,
dan
mengendalikan data
yang
hilang. Data
yang
tidak
konsisten
dan
banyak
kekeliruan
dapat
membuat
hasil
data
mining
tidak
akurat.
Pembersihan
data
juga
dapat
membantu
perusahaan untuk
mengkonsolidasikan
record.
Hal
ini
sangat
berguna
ketika
sebuah
perusahaan
mempunyai banyak
record
untuk
seorang
customer.
Setiap
record
atau
file
customer
mempunyai
nomor
customer
yang
sama,
tetapi
informasi
dalam
tiap
filenya berbeda.
Transformasi.
Transformasi
data 
adalah
melakukan
peringkasan
data 
dengan
mengasumsikan bahwa data telah tersimpan dalam tempat penyimpanan tunggal.
Pada langkah terakhir, data telah diekstrak dari banyak basis
data ke dalam basis
data tunggal. Tipe peringkasan yang dikerjakan dalam
langkah
ini
mirip dengan
Word to PDF Converter | Word to HTML Converter