21
2. Mengekstrak dan membersihkan data
Data pertama kali diekstrak dari data aslinya, seperti OLTP database,
text
file,
microsoft access database,
dan bahkan dari spreadsheet.
Kemudian data
tersebut
diletakkan
dalam
data
warehouse
yang
mempunyai struktur
yang
sesuai dengan data
model. Secara khas,
Data
Transformation Services (DTS)
dipakai
untuk
mengekstrak dan
membersihkan data dari tidak konsistensinya
dan tidak kompatibelnya dengan format yang sesuai.
3. Mem-validasi data
Setelah
data
diekstrak
dan
dibersihkan, ini
adalah
latihan
yang
bagus
untuk
menelusuri
model
yang
telah
kita
ciptakan
untuk
memastikan bahwa
semua data yang ada adalah data sekarang dan lengkap.
4. Membuat dan melatih model
Ketika algoritma diterapkan pada
model, struktur telah dibangun. Hal
ini
sangatlah penting pada saat
ini
untuk
melihat data
yang telah dibangun
untuk
memastikan bahwa data tersebut
menyerupai fakta di dalam data sumber. Hal
ini bisa dibuat dengan berbagai cara.
5. Query data
Ketika
model
yang pantas/cocok telah diciptakan dan dibangun data yang
telah dibuat tersedia untuk mendukung keputusan.
Hal ini biasanya
melibatkan penulisan front
end query aplikasi dengan suatu program aplikasi
atau
suatu
program
database
seperti
SQL
Server
melalui
OLE
DB
melalui
data
mining.
|