19
2.3
Data
Mining
Data
mining adalah proses
menemukan kolerasi, pola dan bentuk
terbaru dengan
menggali
sejumlah
besar
data
yang
tersimpan
pada
data
warehouse yang
menggunakan teknologi
penemuan
pola
baik
secara
teknik
statistik
dan
matematis
(Gardner, 2003, St@tserv Data
Mining Page,
Data
mining
merupakan
serangkaian
proses
untuk
menggali
nilai
tambah
dari
suatu kumpulan data berupa pengetahuan yang selama
ini tidak diketahui secara
manual.
Beberapa
teknik
yang
sering
disebut
dalam
literatur
data
mining adalah
clustering,
classification, association
rule
mining,
neural
network,
genetic
algorithm, dan
sebagainya.
Untuk
melakukan data
mining,
harus
dikumpulkan
informasi sebanyak
mungkin
dengan
men-transfer
informasi-informasi tersebut
dari
sekumpulan
kertas
ke
dalam
basisdata
komputer,
atau
dengan
mengorganisasi
ulang
basisdata
yang
telah
ada.
Dan
juga
perlu
dilakukan
restrukturisasi
data-data
yang
beragam
ini
pada
pusat
informasi
yang besar, yaitu data
warehouse. (Connoly, 2002, p1115).
2.3.1
Tahapan Data
Mining
Karena
data
mining
adalah
suatu rangkaian
proses, data
mining
dapat
dibagi menjadi beberapa tahap, yaitu:
a.
Pembersihan data (untuk
membuang data
yang
tidak konsisten dan
noise)
b.
Integrasi data (penggabungan data dari beberapa sumber)
c.
Transformasi
data
(data
dirubah
ke
dalam
bentuk
yang
dapat
di
mining).
|