Start Back Next End
  
14
2.3.3
Data Integration
Integrasi data merupakan penggabungan data dari berbagai database
ke dalam satu database
baru. Tidak jarang data yang diperlukan untuk data
mining
tidak hanya berasal dari satu database
tetapi juga berasal
dari
beberapa database atau file teks. Integrasi data dilakukan pada atribut-aribut
yang mengidentifikasikan entitas-entitas yang unik seperti atribut nama, jenis
produk, nomor pelanggan dan lainnya. Integrasi data perlu dilakukan secara
cermat karena kesalahan pada integrasi data bisa menghasilkan hasil yang
menyimpang dan bahkan menyesatkan pengambilan aksi nantinya. Sebagai
contoh bila integrasi data berdasarkan jenis produk ternyata menggabungkan
produk dari kategori yang berbeda maka akan didapatkan korelasi antar
produk yang sebenarnya tidak ada.
2.3.4
Data Reduction
Data Reduction
berguna untuk mendapatkan pengurangan
representasi dari kumpulan data yang jauh lebih kecil di dalam volume tetapi
belum menghasilkan hasil yang sama (atau hampir sama) dari suatu hasil
analisis. 
Teknik dalam Data Reduction:
a)
Strategi dimensionality reduction pengurangan data meliputi
dimensionality reduction, numerosity reduction, dan kompresi
data.
b)
Wavelet Transform: Data ditransformasikan ke jarak relatif antara
obyek pada berbagai tingkat resolusi.
c)
Principal component Analysis
d)
Attribute Subset Reduction 
e)
Regression dan Log linear models
f)
Histogram
g)
Clustering
h)
Sampling
i)
Data cube Agreggation
2.3.5
Data Transformation and Data Discretization
Dalam Data Transformation
dan Data Discretization, data diubah
atau dikonsolidasikan sehingga proses mining
yang dihasilkan mungkin lebih
efisien, dan pola yang ditemukan mungkin lebih mudah untuk dipahami. 
Word to PDF Converter | Word to HTML Converter