34
Proses ETL ini terdiri dari 3 tahap,yaitu:
1.
Extraction
Langkah
pertama
dari
proses
ETL adalah
proses
penarikan
data dari
satu
atau
lebih sistem operasional sebagai sumber data (misalnya diambil dari sistem
OLTP). Kebanyakan proyek data warehouse menggabungkan data dari sumber-
sumber yang berbeda. Proses ektraksi
ini merupakan proses penguraian dan
pembersihan data yang diekstrak untuk mendapatkan pola atau struktur data yang
diinginkan.
2.
Transformation
Proses
membersihkan
data
yang
telah
diambil
pada
proses
extract tersebut
dilakukan agar data tersebut sesuai dengan struktur data warehouse.
Hal-hal yang dapat dilakukan dalam tahap transformasi :
a. Hanya
memilih
kolom
tertentu
saja
untuk dimasukkan
ke
dalam data
warehouse.
b. Menterjemahkan
nilai
berupa
kode(misalnya
saja,
database
sumber
menyimpan nilai 1 untuk pria dan 2 untuk wanita tetapi dalam data warehouse
menyimpan M
untuk pria dan F untuk wanita). Proses yang dilakukan tersebut
disebut
automated atau cleansing.
Tidak
ada
pembersihan
manual
selama
proses ETL.
c.
Mengkodekan
nilai-nilai ke dalam bentuk bebas(misalnya
memetakan
male,1, dan Mr ke dalam M).
d.
Melakukan perhitungan nilai-nilai baru(misalnya sale_amount=qty*price).
e.
Menggabungkan data dari berbagai sumber bersama-sama.
|