|
Langkah pertama pada proses ETL adalah mengekstrak data dari sumber-
sumber data. Kebanyakan proyek data warehouse
menggabungkan data
dari sumber-sumber yang berbeda. Pada hakekatnya, proses ekstraksi
adalah proses penguraian, pembersihan dari data yang diekstrak untuk
mendapatkan struktur atau pola data yang diharapkan.
Transform
Tahapan transformasi menggunakan serangkaian aturan atau fungsi untuk
mengekstrak data dari sumber dan selanjutnya akan dimasukkan ke dalam
data warehouse. Berikut adalah hal-hal yang dapat dilakukan dalam
tahapan transformasi:
Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam data
warehouse.
Menerjemahkan nilai-nilai yang berupa kode (contohnya apabila
database sumber menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk
perempuan, tetapi data warehouse
yang telah ada menyimpan M
untuk laki-laki dan F untuk perempuan, hal
ini disebut dengan
automated data cleansing, tidak ada pembersihan secara manual ynag
ditunjukkan selama proses ETL).
Mengkodekannilai-nilai ke dalam bentuk bebas (contohnya
memetakanMALE,I dan MRke dalam M).
Melakukan perhitungan nilai-nilai baru (contohnya
sale_amount =
qty * unit price).
Menggabungkan data secara bersama-sama dari berbagai sumber.
|