Langkah pertama pada proses ETL
adalah mengekstrak data dari
sumber-sumber data. Kebanyakan proyek data warehouse
menggabungkan data dari sumber-sumber yang berbeda. Pada
hakekatnya, proses ekstraksi adalah proses penguraian, pembersihan
dari data yang diekstrak untuk mendapatkan struktur atau pola data
yang diharapkan.
Proses extract terdiri dari dua tipe, yaitu :
a.
Static extract : metode pengambilan data pada waktu tertentu untuk
mengisi data warehouse untuk pertama kalinya.
b.
Incremental extract
: metode yang hanya mengambil perubahan
yang terjadi pada data sejak data tersebut diambil terakhir kali nya.
2.
Transform
Merupakan
sebuah
proses untuk
mempersiapkan
atau
membersihkan
data
yang
telah
diambil
pada
proses
ekstraksi
sehingga data
tersebut
dapat
sesuai
dengan
struktur
data
warehouse
atau
data mart.
Pada
tahap
ini,
banyak
jenis
fungsi
transformasi
dibutuhkan
sebelum
data
dapat
dipetakan
dan
disiapkan
untuk
dimasukkan (loading)
ke
dalam
tempat
penyimpanan
data
warehouse.
Fungsi fungsi
ini termasuk
penyeleksian
input,
pemisahan
struktur
input, normalisasi,
dan denormalisasi
dari
struktur
sumber,
aggregasi, konversi,
memperbaiki
nilai
yang
hilang,
dan
konversi
nama
serta alamat.
3.
Load
Fase load merupakan tahapan yang berfungsi untuk memasukkan data
ke dalam target akhir, yang biasanya ke dalam suatu data warehouse.
Jangka waktu proses ini tergantung pada kebutuhan organisasi.
Beberapa data warehouse
dapat setiap minggu menulis keseluruhan
informasi yang ada secara kumulatif, data diubah, sementara data
warehouse yang lain (atau bagian lain dari data warehouse yang sama)
dapat menambahkan data baru dalam suatu bentuk historikal. Waktu
dan jangkauan untuk mengganti atau menambah data tergantung dari
perancangan data warehouse
pada waktu menganalisis keperluan
informasi.
|