BAB 2
LANDASAN TEORI
2.1
Teori Umum
2.1.1
Pengertian Data Warehouse
Menurut Inmon (2005, p389), “A data warehouse is acollection of
integrated, subject oriented databases designed to support the DSS function,
where each unit of data is relevant to some moment in time,” yang mengandung
pengertian bahwa data warehouse merupakan kumpulan database yang bersifat
berorientasisubyek dan terintegrasi yang dirancang untuk mendukung sistem
pengambilan keputusan (DSS), dimana setiap data berhubungan dengan suatu
kejadian pada suatu waktu.
Menurut Wikramanayake dan Goonetillake (2007, p25), data sekarang
dapat disimpan dalam berbagai jenis database. Salah satu jenis database
arsitektur yang baru-baru ini muncul adalah data warehouse, yang merupakan
repositori dari beberapa sumber data heterogen, diatur dalam skema terpadu di
satu tempat dalam rangka untuk memfasilitasi manajemen pengambilan
keputusan. Teknologi data warehouse meliputi pembersihan data, integrasi data,
dan OLAP (Online Analytical Processing).
Menurut Sahama dan Croll (2007, p228), data warehouse adalah struktur
data yang dioptimalisasikan untuk distribusi, penyimpanan masal dan
pemrosesan query
secara kompleks. Dia mengumpulkan dan menyimpan
  
sekumpulan data historical yang terintegrasi dari beberapa sistem operasional
danmemasukkannya ke satu atau lebih datamart(s), dimana struktur data
dioptimalisasikan agar dapat diakses dengan cepat. Dan juga menyediakan akses
kepada pengguna akhir untuk mendukung dalam melihat informasi perusahaan. 
Menurut Zaker, Amnuaisuk, dan
Haw (2009,
p39), data warehouse
adalah dasar bagi DSS(Decision Support Systems)
dengan kumpulan besar
informasi yang dapat diakses melalui aplikasi OLAP
(Online Analytical
Processing). Besarnya database yang menyimpan data dan historis yang berasal
dari beberapa sumber data eksternal. 
Data warehouse adalah database
besar yang berisi data historis dalam
bentuk kubus (agregat) dan pembuat keputusan menggunakan data ini untuk
membuat keputusan di masa depan. Ullah, Zeeshan, dan Kundi (2011, p43).
Menurut Connolly, Begg, dan Holowczak (2008, p444), data warehouse
adalah sistem database
yang dirancang untuk mendukung proses pengambilan
keputusan dengan menampilkan view
yang terintegrasi akan data perusahaan
yang disalin dari berbagai sumber data.
Menurut Laudon
dan Laudon (2010,
p222), data warehouse
adalah
database yang menyimpan data saat ini dan data historis yang dibutuhkan oleh
pengambil keputusan diseluruh bagian perusahaan. Data berasal dari sistem
transaksi operasional utama, seperti sistem untuk penjualan, rekening nasabah,
dan manufaktur, dan dapat termasuk data dari transaksi website. Data warehouse
mengkonsolidasi dan menstandarisasi informasi dari berbagai
  
databaseoperasional sehingga informasi tersebut dapat digunakan diseluruh
bagian perusahaan untuk analisis manajemen dan pengambilan keputusan.
Data warehouse merupakan suatu media yang digunakan untuk
menyimpan data historis dari perusahaan berdasarkan periode atau jangka waktu
tertentu yang telah melalui tahap penyaringan dan diintegrasikan untuk
digunakan sebagai sumber analisis pada proses pengambilan keputusan yang
dilakukan oleh pihak pimpinan perusahaan. (Oktavia, 2011)
Perbedaan antara operasional data dan data warehouse :
Data Operasional
Data Warehouse
-Berorientasi aplikasi
-Data detil
-Data dapat di-update
-Disajikan untuk komunitas operasional
-Sesuai dengan SDLC
-Jumlah data yang diproses kecil
-No redundancy (Normalisasi)
-Struktur yang tetap
-Mendukung operasional sehari-hari
-Pengaksesan data besar
-Berorientasi subjek
-Ringkas dan telah disaring
-Tidak dapat di-update
-Disajikan untuk komunitas manajerial 
-Siklus hidup yang lengkap
-Jumlah data yang diproses besar
-Redundancy (denormalisasi)
-Struktur yang fleksibel
-Mendukung kebutuhan manajerial
-Pengaksesan data kecil/sedang
Tabel 2.1 : Perbandingan Umum Data Operasional dan Data Warehouse
(Inmon, 2005, p15)
  
2.1.2
Keuntungan Data Warehouse
Menurut Connolly dan Begg (2005, p1152), data warehouse yang telah
diimplementasikan dengan baik dapat memberikan keuntungan yang besar bagi
organisasi, yaitu :
Potensi nilai kembali yang besar pada investasi
Sebuah organisasi harus mengeluarkan uang dan sumber daya
dalam jumlah yang cukup besar untuk memastikan kalau data
warehouse
telah diimplementasikan dengan baik, biaya yang
dikeluarkan tergantung dari solusi teknikal yang diinginkan. Akan
tetapi, setelah data warehouse
digunakan, maka kemungkinan
didapatkannya ROI (Return on Investment) relatif lebih besar.
Keuntungan kompetitif
Keuntungan kompetitif didapatkan apabila pengambil keputusan
dapat mengakses data yang dapat mengungkapkan informasi yang
sebelumnya tidak diketahui, tidak tersedia, misalnya informasi
mengenai konsumen, kebutuhan, dan permintaan yang tepat dan akurat.
Meningkatkan produktivitas para pengambil keputusan perusahaan
Data warehouse meningkatkan produktivitas para pengambil
keputusan perusahaan dengan menciptakan sebuah database
yang
terintegrasi secara konsisten, berorientasi pada subyek, dan data historis.
Data warehouse mengintegrasikan data dari beberapa sistem yang tidak
compatible ke dalam bentuk informasi yang menyediakan satu
  
pandangan yang konsisten dari organisasi. Dengan mengubah data
menjadi informasi yang berguna, maka seorang manajer bisnis dapat
membuat suat analisis yang lebih baik, akurat, dan konsisten.
2.1.3
Fungsi Data Warehouse
Data warehouse mempunyai kegunaan sebagai berikut:
a. Pembuatan Laporan
Proses pembuatan laporan ini melibatkan query
sumber data
dengan model logika yang berbeda-beda
untuk menghasilkan sebuah
laporan yang bersifat human-readable.Contohnya, pengguna komputer
yang melakukanquery pada database
bagian Human Resources
danCapital Improvements
untuk menunjukkan tentang bagaimana
efisiensi ruang yang digunakan di seluruh perusahaan. (Moeller, 2007)
b. OLAP
OLAP adalah operasi basis data (database) untuk mendapatkan
dalam bentuk kesimpulan dengan menggunakan aggregasi sebagai
mekanisme utama. Mekanisme berupa analisis dan pengambilan
keputusan. (Subhan, 2009)
c. Proses Informasi Eksekutif
Data warehouse digunakan untuk mencapai ringkasan informasi
yang penting dengan tujuan membuat keputusan bisnis, tanpa harus
menjelajahi keseluruhan data. Dengan menggunakan datawarehouse,
  
segala laporan telah diringkas dan dapat pula diketahui rinciannya
secara lengkap, sehingga mempermudah proses pengambilan keputusan.
Informasi dan data pada laporan data warehouse menjadi target
informatif bagi user, yang dalam hal ini adalah pihak eksekutif.
(Chandra, 2010)
2.1.4
Karakteristik Data Warehouse
Menurut Inmon (2005, p29-32), karakteristik dari data warehouse yaitu
subject oriented, integrated, nonvolatile dan time variant.
Keempat karakteristik ini saling terkait satu sama lain, sehingga ke
semuanya harus diimplementasikan agar suatu data warehouse
bisa secara
efektif memiliki data yang mendukung pengambilan keputusan.
1.
Subject Oriented
Artinya warehouse dikelompokan berdasarkan area subyek utama
suatu organisasi atau perubahan (seperti pelanggan, produk, dan
penjualan) dibandingkan terhadap area aplikasi yang dijalankan
(contohnya penagihan pelanggan, pengendalian stok, dan penjualan
produk). Ini ditunjukan dalam kebutuhan untuk menyimpan data
pendukung keputusan dibandingkan data berorientasi aplikasi.
  
Gambar 2.1 Aspek Subject Orientation pada Data Warehouse
(Sumber : Inmon, 2005, p30)
2.
Integrated
Data diambil dari banyak sumber berbeda kemudian dimasukkan
ke dalam data warehouse. Selama data diambil, data tersebut diubah,
dilakukan format kembali, diurutkan, diringkas, dan seterusnya.
Hasilnya, data terletak dalam data warehouse
yang memiliki
pandangan terpadu dan terintegrasi.
Untuk menciptakan subyek area yang berguna, sumber data yang
berasal dari beberapa sistem yang berbeda, terlebih dahulu harus
terintegrasi sebelum digabungkan ke dalam sebuah data warehouse.
Sebagai contoh, terdapat 4 aplikasi yang menyimpan kode jenis
kelamin dalam database secara berbeda. Aplikasi A menyimpan kode
jenis kelamin dalam bentuk ‘m’ untuk laki-laki dan ‘f’ untuk
  
perempuan, sedangkan aplikasi B dalam bentuk ‘1’ dan ‘0’,
sedangkan aplikasi C dalam bentuk ‘x’ dan ‘y’, aplikasi D dalam
bentuk ‘male’ dan ‘female’. Melalui proses integrasi dihasilkan kode
jenis kelamin yang seragam untuk data warehouse yaitu ‘m’ dan ‘f’.
untuk lebih jelasnya dapat dilihat pada gambar berikut ini:
Gambar 2.2 Aspek Integrated dari Data Warehouse
(Sumber : Inmon, 2005, p31)
3.
Nonvolatile
Data yang ada didalam data warehouse tidak diperbarui setiap
kali ada data baru dimasukan dari lingkungan operasional melainkan
direkam dalam sebuah snapshot. Snapshot akan terus dibuat saat ada
perubahan-perubahan yang
terjadi di dalam data warehouse
yang
tersimpan histori datanya.
  
4.
Time variant
Karakteristik ini menyatakan bahwa setiap unit atau bagian data
dalam data warehouse bersifat akurat dalam suatu waktu tertentu.
Record yang ada dalam data warehouse selalu mempunyai sebuah
bentuk penandaan waktu yang menunjukan saat dimana record
tersebut masih akurat baik dalam bentuk timestamp
untuk sebuah
record tunggal atau timestamp untuk seluruh database.
2.1.5
Struktur Data Warehouse
Berdasarkan
pendapat
Inmon (2005, p33-34), struktur data warehouse
menunjukan detail level yang berbeda dalam datawarehouse.
Terdapat older
level of detail, current level of detail, level of lightly summarized data (level data
mart), dan level of highly summarized data. Data mengalir ke dalam
datawarehouse dari lingkungan operasional. Biasanya transformasi penting dari
data terjadi pada jalur dari level data operasional ke level data warehouse.
Sekali data disimpan, data melalui current detail ke older detail. Selama
data diringkas, data melalui current detail ke lightly summarized data, kemudian
dari lightly summarized data ke highly summarized data.
1.
Current Detail Data
Current detail data
adalah data detail yang sedang aktif saat ini,
mencerminkan keadaan yang sedang berjalan saat ini dan merupakan tingkat
terendah dalam data warehouse. Current detail data
ini biasanya
  
memerlukan media penyimpanan data yang cukup besar. Alasan perlu
diperhatikanya current detail data adalah sebagai berikut :
1.
Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian
utama,
2.
Hampir selalu disimpan di media penyimpanan karena cepat diakses
tetapi mahal dan kompleks dalam pengaturannya,
3.
Dapat digunakan dalam membuat rekapitulasi sehingga current detail
data harus akurat,
4.
Jumlahnya sangat banyak dan disimpan pada tingkat penyimpanan
terendah.
2.
Old Detail Data
Old detail data adalah data historis dapat berupa hasil back-up yang dapat
disimpan dalam media penyimpanan yang terpisah dan dapat diakses kembali
pada saat tertentu. Data ini jarang diakses sehingga disimpan dalam media
penyimpanan alternatif. Seperti tape atau disk.
Data ini biasa memiliki tingkat frekuensi akses yang rendah. Penyusunan
file atau directory dari data ini disusun berdasarkan umur dari data yang
bertujuan mempermudah untuk pencarian atau pengaksesan kembali.
3. Lightly Summarized Data
Data ini merupakan ringkasan atau rangkuman dari current detail data.
Data ini dirangkum berdasarkan periode atau dimensi lainnya sesuai dengan
kebutuhan. Ringkasan dari current detail data belum bersifat total summary.
  
Data-data ini memiliki detil tingkatan yang lebih tinggi dari current detail
data
dan mendukung kebutuhan warehouse
pada tingkat departemen.
Tingkatan data ini disebut juga dengan datamart. Akses terhadap data jenis ini
banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
4. Highly summarized data
Data ini merupakan tingkat lanjutan dari Lightly summarized data, yang
merupakan hasil ringkasan yang bersifat totalitas, dapat diakses misalnya
untuk melakukan analisis perbandingan data berdasarkan urutan waktu
tertentu dan analisis menggunakan data multi dimensi.
5. Metadata
Metadata merupakan data yang menjelaskan tentang data dan merupakan
suatu bentuk jaringan yang sangat penting bagi penggunaan data di
warehouse. Metadata
dibuat untuk menjawab kebutuhan dari suatu fungsi
tertentu karena setiap departemen biasanya menggunakan struktur data yang
spesifik meskipun sumber datanya sama. Peranan metadata yaitu :
1.
Sebagai directory untuk membantu pengguna data warehouse
memanfaatkan isi data dan mengetahui lokasi data dalam data warehouse.
2.
Sebagai tumpuan untuk menempatkan (mapping) data pada saat data
ditransformasikan dari OLTP kedalam lingkungan data warehouse.
3.
Sebagai panduan untuk menghasilkan rangkuman dari current detailed
data menjadi lightly summarized data dan dari lightly summarized menjadi
highly summarized data.
  
2.1.6
Metode Perancangan Data Warehouse
Menurut Inmon, perancangan data warehouse terdiri atas :
Restrukturisasi 
Suatu proses pengambilan hasil analisis terhadap kegiatan operasional dan
menemukan kebutuhan informasi yang dibutuhkan oleh perusahaan, setelah
itu pada perancangan resturkturisasi ini akan memberikan hasil berupa
laporan rolling summary data dari ruang lingkup perusahaan.
Pengindeksan 
Mengidentifikasi dan menjabarkan proses bisnis sesuai dengan ruang
lingkup yang melandasi kebutuhan informasi dan permasalahan pada suatu
perusahaan.
Pemindaian berurutan, jika diperlukan
Gambar 2.3: Sequential Scanning(Inmon, 2000, p16)
Proses pengambilan data berdasarkan sequence
yang telah ditentukan
padadatabase. Data terpisahkan antara periode 1 dan 2 yang direkam pada
  
sequential scan/match
dan disimpan pada delta file.Setelah itu baru data
akan dimasukan ke dalam data warehouse.
Reorganisasi 
Proses yang digunakan untuk melakukan cleansing
pada database
dengan
melihat data-data lama yang jarang digunakan untuk dipindahkan dan
disimpan, hal ini bertujuan untuk mempercepat akses database
karena
record lama yang tidak digunakan dapat memperlambat kecepatan akses.
Recovery
Proses recovery akan dilakukan apabila terjadi crash pada data warehouse
untuk mengembalikan database menjadi seperti semula yang sudah di back-
up sebelumnya.
Monitoring
Melakukan monitoring
terhadap proses
data warehouse
agar tidak terjadi
kesalahan pada saat pengolahan atau ketika meng-update data.
2.1.7
Anatomi Data Warehouse
2.1.7.1
Data Warehouse Fungsional
Tiap data warehouse fungsional mencakup sebuah grup tersendiri
yang berpisah seperti divisi, area fungsional, unit geografis, atau grup
pemasaran produk. Data warehouse fungsional berfokus pada
kebutuhan dari sebuah fungsi bisnis, misalkan departemen, divisi dan
sebagainya.
  
Gambar 2.4Bentuk Data Warehouse Fungsional (Fairuzelsaid,
2009)
2.1.7.2
Data Warehouse Terpusat
Berdasarkan Inmon (2005, p193), sebagian besar organisasi
membangun dan memelihara lingkungan data warehouse
terpusat
tunggal. Pengaturan ini dilakukan karena memiliki beberapa alasan
yaitu:
Data dalam data warehouse terintegrasi antar perusahaan dan
gambaran terintegrasi digunakan hanya pada kantor pusat,
Perusahaan mengoperasikan sebuah model bisnis terpusat,
Volume data dalam data warehouse seperti sebuah penyimpanan
tunggal yang terpusat,
Sekalipun data dapat diintegrasikan, jika data diedarkan melalui
banyak local sites, maka akan memperulit pengaksesan.
  
Gambar 2.5Bentuk Data Warehouse Terpusat (Fairuzelsaid, 2009)
2.1.7.3
Data Warehouse Terdistribusi
Berdasarkan Inmon (2005, p193), ada tiga tipe data warehouse
terdistribusi:
Bisnis terdistribusi secara geografis atau dibedakan menurut lini
produk. Oleh karena itu,
disebut datawarehouselocal
dan data
warehouse global. Datawarehouselocal mewakili data dan proses
di lokasi yang terpencil dan datawarehouse
global mewakili
bagian dari bisnis yang diintegrasikan melalui keseluruhan bisnis,
Lingkungan data warehouse
akan memegang banyak data dan
volume data akan didistribusikan melalui beberapa processor.
Secara logical hanya ada satu data warehouse, tetapi secara fisikal
terdapat banyak data warehouse yang semuanya mempunyai
hubungan yang dekat tetapi diletakkan pada processor yang
  
terpisah. Konfigurasi ini dapat disebut dengan teknologi data
warehouse terdistribusi,
Lingkungan data warehouse
tumbuh dalam sebuah kebiasaan
yang tidak terorganisasi. Data warehouse
yang pertama muncul,
kemudian diikuti yang lainnya. Kurangnya
koordinasi dari
pertumbuhan data warehouse
yang berbeda biasanya
menghasilkan sebuah perbedaan secara politik dan organisasi.
Kasus ini dapat disebut dengan data warehouse terdistribusi yang
secara bebas berkembang.
Gambar  2.6Bentuk Data Warehouse Terdistribusi
(Fairuzelsaid, 2009)
2.1.7.4
Arsitektur Data Warehouse
Menurut Connolly dan Begg (2010, p1203-1206), arsitektur data
warehouse terdiri atas :
1.
Operational Data
Sumber data untuk data warehouse disediakan dari :
  
Mainframe data operasional yang menangani generasi pertama secara
hirarkis dan database jaringan. Diperkirakan bahwa mayoritas data
operasional perusahaan disimpan di sistem ini.
Data masing-masing departemen yang disimpan dalam sistem file
kepemilikan seperti VSAM, RMS, dan relasional DBMS
seperti
Informix dan Oracle.
Data internal yang tersimpan di dalam workstation dan server
pribadi.
Sistem eksternal seperti internet, database komersial, atau database
yang berhubungan dengan supplier dan customer.
2.
Operational Data Store (ODS)
Suatu Operational Data Store (ODS) adalah suatu media penyimpanan
dan pengintegrasian data operasional yang digunakan untuk analisis. ODS
menyediakan data dengan cara yang sama seperti data warehouse, tetapi
sesungguhnya bertindak secara sederhana sebagai tempat penampungan
sementara sebelum dan dipindahkan ke warehouse.
ODS diciptakan ketika sistem operasional ditemukan tidak mampu untuk
untuk mencapai keberhasilan sistem pelaporan.
ODSmenyediakan manfaat
yang berguna dari suatu relational database dalam mengambil keputusan
yang mendukung fungsi data warehouse.
Membangun ODS dapat membantu dalam pembuatan data warehouse
sebab suatu ODS dapat menyediakan data yang telah diekstrak dan di-
  
cleansing dari sistem sumber. Ini berarti bahwa proses integrasi dan
restrukturasi data untuk data warehouse menjadi lebih sederhana.
3.
Load Manager
Load manager melaksanakan semua operasi yang berhubungan dengan
pengambilan dan load data ke dalam data warehouse. Data diekstrak secara
langsung dari sumber data atau dari penyimpanan data operasional. Operasi
yang dilakukan oleh load manager dapat meliputi perubahan bentuk yang
sederhana untuk mempersiapkan data tersebut agar dapat dimasukkan ke
dalam warehouse.
4.
Warehouse Manager
Warehouse manager melaksanakan semua operasi yang berhubungan
dengan manajemen data. Operasi yang dilakukan oleh warehouse manager
meliputi :
Analisis data untuk memastikan konsistensi.
Transformasi dan penggabungan sumber data dari tempat
penyimpanan data sementara ke dalam tabel-tabel data warehouse.
Pembuatan index dan view pada tabel-tabel.
Melakukan agregasi (jika diperlukan).
Melakukan back-up dan mengarsip data.
Dalam beberapa hal, warehouse manager juga menghasilkan profil query
untuk menentukan kesesuaian index dan agregasi. Suatu profil query dapat
dihasilkan baik untuk masing-masing user, kelompok user, atau data
  
warehouse dan didasarkan pada informasi yang menggunakan karakteristik
query seperti frekuensi, target tabel, dan ukuran dari hasil yang telah
ditetapkan.
5.
Query Manager
Query manager melaksanakan semua operasi yang berhubungan dengan
manajemen user query. Komponen ini secara khusus dibangun
menggunakan peralatan akses data end-user, peralatan pengontrol data
warehouse, fasilitas database, dan pembangunan program. Kompleksitas
query manager ditentukan oleh fasilitas yang disajikan melalui peralatan
akses para end-user database.
Operasi yang dilakukan komponen ini meliputi pengarahan query pada
tabel yang sesuai dan penjadwalan pelaksanaan query. Terkadang query
manager juga menghasilkan profil query yang mengijinkan warehouse
manager menentukan kesesuaian indeks dan agregasi.
6.
Detailed Data
Area ini menyimpan semua data yang terperinci di dalam skema
database. Dalam banyak kasus data yang terperinci tidaklah disimpan secara
online tetapi dapat disediakan melalui agregasi data pada tingkatan detil
berikutnya. Bagaimanapun, secara regular, data yang terperinci ditambahkan
untuk melengkapi data yang dibutuhkan.
7.
Lightly Summarized Data
  
Area ini menyimpan semua data lightly dan highlysummarized
(teragregasi) yang dihasilkan oleh warehouse manager. Area ini adalah
tempat penampungan sementara sebelum dilakukan perubahan secara
berkelanjutan merespon perubahan profil query.
Tujuan informasi ringkasan adalah untuk mempercepat pencapaian query.
Meskipun biaya operasi akan meningkat sehubungan dengan proses
peringkasan data tersebut, namun ini merupakan offset untuk melaksanakan
operasi ringkasan (seperti penyortiran dan pengelompokkan) secara terus
menerus untuk menjawab user query. Data ringkasan diperbaharui secara
terus-menerus ketika ada data baru yang terisi ke dalam warehouse.
8.
Archive or Backup Data
Area ini menyimpan semua detil dan ringkasan data untuk kepentingan
archiving dan backup. Walaupun ringkasan data dibangun dari detil data,
akan memungkinkan untuk membuat cadangan ringkasan data secara online
jika data ini ditunjukkan melebihi penyimpanan waktu untuk detil data. Data
ditransfer ke gudang atau penyimpanan seperti magnetic tape dan optical
disk.
9.
Metadata
Area ini menyimpan semua definisi metadata yang digunakan oleh semua
proses di dalam warehouse. Metadata
digunakan untuk berbagai tujuan
termasuk :
  
Proses extract dan load
metadata digunakan untuk memetakan
sumber data ke dalam pandangan umum sebagai warehouse.
Proses manajemen warehouse
metadata digunakan untuk
mengotomatisasi pembuatan tabel ringkasan.
Sebagai bagian proses manajemen query – metadata digunakan untuk
menghubungkan suatu query dengan sumber data yang tepat.
Struktur metadata berbeda untuk masing-masing proses, sebab memiliki
tujuan yang berbeda. Ini berarti bahwa berbagai salinan metadata yang
menggambarkan data item yang sama dipegang di dalam data warehouse.
Manajemen metadata
di dalam data warehouse adalah suatu tugas yang
sangat kompleks yang tidak boleh diremehkan.
10. End-User Access Tools
Tujuan prinsip data warehousing adalah untuk menyediakan informasi
kepada para user bisnis untuk pengambilan keputusan. Para user berinteraksi
dengan warehouse menggunakan peralatan akses end-user.
Menurut Connoly dan Begg (2010, p1206-1207) End-User tools dibagi
menjadi 4 grup :
Sebagai alat untuk laporan dan query
Menghasilkan program laporan dan laporan tertulis, sedangkan query
tools didesain untuk menerima SQL atau menghasilkan pernyataan
SQL untuk melakukan query data di dalam data warehouse.
  
Perangkat pengembangan aplikasi
Keperluan end-user dari laporan dan alat query terkadang tidak
cukup karena analisis yang diperlukan tidak dapat ditampilkan atau
karena interaksi pengguna memerlukan keahlian yang tinggi dari
user. Beberapa dari alat pengembangan aplikasi ini terintegrasi
dengan alat OLAP yang terkenal, dan dapat mengakses semua sistem
database utama, termasuk Oracle, Sybase, dan Informix.
Perangkat Online Analytical Processing (OLAP)
Perangkat OLAP berdasarkan dari konsep multidimensional database
dan mengijinkan pengguna untuk menganalisa dan menggunakan
kompleks multidimensional views. Aplikasi bisnis khusus ini
digunakan untuk menilai keefektifan marketing, perkiraan sales
produk, dan rencana kapasitas.
Perangkat Data Mining
Data mining adalah proses menemukan korelasi baru, pola, arah yang
baru dengan menganalisa sejumlah besar menggunakan statistik,
matematika, dan teknik Artificial Intelligence (AI).
  
Gambar 2.7Arsitektur Data Warehouse
Sumber : Connolly dan Begg (2010, p1204)
2.1.8
External Data dan Data Warehouse
Menurut Inmon (2005, pp257-258), kebanyakan organisasi
membangun data warehouse mereka pada data yang berasal dari sistem
yang ada (yakni, diatas data internal ke perusahaan). Dihampir setiap
kasus, data ini dapat disebut data internal, terstruktur. Data internal
berasal dari perusahaan dan telah dibentuk ke dalam format yang teratur.
Satu keseluruhan besar atas data lain yang sah digunakan untuk sebuah
perusahaan yang tidak dihasilkan dari sistem perusahaan sendiri disebut
data eksternal dan biasanya memiliki perusahaan dalam format tidak
terduga. Data warehouse adalah tempat yang ideal  untuk menyimpan
data eksternal.
Menurut Inmon (2005, p268), data warehouse mampu menangani
lebih dari data internal, terstruktur. Ada banyak informasi yang relevan
  
untuk menjalankan perusahaan yang berasal dari sumber-sumber di luar
perusahaan.
2.1.9
Skema Data Warehouse
2.1.9.1 Tabel Fakta
Menurut Inmon (2005, p497), tabel fakta adalah tabel pusat dari
skema bintang dimana data yang sering muncul akan ditempatkan disini.
Disebut juga tabel utama (major table), merupakan inti dari skema bintang
dan berisi data aktual yang akan dianalisis (data kuantitatif dan transaksi). 
Tabel fakta adalah tabel yang umumnya mengandung angka dan data
historis dimana key (kunci) yang dihasilkan sangat unik karena key
nya
merupakan kumpulan foreign key dan primary key yang ada pada masing-
masing tabel dimensi yang berhubungan atau merupakan tabel terpusat dari
skema bintang. 
Tabel fakta menyimpan tipe-tipe measure
yang berbeda, seperti
measure, yang secara langsung terhubung dengan tabel dimensi dan measure
yang tidak berhubungan dengan tabel dimensi. 
Sedangkan menurut Conolly dan Begg (2010, p1227), ”Every
dimensional model (DM) is composed of one table with a composite primary
key,
called the fact table”, yang berarti tabel fakta adalah satu tabel pada
dimensional model (DM) yang isinya composite primary key (PK). Jadi PK
pada tabel fakta merupakan beberapa Foreign Key (FK).
2.1.9.2 Tabel Dimensi
  
Menurut Inmon (2005, p495), tabel dimensi adalah tempat dimana
data-data yang tidak berhubungan yang berelasi dengan tabel fakta
ditempatkan di dalam tabel dimensional. Bisa disebut juga tabel kecil (minor
table), biasanya lebih kecil dan memegang data deskriptif yang
mencerminkan dimensi suatu bisnis. 
Sedangkan menurut Connolly dan Begg (2010, p1227), “ a set of
smaller tables called dimension tables”, yang berarti tabel dimensi adalah
sekumpulan tabel-tabel yang lebih kecil dari tabel fakta pada
dimensionalmodel
(DM). Setiap tabel dimensi mempunyai non-composite
PK. 
Jadi, kesimpulan nya tabel dimensi adalah tabel yang berisikan
kategori dengan ringkasan data detil yang dapat dilaporkan seperti laporan
keuntungan pada tabel fakta dapat dilaporkan sebagai dimensi waktu (yang
berupa per bulan, per kuartal, dan per tahun).
2.1.9.3 Skema Bintang (Star Schema)
Pengertian Skema Bintang (Star Schema)
Menurut Connolly dan Begg (2010, p1227), skema bintang (star
schema)
adalah struktur logikal yang mempunyai sebuah tabel fakta
berisi data faktual yang ditempatkan di
tengah, dikelilingi oleh tabel
dimensi berisi data referensi (yang dapat didenormalisasi).
  
Gambar 2.8Skema Bintang (Star Schema)
(Sumber : Connolly dan Begg, 2010, p1228)
Keuntungan dan kerugian Skema Bintang (Star Schema)
Keuntungan :
Mudah dimengerti oleh para pengguna.  
Lebih mudah untuk melakukan drill down data sehingga membuat
proses navigasi lebih optimal.
Proses query yang lebih mudah. 
Performa query yang lebih baik. 
Kerugian :
Membutuhkan space yang cukup besar pada database
Butuh effort
untuk melakukan maintenance data karena
strukturnya tidak ternormalisasi.
  
2.1.9.4 Skema Bola Salju (Snowflake Schema)
Pengertian Skema Bola Salju(Snowflake Schema)
Menurut Connolly dan Begg (2010, p1229), skema bola salju
(snowflake schema) adalah variasi lain dari skema bintang dimana tabel
dimensi tidak berisi data yang denormalized. Suatu tabel dimensi dapat
memiliki tabel dimensi lainnya.
Gambar 2.9Skema Bola Salju (Snowflake Schema)
(Sumber : Connolly dan Begg, 2010, p1229)
Keuntungan dan kerugian Skema Snowflake (Snowflake Schema)
Keuntungan : 
Menghemat space pada database.
Struktur yang ternormalisasi lebih mudah untuk di-update dan di-
maintain karena referential integrity terjamin. 
  
Kerugian :
Skema sangat kompleks dan susah dimengerti oleh para pengguna. 
Kemampuan untuk melakukan drill down informasi menjadi sulit,
karena jumlah tabelnya yang makin banyak.
Performasi
query
menurun dikarenakan banyaknya tambahan
operasi join table.
2.1.10
Data Warehouse Data Flows
Menurut Conolly dan Begg (2005, p1162), Data Warehouse
fokus pada
manajemen lima arus data primer, yaitu:
1.
Inflow adalah proses yang berhubungan dengan pengekstrakan (extraction),
pembersihan (cleaning), dan pemuatan (loading) data dari sumber data ke
dalam data warehouse.
2.
Upflow adalah proses yang berhubungan dengan penambahan nilai ke dalam
data di dalam data warehouse melalui peringkasan, pemadatan, dan
pendistribusian data.
3.
Downflow adalah proses mengarsip dan membuat backup data dalam data
warehouse.
4.
Outflow adalah proses membuat data agar tersedia bagi end-user.
5.
Metaflow adalah proses yang berhubungan dengan manajemen metadata.
  
2.1.11
Istilah dalam Data Warehouse
Beberapa istilah-istilah yang berhubungan dengan data warehouse  antara
lain:
1.
Decision Support System (DSS)
Menurut O’Brien (2005, p448), DSS
atau sistem pendukung keputusan
adalah sistem informasi berbasis komputer yang menyediakan dukungan
informasi yang interaktif bagi manajer dan praktisi bisnis selama proses
pengambilan keputusan.
Sistem pendukung keputusan menggunakan model analisis, database
khusus, penilaian dan pandangan pembuatan keputusan, dan proses
pemodelan berbasis komputer yang interaktif untuk mendukung pembuatan
keputusan bisnis yang semi terstruktur dan tak terstruktur.
2.
Datamart
Datamart menurut Inmon (2005, p389) adalah struktur data yang terbagi-
bagi yang diperoleh dari data warehouse
dimana data tersebut telah
didenormalisasi berdasarkan kebutuhan informasi manajemen.
Menurut McLeod dan Schell (2004, p195), berpendapat bahwa datamart
adalah database
yang berisi data yang hanya menjelaskan segmen dari
operasi perusahaan.
Menurut Connolly dan Begg (2010, p1214), datamart adalah serangkaian
data yang mendukung kebutuhan dari departemen tertentu atau fungsi bisnis.
  
Jadi datamart
merupakan serangkaian data yang hanya menjelaskan
segmen dari operasi perusahaan yang nantinya akan menjadi data warehouse.
3.
Online Transaction Processing (OLTP)
Menurut Inmon (2005, p500), “the high-performance transaction
processing, the high-performance transaction processing environment”.
Yang berarti lingkungan dimana terjadi proses transaksi dengan performa
yang tinggi. Pada OLTP, setiap transaksi yang masuk ke dalamsistem harus
dapat diakses.
Berdasarkan penjelasan tersebut maka dapat diambil simpulan bahwa
OLTP
merupakan suatu jenis sistem yang menangani transaksi dengan
performa tinggi yang dibutuhkan untuk menangani kegiatan operasional
sehari-hari dalam suatu organisasi.
4.
Online Analytical Processing (OLAP)
Menurut Connolly dan Begg (2010, p1250), OLAP (Online Analytical
Processing)
adalah sintesis, analisis, dan konsolidasi dinamis dari sejumlah
besar multidimensional data. 
Sedangkan menurut Hoffer, Prescott, dan McFadden. (2005, p480),
OLAP
adalah penggunaan sekumpulan alat grafikal yang menyediakan
kepada pengguna sebuah tampilan multidimensional dari data pengguna dan
memampukan pengguna untuk menganalisa dan menggunakan teknik
penyajian yang sederhana. 
  
Jadi, OLAP
adalah kategori teknologi software
yang dapat
memungkinkan penganalisa, manajer, dan eksekutif untuk melihat data yang
ada dengan akses yang cepat, konsisten dan interaktif sehinggan dapat
melihat informasi yang sudah ditransformasi dari data mentah menjadi
dimensi keadaan nyata yang dapat dimengerti dengan mudah oleh user.
5.
Extract, Transform, Load (ETL)
Menurut Inmon (2005, p497) Extract, Transform, Load (ETL) adalah
proses melakukan pencarian data, mengintegrasikan, dan menempatkan data
ke dalam sebuah data warehouse. Proses-proses dalam data warehouse yang
meliputi:
1.
Mengekstrak data dari sumber-sumber eksternal,
2.
Mentransformasikan data ke bentuk yang sesuai dengan keperluan bisnis,
3.
Memasukkan data ke target akhir, yaitu data warehouse,
ETL
merupakan proses yang sangat penting, dengan ETL
data dapat
dimasukkan ke dalam data warehouse. ETL
juga dapat digunakan untuk
mengintegrasikan data dengan sistem yang sudah ada sebelumnya. Tujuan
ETL
adalah mengumpulkan, menyaring, mengolah, dan menggabungkan
data-data yang relevan dari berbagai sumber untuk disimpan ke dalam data
warehouse. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi
kriteria data warehouse seperti data historis, terpadu, terangkum, statis, dan
memiliki struktur yang dirancang untuk keperluan proses analisis.
Extract
  
Langkah pertama pada proses ETL adalah mengekstrak data dari sumber-
sumber data. Kebanyakan proyek data warehouse
menggabungkan data
dari sumber-sumber yang berbeda. Pada hakekatnya, proses ekstraksi
adalah proses penguraian, pembersihan dari data yang diekstrak untuk
mendapatkan struktur atau pola data yang diharapkan.
Transform
Tahapan transformasi menggunakan serangkaian aturan atau fungsi untuk
mengekstrak data dari sumber dan selanjutnya akan dimasukkan ke dalam
data warehouse. Berikut adalah hal-hal yang dapat dilakukan dalam
tahapan transformasi:
Hanya memilih kolom tertentu saja untuk dimasukkan ke dalam data
warehouse.
Menerjemahkan nilai-nilai yang berupa kode (contohnya apabila
database sumber menyimpan nilai 1 untuk laki-laki dan nilai 2 untuk
perempuan, tetapi data warehouse
yang telah ada menyimpan M
untuk laki-laki dan F untuk perempuan, hal
ini disebut dengan
automated data cleansing, tidak ada pembersihan secara manual ynag
ditunjukkan selama proses ETL).
Mengkodekannilai-nilai ke dalam bentuk bebas (contohnya
memetakan“MALE”,”I” dan “MR”ke dalam M).
Melakukan perhitungan nilai-nilai baru (contohnya
sale_amount =
qty * unit price).
Menggabungkan data secara bersama-sama dari berbagai sumber.
  
Membuat ringkasan dari sekumpulan baris data (contohnya total
penjualan untuk setiap toko atau setiap bagian).
Load
Fase load merupakan tahapan yang berfungsi untuk memasukkan data ke
dalam target akhir, yang biasanya ke dalam suatu data warehouse. Jangka
waktu proses ini tergantung pada kebutuhan organisasi. Beberapa data
warehouse dapat setiap minggu menulis keseluruhan informasi yang ada
secara kumulatif, data diubah, sementara data warehouse yang lain (atau
bagian lain dari data warehouse
yang sama) dapat menambahkan data
baru dalam suatu bentuk historikal. Waktu dan jangkauan untuk
mengganti atau menambah data tergantung dari perancangan data
warehouse pada waktu menganalisis keperluan informasi.
4.
Membangun ETL,
Setiap data warehouse memiliki data yang berbeda persyaratan, oleh
karena itu, ETL tool yang sesuai adalah solusi yang lebih baik untuk
memenuhi persyaratan. (Miranda dan Elfreida, 2010)
Ekstraksi
Perlu menentukan sistem database yang akan digunakan dan juga
mencari tahu data apa yangdiperlukan sebelum mendapatkannya.
Penurunan biaya perangkat keras dan penyimpanan telahmengatasi
masalah pada menghindari duplikasi data dan juga kekhawatiran pada
kurangnya ruangpenyimpanan sebagai tempat penyimpanan data yang
  
berlebihan atau yang tidak diperlukan. Namun,mungkin tidak ada alasan
untuk menyimpan data yang tidak diperlukan dan telah diidentifikasi
tidakberguna dalam proses pengambilan keputusan. Oleh
karena itu,
diperlukan untuk mendapatkan hanyaekstrak data yang relevan sebelum
membawa ke data warehouse. (Mallach, 2000)
Transformasi
Setelah penggalian data dari berbagai sumber, transformasi dibutuhkan
untuk menjamin konsistensi data. Agar mengubah data ke dalam data
warehouse dengan benar, perlu mengetahui cara pemetaan bidang sumber
data eksternal ke data warehouse. Transformasi dapat dilakukan selama
ekstraksi data atau saat memuat data ke dalam data warehouse. Integrasi
ini bisa menjadi masalah yang kompleks ketika jumlah sumber data
menjadi lebih besar.
Loading
Setelah proses penggalian, mengubah dan pembersihan telah dilakukan,
data diambil ke dalam data warehouse. Pemuatan data dapat
dikategorikan ke dalam dua jenis; pemuatan data yang saat ini ada dalam
database operasional dan pemuatan pembaruan data warehouse dari
perubahan yang telah terjadi dalam database operasional. Untuk
menjamin kesegaran data, data warehouse perlu untuk terus
memperbaharui datanya. Banyak persoalan yang perlu untuk
dipertimbangkan terutama saat memuat data yang sudah diperbaharui ke
  
data warehouse. Sementara melakukan pemutakhiran data warehouse,
perlu memastikan bahwa tidak ada data yang dilepaskan dan juga untuk
memastikan overhead minimum selama proses scanning file yang ada.
Gambar 2.10 Proses ETL (Miranda dan Elfreida, 2010)
6.
DBMS (Database Management System)
Menurut Connolly dan Begg (2010, p66), DBMS adalah software yang
memungkinkan pengguna untuk menetapkan, menciptakan, memelihara, dan
mengontrol akses ke database.
7.
Granularity
Menurut Inmon (2005, p41), granularity mengarah ke level of detail atau
ringkasan data pada warehouse. Semakin detil data semakin rendah tingkat
granularity. Semakin ringkas data maka semakin tinggi tingkat granularity.
Ringkasan dari semua transaksi pada suatu bulan akan menjadi tingkat yang
tinggi atas granularity.
  
Granularity dari data akan menjadi sebuah persoalan desain utama pada
lingkungan data warehouse
karena mempengaruhi volume data
pada data
warehouse dan jenis query yang dapat dijawab. Pada banyak kasus, data yang
masuk ke data warehouse berada pada tingkat granularity yang terlalu tinggi
artinya developer harus menghabiskan banyak sumber daya untuk memecah
data. Kadang-kadang data yang masuk ke data warehouse
pada tingkat
granularity yang terlalu rendah.
8.
Estimasi Kapasitas Media Penyimpanan
Dalam penyimpanan data, kapasitas media penyimpanan menjadi aspek
yang perlu untuk dipertimbangkan. Oleh karena itu perhitungan estimasi
kapasitas diperlukan untuk mengetahui banyaknya kapasitas yang
diperlukan. Rumus yang digunakan untuk perhitungan kebutuhan
penyimpanan record adalah :
R
n
= R x (n + (1+i)
n
)
R = Jumlah record
n
= Tahun
i = persentase pertumbuhan record per tahun
Contoh estimasi media penyimpanan dalam jangka waktu 8 tahun :
Num_Rows = Menentukan jumlah baris dalam tabel.
Num_Col = Menentukan jumlah kolom dalam tabel
Fixed_data_size= Jumlah bytes yang dibutuhkan oleh semua kolom
sesuai dengan tipe datanya masing-masing.
Null_bitmap = Bit status null kolom = 2 + ((Num_col+7)/8).
  
Row_Size = fixed_data_size + null_bitmap  + 4 (Nilai 4 presentasi data
row header)
Rows_Per_Page = 8096 / (Row_Size + 2)
Num_Of_Pages = Num_Rows / Row_Per_Pages
Table_Size= 8192 x Num_Of_Pages
2.1.12
Teknik Pencarian Fakta (Fact Finding)
Menurut Connolly dan Begg (2010, p341), pencarian fakta (fact finding)
dapat didefinisikan sebagai suatu proses formal yang menggunakan teknik
seperti wawancara (interview)
dan kuisioner untuk mengumpulkan
fakta/kebenaran mengenai sistem, kebutuhan, dan berbagai pilihan.
Pada umumnya, database developer
menggunakan beberapa teknik fact
finding
selama proyek database
berlangsung. Menurut Connolly dan Begg
(2010, p344), terdapat lima teknik fact finding yaitu :
1.
Memeriksa Dokumentasi (Examining Documentation)
2.
Wawancara (Interviewing)
3.
Melakukan Observasi Aktivitas Operasional di dalam Organisasi
(Observing the Enterprise in Operation)
4.
Melakukan Riset (Research)
5.
Kuesioner (Questionnaires)
  
2.2
Teori Khusus
2.2.1
Sales Order
Menurut menurut La Midjan (2001,p183), Sales Order merupakan
penghubung antara beragam fungsi yang diperlukan untuk memproses langganan
dengan menyiapkan peranan penjualan barang atau jasa.
2.2.2
Perbaikan
Secara umum perbaikan (maintenance) dapat didefinisikan sebagai
serangkaian aktivitas yang diperlukan untuk mempertahankan dan menjaga suatu
produk atau sistem tetap berada dalam kondisi yang aman, ekonomis, efisien,
dan pengoperasian yang optimal. Aktivitas pemeliharaan dalam perusahaan
sangat diperlukan karena setiap peralatan mempunyai umur penggantian (usefull
life), di mana suatu saat dapat mengalami kegagalan atau kerusakan, kerusakan
(failure) dari suatu peralatan atau mesin tidak dapat diketahui secara pasti, dan
manusia selalu berusaha untuk meningkatkan umur penggunaan dengan
melakukan pemeliharaan (maintenance). Kegiatan pemeliharaan (maintenance)
dibagi menjadi 2 jenis, yaitu pemeliharaan pencegahan (preventive maintenance)
dan pemeliharaan perbaikan (corrective maintenance).
Menurut Assauri (2008,p102), preventive maintenanceadalah kegiatan
perawatan yang dilakukan untuk mencegah timbulnya kerusakan dan
menemukan kondisi yang dapat menyebabkan fasilitas atau mesin produksi
mengalami kerusakan pada waktu melakukan produksi. Dengan adanya
preventivemaintenance, diharapkan semua mesin yang ada akan terjamin
  
kelancaran proses kerjanya sehingga tidak ada yang terhambat dalam proses
produksinya dan selalu dalam keadaan optimal. (Abbas, Steven, Christian, dan
Sumanto, 2009)
2.2.3
Pembelian
Menurut Kakouris (2006, p709), pembelian sekarang diakui sebagai
sebuah fungsi strategis, tidak hanya karena keputusan dibuat oleh manajer
pembelian yang memiliki pengaruh besar pada kinerja perusahaan secara
keseluruhan, tetapi juga karena para pebisnis harus mengatur proses yang
menghubungkan mereka dengan para pemasok mereka. Sedangkan sesuai dalam
kamus bahasa Indonesia, pembelian memiliki arti sebagai berikut  proses, cara,
perbuatan membeli: ia bertugas di bagian alat-alat kantor.
Jadi, pembelian adalah urutan kerja atau salah satu proses yang berkaitan
dengan pengadaan barang dagangan.