BAB 2
LANDASAN TEORI
2.1  Teori Umum
2.1.1
Data dan Informasi
Data
merupakan
elemen
dasar yang
dimiliki
setiap transaksi.
Menurut
Inmon (2002,p493), data adalah sebuah rekaman dari fakta, konsep, ataupun
instruksi pada sebuah media penyimpanan untuk komunikasi, pengambilan,
maupun pemrosesan dari pengertian otomatis dan presentasi dari informasi yang
dapat dimengerti oleh manusia.
Tahapan berikutnya dari data adalah informasi, yang menurut Inmon
(2002,p498) informasi adalah kumpulan data yang telah diolah dan dievaluasi
yang dapat digunakan untuk penyelesaian
masalah
maupun
membantu
dalam
membuat keputusan. Sehingga dapat disimpulkan bahwa data merupakan suatu
fakta
yang
dapat
mengandung
informasi yang
dapat
diolah
oleh
manusia.
Sedangkan
informasi
merupakan
dari
sekumpulan dari data yang telah diolah
sedemikian rupa untuk memenuhi kebutuhan manusia.
2.1.2
Database
Menurut Inmon(2002,p493), database merupakan “Sebuah koleksi dari
data
yang
disimpan
dan
memiliki
keterkaitan (biasanya
memiliki
redundansi
namun dalam jumlah yang terbatas dan
masih terkendali) yang sesuai dengan
skema. Sebuah database dapat melayani satu maupun banyak aplikasi.”
Sedangkan
menurut
Connolly-Begg(2005,p15), database adalah kumpulan data
yang   saling   berhubungan   secara   logika   dan   dirancang   untuk   memenuhi
kebutuhan informasi organisasi.
8
  
9
2.1.3
Database Management System(DBMS)
Menurut
Connolly
(2005,p16),
Database
Management
System adalah
sistem software
yang
dapat
mendefinisikan,
membuat,
memelihara
dan
mengontrol akses ke basis data.
Gambar 2.1  Database Management System (DBMS)
Fasilitas
yang
disediakan oleh
Database
Management
System (DBMS)
adalah:
Dapat 
mendefinisikan 
basis 
data 
dengan 
menggunakan 
Data
Definition Language (DDL). DDL dapat memberi fasilitas kepada
pengguna untuk menspesifikasikan tipe data,
struktur dan batasan
aturan
mengenai data yang bisa disimpan ke dalam basis data.
-
Pengguna dapat menambah, mengedit, menghapus dan mendapatkan
kembali data dengan menggunakan data manipulation language.
  
10
Dapat mengontrol akses ke basis data, yaitu mencegah pengguna tanpa
otoritas, sistem integrasi untuk
memelihara konsistensi penyimpanan
data,
sistem kontrol
untuk
memperbolehkan
pengguna
untuk
akses,
sistem  kontrol  untuk  pengembalian  data  yang  bisa  mengembalikan
data   ke   keadaan   semula   apabila   ada   kegagalan   software  atau
hardware,
catalog    
yang     dapat     diakses    
pengguna    
yang
mendeskripsikan data dalam basis data.
2.1.3.1  Kelebihan  dan  Kekurangan  Database Management System
(DBMS)
Menurut  Connolly  –  Begg  (2005,  p26)  berikut  adalah  kelebihan  dari
Database Management System (DBMS):
1. Pengendalian terhadap redudansi
2. Konsistensi data
3. Informasi  yang  lebih  banyak  yang  dapat  dibentuk  dari  data
tersimpan yang sama
4. Data dapat dipakai bersama
5. Peningkatan integritas
6. Penetapan standardisasi
7. Peningkatan keamanan
8. Peningkatan produktifitas
9. Peningkatan layanan backup dan pemulihan data
Menurut Connolly – Begg (2005, p26), berikut adalah kekurangan dari
Database Management System (DBMS):
  
11
1. Kompleksitas yang tinggi
2. Ukuran perangkat lunak yang besar
3. Ongkos pengadaan, operasi dan perawatan, konversi dari sistem
lama ke sistem baru
4. Kinerja performansi yang
menurun, dimana
terdapat beberapa
aplikasi yang tidak berjalan secepat sebelumnya.
5. Dampak yang tinggi bila terjadi kegagalan
2.1.4
Pengertian Data Warehouse
Menurut W.H Inmon dan Richard D.H, data
warehouse
adalah koleksi
data
yang
mempunyai
sifat
berorientasi
subjek
terintegrasi, time
variant,
dan
bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan
management. Dan pengertian data warehouse menurut
Kimball
dan
Ross
(2002,p397), “ Data
warehouse
merupakan perpaduan dari data sebuah
organisasi, baik dari
staging area maupun area presentasi, dimana data
operasional secara spesifik serta terstruktur untuk query dan analisis performansi
dan memudahkan penggunaan.”
2.1.5
Karakteristik Data Warehouse
Menurut Inmon,  Data Warehouse memiliki 4 karakteristik yaitu :
2.1.5.1 Subject Oriented
Sebagaimana
telah
dijelaskan,
data
di
dalam data
warehouse
didapat dari data yang ada di sistem operasional. Pada sistem operasional
tersebut
data
diambil
berdasarkan aplikasi
kejadian-kejadian
yang
ada.
Sedangkan
pada
data
warehouse,
data-data
yang
berdasarkan
aplikasi
  
12
kejadian
tersebut
dirubah
menjadi
data
yang
berdasarkan
pada
subjek
yang terlibat pada kejadian-kejadian tersebut. Misalnya, sebuah
super
market
pada
sistem
operasionalnya
mencatat
transaksi
penjualan
yang
ada di setiap kasir, pembelian barang, dan penggajian karyawan. Maka
data
warehouse
mengelompokkan
data
hasil
kejadian-kejadian
tersebut
ke
dalam berbagai
subjek
misalnya
barang,
karyawan,
pemasukan,
penggajian, dan pemasok.
2.1.5.2 Integrated
Data yang tersebar di banyak sistem operasional
terkadang tidak
beragam, baik
itu penamaan field, nilai dari sebuah field, atau tipe data
yang berbeda-beda untuk suatu hal yang sama. Sebagai contoh, suatu
sistem  operasional  mendefinisikan  isi  dari  field jenis  kelamin  adalah
“pria”  atau 
“wanita”, 
sedangkan  pada  sistem  operasional 
lain  field
tersebut  diisi  dengan  “laki-laki”  atau  “perempuan”.  Hal  seperti  itulah
yang harus diselaraskan agar data di data warehouse seragam sehingga
proses analisis dapat dilakukan.
2.1.5.3 Non Volatile
Dikarenakan data yang ada di data warehouse adalah data historis
untuk kebutuhan masa mendatang, maka data yang ada tersebut bersifat
non-volatile atau
dengan
kata
lain,
sekali data
di-commit
untuk
masuk,
maka data yang telah masuk tersebut tidak dapat diupdate dan dihapus.
  
13
2.1.5.4 Time Variant
Setiap data yang masuk ke data warehouse
dicatat berbagai
waktunya,
dimulai
dari
kapan
data itu
masuk,
kapan
sebuah
transaksi
terjadi, kapan terjadinya perubahan. Selain
itu terkadang untuk
menjaga
performa,
tabel-tabel fisik
yang
ada
di data
warehouse
dapat
dikelompokkan berdasarkan waktu sesuai kebutuhan analisis. Dengan
adanya pencatatan dan pengelompokan waktu tersebut akan sangat
membantu dalam kegiatan analisis data historis.
Data Operasional
Data Warehouse
1.   Mempunyai
time horizon
60 –
90
hari
2.   Data atau record dapat di-update
3.   Key
structure
dapat
termasuk
atau
tidak termasuk elemen waktu
1.   Mempunyai
time
horizon
5
10
tahun
2.   Data   atau 
record   tidak   dapat   d-
update
3.   Key
structure
termasuk
elemen
waktu
Tabel 2.1 Perbandingan Time Variant antara Data Operasional dan Data
Warehouse (Inmon,2002,p35)
2.1.6
Struktur Data Warehouse
Menurut Inmon (2002,p35), data mengalir ke dalam data warehouse dari
lingkungan
operasional.
Biasanya
data
mengalami
perubahan
yang
signifikan
dari tingkat opersional ke tingkat data warehouse. Data dilewatkan dari current
detail  ke  older  detail.  Setelah  data  diringkas,  data tersebut dilewatkan dari
current detail ke lightly summarized data, kemudian ke highly summarized data.
  
14
2.1.6.1
Current Detail Data
Current   detailed   data   berada  di  level   terendah  dari  data
warehouse
yang
mencerminkan
keadaan
yang sedang
berjalan
saat
ini.
Data
yang ada pada
level
ini belum efisien dan sangat banyak sehingga
sulit untuk melakukan analisis.
2.1.6.2
Old Detailed Data
Old Detailed Data merupakan data history dari suatu perusahaan
yang
merupakan
hasil backup
dan
frekuensi
akses
yang
sangat
jarang.
Data backup biasanya data – data yang
sudah dalam kurun waktu
lama
misalnya beberapa tahun, dan penyusunan directory untuk data ini harus
mencerminkan umur dari data agar mepermudah mengakses kembali.
2.1.6.3
Lightly Summarized Data
Lightly
Summarized
Data
merupakan
ringkasan
dari Current
Detailed
Data.
Pada level
ini,
data
ringkasan
masih
belum dapat
digunakan untuk proses pengambilan keputusan karena masih bersifat
detail. Lightly Summarized Data biasanya sering digunakan untuk
menggambarkan keadaan yang sedang dan sudah berlangsung.
2.1.6.4
Highly Summarized Data
Highly Summarized Data 
merupakan
hasil
dari summary
yang
bersifat “totalitas”, sehingga datanya sangat mudah untuk diakses. Pada
level ini pada akhirnya digunakan untuk mendukung dalam pengambilan
keputusan oleh bagian eksekutif pada dunia bisnis, karena data hasil dari
highly    summarized    data    sudah  
cukup    ringkas   
namun    dapat
  
15
merepresentasikan  data  secara  keseluruhan.  Sehingga  sangat
memudahkan
bagian
eksekutif
untuk
menganalisa
data
dalam waktu
singkat.
2.1.6.5 Metadata
Menurut Inmon (2002,p393), metadata adalah data mengenai data
atau deskripsi dari struktur, isi, kunci, indeks, dan lain – lain dari data.
Menurut Inmon(2002,p269), hal – hal penting dari metadata meliputi:
1. ID dokumen
2. Tanggal entri ke warehouse
3. Deskripsi dari dokumen
4. Sumber dari dokumen
5. Tanggal sumber dari dokumen
6. Klasifikasi dokumen
7. Indeks data
8. Pembersihan tanggal
9. Lokasi fisikal
10.  Panjang dokumen
11.  Referensi terkait
Menurut  Conolly 
dan 
Begg 
(2005,p1159), 
metadata 
digunakan
untuk berbagai tujuan meliputi :
1. Proses ekstraksi dan loading
  
16
Metadata
digunakan
untuk
memetakan
sumber
data
ke
dalam
pandangan umum dari data dalam warehouse.
2. Proses manajemen warehouse
Metadata
digunakan
untuk
mengotomatiskan
pembuatan
tabel
ringkasan.
3. Sebagai bagian dari proses manajemen query
Metadata digunakan untuk menghubungkan suatu query dengan
sumber data yang tepat.
2.1.7
Arsitektur Data Warehouse
Penerapan awal dari arsitektur data warehouse dibuat berdasarkan konsep
bahwa data warehouse mengambil data dari berbagai sumber dan
memindahkannya
ke
dalam pusat
pengumpulan
data
yang
besar.
Konsep
ini
sebenarnya lebih cenderung kepada sebuah lingkungan mainframe yang terpusat.
Keunggulan
teknologi Client Server memungkinkan data warehouse diterapkan
dalam berbagai macam cara untuk menampung kebutuhan pemakai sistem secara
lebih
proposional.
Dalam suatu
kasus,
misalkan
saja
pemakai
tertentu
perlu
menggabungkan data
dari
sebuah
sistem pengumpulan
data
yang statis dengan
data dari sistem operasional yang dinamis hanya dengan sebuah query saja.
2.1.7.1 Data Warehouse Terpusat (Centralized Data warehouse)
Bentuk
ini
terlihat
seperti
bentuk data
warehouse
fungsional,
namun
terlebih
dahulu
sumber
data
dikumpulkan
dalam satu
tempat
terpusat,  kemudian  data  disebar  ke  dalam  fungsinya  masing-masing,
sesuai   kebutuhan   perusahaan.   Data  warehouse  terpusat   ini,   biasa
  
17
digunakan
oleh
perusahaan
yang
belum memiliki
jaringan
eksternal.
Keuntungan
dari
bentuk
ini
adalah data
benar-benar
terpadu
karena
konsistensinya yang tinggi sedang kerugiannya adalah biaya yang
mahal
serta memerlukan waktu yang cukup lama untuk membangunnya.
Gambar 2.2 Skema Data Warehouse Terpusat
Ada empat karakteristik dari arsitektur data warehouse tersebut, yaitu:
1.   Database
Database
ini berfungsi untuk menampung
data
OLTP
yang
bersifat
sementara, sehingga transfer data OLTP ke OLAP tidak mengganggu
kinerja sistem operasional perusahaan. Dan kemudian data OLTP akan
dilakukan proses selanjutnya, yaitu ETL (Extract, Transform, Load).
2.   ETL
ETL (Extract, Tranform, Load) ini sangat perlu dilakukan untuk
melakukan
proses filter atau
menyaring
data agar
data
yang
dihasilkan
  
18
konsisten dan terjamin integritasnya, sehingga data yang dihasilkan dapat
menjadi akurat dan tepat.
Tahapan proses transformasi data dari database ke data warehouse
yaitu dengan proses sebagai berikut:
a.   Membaca 
lalu 
memilih 
data 
OLTP 
yang 
berhubungan 
dengan
laporan.
b.   Penyeragaman dan perhitungan data tertentu sesuai keperluan bisnis.
c.
Memasukkan  hasil  data  transformasi  ke  dalam  data warehouse
sehingga tidak ada redundansi data.
3.   Data Warehouse
Data Warehouse merupakan tempat penyimpanan data yang
telah
dilakukan
proses
transformasi sebelumnya
yang
bersifat history dengan
berdasarkan periode dan waktu tertentu, yang digunakan sebagai sumber
dari analisa dan pengambilan keputusan oleh top level manager dan
direktur pada perusahaan.
4.   Aplikasi data warehouse
Aplikasi ini dapat mempermudah para top level manager dan direktur
dalam melakukan
analisis
terhadap
data
pada
laporan
untuk
mengambil
suatu keputusan.
2.1.8
Keuntungan Data Warehouse
Menurut Connolly dan Begg (2005,p1152), keuntungan data warehouse
adalah sebagai berikut:
  
19
1.
Pengembalian investasi yang berpontensi tinggi
Sebuah organisasi harus memberikan sejumlah besar sumber daya
untuk
memastikan
keberhasilan
penerapan
sebuah data
warehouse
dan
harga  bisa  bervariasi  dari  £50.000  hingga  $10  juta  dikarenakan  oleh
solusi teknis yang diberikan. Namun, survey
dari
International
Data
Corporation(IDC) pada tahun 1996 melaporkan bahwa rata-rata 3 tahun
investasi ROI
dalam
data
warehouse
mencapai 40%. 
Lebih
dari
90%
perusahaan
yang
disurvei
telah mencapai lebih dari 40%
ROI.
Setengahnya mencapai lebih dari 160% ROI. Dan seperempatnya
mencapai lebih dari 600% ROI.
2.
Keuntungan kompetitif
Pengembalian besar Investasi dari
perusahaan-perusahaan
yang
telah
sukses
mengimplementasikan
sebuah data
warehouse
merupakan
bukti
dari
keuntungan
kompetitif
yang
di berikan dari
teknologi
ini.
Keuntungan kompetitif di dapat dengan memberikan para pengambil
keputusan akses data yang dapat memperlihatkan apa yang sebelumnya
tidak terlihat. Sebagai contohnya pelanggan, permintaan dan trend.
3.
Meningkatkan produktivitas para pengambil keputusan
  
20
Data
warehouse meningkatkan produktifitas
para
pengambil
keputusan   dengan   membuat   sebuah   database   terpadu   dari   data   yang
konsisten,
subject-oriented,
data berhistoris. Data
warehouse
mengintegrasikan data-data yang tidak lengkap sehingga menjadi data yang
berguna. Sebuah data warehouse memfasilitasi para business manager untuk
melakukan analisis yang lebih akurat, konsisten dan nyata.
2.1.9
Konsep Pemodelan Database
2.1.9.1 Dimensionality Modelling
Menurut
Connolly
dan
Begg
(2005,
p1138), Dimensionality
Modeling adalah sebuah teknik
logical
design dengan tujuan untuk
menyajikan data dalam bentuk yang standard dan intuitif yang
memungkinkan pengaksesan  database dengan performansi yang tinggi.
2.1.9.2 Komponen Dimensionality Modelling
Dalam Dimensionality Modeling 
ada
5
yang
menjadi
bagian
didalamnya,
yaitu
Fakta
dan
Dimensi,  
tabel
fakta, tabel
dimensi,
Surrogate Key, dan Granularity.
1.
Fakta dan Dimensi (Fact and Dimension)
Menurut Kimball dan Ross (2002, p402), Fakta adalah sebuah ukuran
dari
performansi
bisnis,
biasanya
berupa numerical
dan
penjumlahan.
Dimensi
merupakan
sebuah
entitas
independent pada sebuah model
dimensional yang berfungsi sebagai pintu masuk atau berperan sebagai
sebuah
mekanisme
untuk
memecah-mecah
pengukuran tambahan
yang
  
21
ada
pada
tabel
fakta
dari
model
dimensional. Pendapat
ini dinyatakan
oleh Kimball dan Ross (2002,p399).
2.
Fact Table
Menurut Inmon (2002,p391), Tabel Fakta adalah pusat dari table star
join dimana
data
dengan
banyak
kepentingan tersimpan. Dan
menurut
pendapat  Kimball  dan  Ross  (2002,p402)  mengenai  definisi  dari  tabel
fakta
pada sebuah skema bintang
(dimensional model) merupakan
table
central  dengan pengukuran performansi bisnis dalam  bentuk numeric
yang memiliki karakteristik berupa composite key, yang tiap-tiap
elemennya adalah foreign key yang didapat dari tabel dimensi.
3.
Dimension Table
Menurut
Inmon
(2002,p389)
Dimension
table atau
tabel
dimensi
adalah
tempat
dimana
data
tambahan
yang
berhubungan
dengan
tabel
fakta  ditempatkan  pada  sebuah  tabel  multidimensional.  Pendapat  lain
yang dikemukakan oleh Kimball dan Ross (2002,p399) yang menyatakan
sebuah tabel dimensi adalah
sebuah tabel pada model dimensional yang
memiliki   sebuah   primary  key   tunggal   dan   kolom   dengan   atribut
deksriptif.
4.
Surrogate Key
  
22
Menurut
Kimball
dan
Ross
(2002,p414), Surrogate
Key
adalah
key
berupa integer yang secara sequential ditambahkan sesuai dengan
keperluan pada staging area untuk membentuk sebuah tabel dimensi dan
elemen yang menggabungkannya dengan tabel fakta. Pada tabel dimensi,
surrogate key bertindak sebagai primary key. Sedangkan pada tabel fakta,
surrogate
key
bertindak
sebagai foreign
key
yang
menspesifikasikan
dimensi, walaupun terkadang tidak dibutuhkan, surrogate key pada tabel
fakta juga dapat bertindak sebagai bagian dari primary key yang dimiliki
oleh  tabel  fakta.  Surrogate  key  biasanya  tidak  bisa  dijelaskan  sendiri
hanya  melalui  nilai  yang
terkandung  didalamnya.
Surrogate  key  pada
data warehouse dibutuhkan untuk menangani permasalahan
yang
timbul
dari slowly changing dimensions serta data yang hilang ataupun data yang
tidak bisa digunakan.
5.
Granularity
Menurut
Kimball
dan
Ross
(2002,p403)
, Granularity
merupakan
tingkat detail yang ada pada 
data warehouse. Kemudian pendapat ini
diperjelas oleh Inmon (2002,p391) yang menyatakan bahwa Granularity
adalah
tingkat
detail
yang
terkandung
pada
setiap
unit
data.
Semakin
detail tingkat datanya, maka semakin rendah tingkat granularity-nya. Dan
sebaliknya
juga,
semakin rendah
tingkat
detail datanya,
maka
semakin
tinggi tingkat granularity-nya.
2.1.9.3  Star Schema
  
23
Menurut Connolly (2005,p1079), star schema atau skema bintang
merupakan
struktur
logikal
yang
memiliki fact
table
yang
berisi data
fakta dan dikelilingi oleh tabel dimensi yang berisi data referensi(yang
dapat didenormalisasikan).
Menurut Ponniah (2001,p210-216), skema bintang (star schema)
adalah teknik dasar desain data untuk data warehouse. Struktur skema
bintang adalah strukur yang dapat dengan mudah dipahami
dan
digunakan oleh pengguna dan struktur tersebut mecerminkan bagaimana
pengguna  biasanya  memandang  ukuran-ukuran  kritis  mengikuti
dimensi-dimensi bisnis yang ada.
Gambar 2.3 Star Schema sederhana
Karakteristik dari skema bintang :
  
24
1.   Tabel dimensi
a.   Key tabel dimensi
Key
tabel
dimensi
merupakan primary
key dari tabel
dimensi
yang
mengidentifikasi
setiap
baris
dalam tabel
secara unik.
b.   Merupakan tabel yang lebar
Tabel dimensi dikatakan lebar dikarenakan tabel dimensi
ini memiliki jumlah kolom atau atribut dalam jumlah
banyak.
c.   Atribut berupa teks
Tabel dimensi ini jarang sekali ditemukan atribut yang
memiliki   nilai   numerik   untuk   perhitungan,   biasanya
berupa teks yang mendeskripsikan komponen dalam
dimensi bisnis.
d.   Atribut-atribut tidak berhubungan secara langsung
Contohnya  saja  harga  tiket  dan  warna  tiket  yang  tidak
saling  berhubungan,  namun  sama-sama  menjadi  atribut
pada tabel dimensi.
e.   Tidak dinormalisasi
Untuk
kinerja
query yang
lebih
efisien,
lebih
baik
mengambil dari tabel dimensi dan langsung ke tabel fakta
tanpa  melalui  tabel  perantara  yang  akan  terbentuk  jika
tabel dimensi dinormalisasi
f.
Kemampuan drill-down dan roll-up
  
25
Atribut-atribut
dalam tabel
dimensi
menyediakan
kemampuan
untuk
mendapatkan
detail
dari level
tinggi
agregasi sampai ke level detail yang paling rendah.
g.   Terdapat beberapa hirarki
Berbagai bagian perusahaan dapat mengelompokkan
dimensi  dengan  cara  yang  berbeda  sehingga  terbentuk
lebih dari 1 hirarki.
h.   Jumlah record  yang lebih sedikit
Tabel
dimensi
umumnya
memiliki
jumlah record
yang
lebih sedikit dibanding tabel fakta.
2.   Tabel fakta
a.   Concatenated Key
Baris dalam tabel diidentifikasikan dengan menggunakan
primary
key
dari
tabel-tabel
dimensi,
maka
primary
key
dari tabel fakta merupakan gabungan primary
key 
dari
semua tabel dimesi.
b.   Data grain
Data Grain
merupakan tingkat detail
untuk pengukuran.
Contohnya saja, jumlah pemesanan berhubungan dengan
jumlah dan tanggal tertentu, dan untuk pelanggan terntentu
diperoleh dari sales tertentu. Jika jumlah pesanan dilihat
sebagai
jumlah
untuk suatu produk
perbulan,
maka
data-
grain-nya berbeda dan pada tingkat yang lebih tinggi.
c.   Fully additive measures
  
26
Agregasi dari fully additive measures dilaksanakan dengan
penjumlahan sederhana dari nilai-nilai atribut tersebut.
d.   Semi-additive measures
Merupakan nilai yang tidak dapat langsung dijumlahkan,
seperti persentasi laba.
e.   Tabel besar, tidak lebar
Tabel fakta memiliki atribut yang lebih sedikit dari tabel
dimensi, namun jumlah recordnya lebih banyak.
f.
Sparse data
Tabel fakta tidak menyimpan record yang bernilai null,
sehingga tidak memiliki gap.
g.   Degenerate dimensions
Ada  beberapa  data  dari  sistem  operasional  yang  bukan
fakta
maupun
dimensi
namun
berguna
dalam proses
analisis. Seperti kode transaksi, yang berguna untuk
mendapatkan
total
penjualan/
atribut
tersebut degenerate
dimension dan disimpan sebagai atribut di tabel fakta.
2.1.10
Entity Relationship (ER)  Modeling
Menurut Connolly dan Begg (2005, p1186), ER Modelling adalah teknik
yang
digunakan
untuk
mengidentifikasikan
relasi antar entitas, dengan tujuan
adalah
untuk
menghilangkan
redudansi
pada
data.
ER Modelling biasa
digunakan pada perancangan database untuk OLTP.
  
27
2.1.11
Metodologi Perancangan Data Warehouse
Menurut
Kimball  ada  9  tahap  metodologi  dalam  perancangan  data
warehouse, yaitu:
2.1.11.1
Memilih Proses (Choosing The Process)
Memilih  proses  yang  terdapat  pada  suatu  perusahaan  dengan
tepat
dan
dapat
dikirim
tepat
waktu
untuk
dirancang
kedalam data
warehouse supaya
dapat
menjawab
semua
pertanyaan
bisnis
yang
diperlukan.
2.1.11.2
Memilih Grain (Choosing The Grain)
Menentukan secara pasti apa yang diwakili dan direpresentasikan
dalam sebuah tabel fakta. Dengan kata lain fakta-fakta apa saja yang akan
ditampilkan dalam tabel fakta.
2.1.11.3
Mengidentifikasi
dan
Memilih
Dimensi
yang
Sesuai
(Identifying and Conforming the Dimensions)
Set dimensi yang dibangun dengan baik dan tepat akan
memberikan kemudahan dalam memahami dan
menggunakan data mart.
Dimensi
ini
penting
untuk
menggambarkan fakta-fakta yang terdapat
dalam tabel fakta.
Jika
sebuah
dimensi
digunakan
pada
dua
data
mart
atau lebih,
maka dimensi ini harus di sinkronisasi agar dapat digunakan secara
bersama-sama.
  
28
2.1.11.4
Memilih Fakta (Choosing the Facts)
Grain dari sebuah
tabel
fakta
menentukan
fakta
mana
yang bisa
digunakan. Semua fakta harus di ekspresikan pada tingkat yang telah
ditentukan oleh sumber.
2.1.11.5
Menentukan
Perhitungan
Awal
dalam
Tabel
Fakta
(Storing Pre-calculations in the Facts Table)
Semua fakta dikaji ulang untuk mengetahui peluang untuk
digunakan dalam pre-kalkulasi.
2.1.11.6
Melengkapi Tabel Dimensi (Rounding Out the Dimensions
Tables)
Penambahan 
keterangan 
selengkap-lengkapnya  pada  tabel
dimensi. Keterangan bersifat intuitif dan mudah dipahami user.
2.1.11.7
Memilih Durasi dari Basis Data (Choosing the Duration of
the Database)
Menentukan durasi atau batas waktu data perusahaan yang akan
dimasukkan
kedalam data
warehouse,
contohnya
perusahaan
akan
menyimpan data 5 tahun terakhir.
2.1.11.8
Menelusuri   Perubahan   dari   Dimensi   secara   Perlahan
(Tracking Slowly Changing Dimensions)
Ada tiga tipe slowly changing dimension:
Tipe 1, Atribut dimensi
yang berubah akan di timpa dan berisi
nilai
atribut yang baru.
  
29
Tipe 2, Atribut yang berubah akan tetap tersimpan pada suatu record
baru dan record yang lama akan ditandai sebagai outdated.
Tipe 3, 
Atribut dimensi yang sudah ada tidak di ijinkan
mengalami
perubahan  dan 
jika  perubahan  terjadi, 
maka  akan 
diperlakukan
sebagai error.
2.1.11.9
Menentukan Prioritas dan
Tipe dari
Query (Deciding The
Query Priorities and The Query Modes)
Pada tahap ini kita mempertimbangkan perancangan fisik. Ini
merupakan salah satu tahap penting untuk membentuk suatu tabel fakta
secara fisik dan memunculkan summarized dan aggregation.
2.1.12
Istilah dalam Data Warehouse
2.1.12.1
OLAP
Menurut Connolly (2005, p1101), OLAP adalah  sintesis, analisis,
dan
konsolidasi
yang
dinamis dari
sekumpulan
besar
data
multi-
dimensional.
2.1.12.2
Extract, Transform , Load (ETL)
Extract
Extract
merupakan
proses
pembacaan
data
dari
database
operasional.
Transform
Transform   merupakan  proses  merubah  data  yang  diekstrak
menjadi bentuk yang diinginkan.
  
30
Load
Load merupakan
proses
penulisan
data
ke database yang dituju.
Proses
Extract
Transform
Load
(ETL) dapat
digambarkan
sebagai
urutan
perubahan
aktifitas
data
secara
heterogen
ke
bentuk
target
ODS Database yang terintegrasi. Proses ini memerlukan waktu untuk
mendapatkan sumber data, mengerti kebutuhan kolom, mengerti
aturan bisnis, dan mengerti logika dan bentuk dari model data. Yang
dibutuhkan dari merubah data adalah sangat penting untuk mengerti
desain dan spesifikasi dari ETL. Salah satu tantangan dalam membuat
aplikasi    
Bussiness
Intelegence
(BI) adalah
sulit
untuk
mengidentifikasi sumber data yang sesuai dan operasi yang spesifik
dan
perubahan
yang
dibutuhkan
oleh
database tujuan. Meskipun
tersedia tool yang memfasilitasi prosedur, tetap membutuhkan detail
spesifikasi kebutuhan dari sumber data yang tepat, perubahan yang
tepat dan memproses menjadi format yang tepat ke database tujuan.
2.1.13
Perbedaan Data Warehouse dengan OLTP
Menurut Connolly dan Begg (2005, p1153), biasanya sebuah organisasi
mempunyai 
beberapa 
sistem 
Online 
Transaction 
Processing 
(OLTP) 
yang
berbeda
untuk
setiap
proses
bisnis seperti
pengawasan
persediaan
(Inventory
Control), pesanan pelanggan (Invoicing customer) dan tingkat penjualan. Sistem
ini menghasilkan data operasional yang detil, terbaru dan selalu berubah. Sistem
OLTP
optimal
jika digunakan
untuk
sejumlah
transaksi
yang
bisa diramalkan
  
31
(predictable), berulang (repetitive), dan sering diperbaharui (update
intensive).
Data OLTP diorganisasikan berdasarkan syarat-syarat dari transaksi dihubungkan
dengan  aplikasi  bisnis  dan  mendukung  keputusan  yang  diambil  per  harinya
dalam jumlah besar operasional user yang concurrent.
Umumnya
sebuah
organisasi hanya
mempunyai
satu
data
warehouse
yang
menyimpan
data
secara
historis,
detil
dan
ringkasan dengan
beberapa
tingkatan dan sangat jarang berubah. Data warehouse didesain untuk mendukung
transaksi yang tidak dapat diramalkan (unpredictable), dan memerlukan jawaban
untuk query khusus
(ad
hoc),
tidak
terstruktur
dan
heuristic.
Data
warehouse
diorganisasikan
berdasarkan
pada
syarat-syarat query
yang
potensial
dan
mendukung keputusan strategis jangka panjang dari sejumlah kecil user tingkat
manajerial.
Dibawah
ini
adalah
tabel
perbandingan
antara
sistem OLTP
dengan
sistem Data warehouse (Connolly dan Begg, 2005, p1153) :
Sistem OLTP
Sistem Data Warehouse
Mengandung data terkini
Mengandung data historis(data lama)
Menyimpan data yang rinci
Menyimpan data yang rinci, sedang dan ringkas
Data bersifat dinamis
Data bersifat statis
Prosesnya berulang
Prosesnya tidak terstruktur, ditujukan untuk
maksud tertentu
Digunakan untuk transaksi
Digunakan untuk analisis
Transaksi tingkat tinggi
Transaksi tingkat menengah sampai rendah
  
32
Berorientasi pada aplikasi
Berorientasi pada subjek
Penggunaannya dapat diprediksi
Penggunaannya tidak dapat diprediksi sebelumnya
Mendukung keputusan harian
Mendukung keputusan yang bersifat strategis
Digunakan oleh banyak user
operasional
Digunakan oleh sedikit user manajerial
Tabel 2.2 Tabel Perbandingan Sistem OLTP dengan Sistem Data Warehouse
(Connolly dan Begg, 2005, p1153)
2.1.14
Matriks
Matriks menurut Kimball (2002,p398) adalah alat yang digunakan untuk
membuat, mendokumentasikan, dan berkomunikasi dengan arsitektur data,
dimana baris-baris yang ada pada matriks meng-identifikasikan proses bisnis
perusahaan dan kolom-kolomnya merepresentasikan dimensi-dimensi yang tepat
untuk proses bisnis perusahaan. Perpotongan dari dimensi-dimensi yang relevan
dengan
masing-masing
proses
bisnis
diberi tanda untuk menunjukkan adanya
hubungan antara dimensi dengan proses bisnis tertentu. Matriks merupakan suatu
alat 
yang 
membantu 
penggunanya 
dalam  hal  perencanaan  dan  proses
komunikasi. Meskipun matriks terdiri
dari baris dan kolom, matriks mampu
mendefinisikan keseluruhan arsitektur data untuk data warehouse.
Matriks
menunjukkan
keseluruhan
rencana
yang
dirancang
dalam suatu
bentuk
yang
ringkas
sehingga
dapat
digunakan
untuk
membantu
senior IT dan
manajemen bisnis meng-komunikasikan rancangan rencana. Membuat Bus
Matriks data warehouse
adalah satu up-front deliverables
yang paling penting
dari implementasi data warehouse. Ini adalah a hybrid resource yang merupakan
  
33
bagian dari desain alat
teknis , bagian dari alat
manajemen proyek dan bagian
alat komunikasi (Kimball,2002,p81).
2.2  Teori Khusus
2.2.1
Penjualan
Menurut
Mulyadi
(2001,p202),
kegiatan penjualan terdiri dari
transaksi
penjualan barang atau jasa baik secara credit maupun tunai. Penjualan menurut
cara
pembayarannya
dapat
dibedakan
menjadi dua, yaitu penjualan tunai dan
penjualan kredit. Penjualan tunai merupakan penjualan yang dilakukan oleh
perusahaan dengan cara mewajibkan pembeli melakukan pembayaran barang
terlebih   dahulu   sebelum   barang   diserahkan   kepada   pembeli.   Sedangkan
penjualan kredit merupakan penjualan yang dilakukan dengan cara memenuhi
pesanan 
atau  order  dari  pelanggan  dengan  mengirimkan 
barang 
atau
menyerahkan  jasa.  Dan  untuk  jangka 
waktu  tertentu,  perusahaan  memiliki
piutang kepada pelanggan. Untuk transaksi penjualan tunai, barang/jasa baru
diserahkan kepada pembeli setelah menerima kas dari pembeli.
Di dalam sistem penjualan, terdapat beberapa macam fungsi yang terkait.
Menurut Mulyadi (2001,p204), fungsi-fungsi tersebut antara lain:
1.   Fungsi Kredit
Fungsi
kredit
yang
dimaksudkan
oleh
Mulyadi
ini
mengenai
transaksi
penjualan
yang menggunakan kartu kredit. Dalam sistem penjualan ini,
  
34
fungsi kredit tidak perlu diragukan lagi otorisasinya, karena otorisasi
pemberian kredit sudah tercermin dari kartu kredit yang ditujukan kepada
pelanggan saat melakukan pembelian.
2.   Fugsi Penjualan
Fungsi penjualan yang dimaksudkan oleh Mulyadi ini mengenai fungsi
yang
bertanggung
jawab
untuk
melayani kebutuhan barang atau jasa
pelanggan.
3.   Fungsi Akutansi
Fungsi akutansi yang dimaksudkan oleh Mulyadi adalah mengenai
pencatatan 
transaksi 
piutang 
pelanggan 
kedalam  kartu 
piutang
berdasarkan faktur penjualan yang diterima.
4.   Fungsi Penagihan
Fungsi
penagihan
yang
dimaksudkan oleh Mulyadi adalah fungsi ini
bertanggung jawab
untuk
membuat surat tagihan secara periodik kepada
pemegang kartu kredit.