BAB 2
LANDASAN TEORI
2.1 Teori Umum
Teori- teori umum yang dibahas mengenai sistem basis data dan data warehouse.
2.1.1 Data
Pembahasan mengenai data akan diuraikan secara lengkap pada sub bab
di bawah ini.
2.1.1.1 Pengertian Data
Data
merupakan
sumber
dari
sebuah
informasi.
Menurut
Hall
(2001,  p14),  data  adalah  fakta  yang  dapat  atau  tidak  dapat  diproses
(disuling,  dirangkum  atau  diperbaiki)  dan  tidak  berpengaruh  secara
langsung pada pengguna. Sebaliknya, informasi menyebabkan pengguna
melakukan suatu tindakan yang dapat dilakukan atau tidak dilakukan.
Menurut
Laudon
(2006,
p13),
data
adalah
kumpulan
fakta
yang
masih
mentah yang menjelaskan aktifitas-aktifitas yang terjadi dalam organisasi
atau
lingkungan
fisik,
sebelum
terorganisir
dan
diubah
menjadi
bentuk
yang dimengerti dan dapat digunakan.
Jadi,  data  adalah  sumber  dari  informasi  yang  nantinya  dapat
digunakan menjadi suatu yang bentuk yang lebih berguna dan berarti.
12
  
13
2.1.2 Sistem Basis Data
Teori mengenai sistem basis data meliputi :
2.1.2.1 Pengertian Sistem Basis Data
Basis
data
saat
ini
merupakan
bagian dari kehidupan sehari-hari
yang
tanpa
kita
sadari
bahwa
kita
selalu
menggunakannya.
Basis
data
atau yang kita kenal dengan nama database adalah kumpulan data
yang
berelasi
dan
Database
Management
System (DBMS)
yang
merupakan
perangkat lunak yang mengatur dan mengontrol akses ke basis data.
Maka pengertian sistem basis data
adalah
kumpulan
program
aplikasi basis data
yang berinteraksi dengan basis data. Contoh aplikasi
database, aplikasi database perpustakaan univesitas Bina Nusantara.
Aplikasi ini dapat memberikan informasi mengenai keterangan buku di
perpustakaan, keterangan pembaca, dan keterangan peminjaman. Aplikasi
ini  dapat  mengetahui  informasi  buku  melalui  indeks  yang
terkomputerisasi
dengan
menggunakan bar
code.
Bar
code
berfungsi
untuk mengetahui kapan buku ini masuk dan keluar di perpustakaan.
Menurut  Connolly  (2002,  p14), 
database  adalah  sebuah
pembagian
kumpulan
data
yang
berelasi secara logika, dan keterangan
data yang didesain untuk mendapatkan informasi yang dibutuhkan sebuah
organisasi. Basis data dapat melakukan pelaporan data besar dimana
semua bagian dan pengguna dapat menggunakannya, menghilangkan data
berulang,   dan   semua   data   diintegrasikan   dengan   meminimumkan
duplikasi data.
Basis data
juga sebagai system catalog (data dictionary
atau metadata) yang mampu mendeskripsikan dirinya sebagai kumpulan
  
14
record
yang
terintegrasi,
data
yang
berelasi
secara logika terdiri
dari
entities,
attributes,
dan relationships
di
mana
ketiganya
dianalisa
untuk
kebutuhan informasi pada perusahaan.
2.1.2.2 Pendekatan File Based System
Menurut  Connolly  (2002,  p7),  filed-based  system  adalah
kumpulan
program aplikasi
yang
melayani end-user
seperti
pembuatan
laporan. 
Setiap 
program 
mendefinisi 
dan 
mengatur 
masing-masing
datanya sendiri. Sistem ini berjalan secara manual dalam pengisian data,
data
disimpan
pada
lemari
penyimpanan.
Sistem ini
tidak
dapat
menyimpan data dalam jumlah besar.
Masalahnya
sistem ini
memiliki
keterbatasan dalam mengolah
data, seperti:
1.   Data yang terpisah dan terisolasi.
2.   Duplikasi data, data yang sama terdapat pada program aplikasi lain.
3.
Ketergantungan data, perubahan yang terjadi pada satu program,
menyebabkan penyesuaian dengan program lain, penyesuaian tersebut
membuat stuktur program awal kembali.
4.   Format
file
yang
tidak
kompatibel,
program ditulis
dengan
bahasa
yang berbeda-beda sehingga tidak mudah mengakses file lain.
5.   Query / ukuran aplikasi yang tetap.
  
15
2.1.2.3 Aplikasi Basis Data
Contoh  aplikasi  basis  data  menurut  Kronke  (2006,  p5)  dapat
dikategorikan sebagai berikut:
Aplikasi Basis Data Single-User
Aplikasi ini digunakan penjual tunggal yang menjaga alur
pelanggan
dan
merupakan
hubungan penjual
dengan
pelanggan.
Contoh 
sales 
contact 
manager,
penggunanya  satu  sales 
dengan
ukuran
data
sebesar
1000
baris,
dan
produknya database
terpusat.
Misalnya Gold Mine and Act.
Aplikasi Basis Data Multiuser
Aplikasi ini digunakan lebih dari satu pengguna. Contoh aplikasi
jadwal pasien yang digunakan oleh 15 sampai 50 pengguna, seperti
perawat, 
dokter,  dan 
bagian  administrasi. 
Besar 
data 
mencapai
100.000 baris data dengan 5 sampai 10 tabel yang berbeda.
Aplikasi Basis Data e-Commerce
Aplikasi ini digunakan untuk memasukkan data pemesanan,
penagihan, pengiriman, dan
layanan pelanggan. Contohnya
Amazon.com dan
Drugstore.com yang menggunakan halaman web
yang
mereka kirim ke
konsumen.
Konsumen
dapat
mengoperasikan
dengan menambah belanja, memesan pembelian, dan pembatalan
pembelian.
  
16
Aplikasi Basis Data Data Mining
Aplikasi ini menggunakan data yang dihasilkan dari proses
pemesanan  dan  sistem  operasi  lain  untuk  menghasilkan  informasi
yang membantu mengatur perusahaan dengan merangkum data yang
ada.
2.1.3  Model Relasional
Di
dalam model
relasional,
semua data
secara
logika terstruktur
dalam
tabel.
Setiap
tabel
mempunyai
nama dan
terdiri
dari
kolom-kolom yang
dinamakan atribut. Setiap baris mengandung setiap nilai untuk setiap atribut.
Di
dalam
model
relational
dikenal
istilah-istilah relation,
attribute,
domain,
degree, dan cardinality. Menurut
Connolly
(2002, p72), relation atau
relasi
adalah
sebuah
tabel
yang
terdiri dari
baris
dan
kolom.
Atribut
adalah
penamaan kolom yang ada didalam sebuah table. Domain adalah kumpulan dari
nilai-nilai
yang
diijinkan pada
satu atau
lebih
atribut.
Tuple
adalah penamaan
baris
yang
terdapat
dalam
sebuah
tabel.
Degree
of
a
relation
adalah
jumlah
atribut yang dapat ditampung. Cardinality of a relation adalah jumlah baris yang
terdapat pada sebuah tabel.
2.1.4  Basis Data Relasional
Menurut Connolly (2002, p74), relational database merupakan kumpulan
relasi yang sudah dinormalisasikan dengan nama berbeda. Ciri-ciri yang dimiliki
oleh sebuah relasi antara lain:
  
17
1.   Memiliki
nama
yang
berbeda antara
satu
relasi dengan
relasi
lainnya di
dalam skema relasional.
2.   Setiap cell di dalam relasi mengandung sebuah nilai tunggal.
3.   Setiap atribut memiliki nama yang berbeda.
4.   Nilai dari sebuah atribut berasal dari domain yang sama.
5.   Setiap baris pada relasi berbeda. Tidak ada baris yang bernilai sama.
6.   Urutan dari atribut tidak terlalu berpengaruh.
7.   Secara teoritis, urutan dari tuple atau baris tidak berpengaruh namun dalam
implementasinya urutannya dapat mempengaruhi waktu pengaksesan.
Karena antara
setiap baris
tidak
memiliki
nilai
sama,
maka
diperlukan
sebuah relational key yang dapat mengidentifikasikan setiap baris di dalam relasi
secara unik. Beberapa relational key yang dikenal antara lain sebagai berikut:
a.   Super key
Sebuah atribut atau kumpulan dari atribut yang secara unik
mengidentifikasi baris yang ada dalam sebuah relasi.
b.   Candidate key
Sebuah candidate key harus
memiliki dua ciri-ciri,
yaitu secara
unik
mengidentifikasi sebuah baris dan tidak ada nilai
lain
yang
memiliki sifat
yang unik tersebut (irreducibility).
c.   Primary key
Merupakan candidate key yang dipilih
untuk
mengidentifikasi baris-
baris didalam sebuah relasi secara unik.
  
18
d.   Foreign key
Merupakan atribut atau kumpulan atribut didalam sebuah relasi yang
juga merupakan candidate key.
e.   Composite key
Merupakan
gabungan
dari
dua
atribut
atau
lebih
yang
membentuk
sebuah primary key.
2.1.5  Database Management System
Menurut Connolly
(2002,
p16),
Database
Management
System (DBMS)
adalah
sebuah
sistem perangkat
lunak
yang
memungkinkan
user
mendefinisi,
membentuk,
mengatur dan
mengontrol
akses
ke database.
DBMS berinteraksi
dengan pengguna aplikasi program dan database.
DBMS menyediakan fasilitas :
1.
Data Definition Language
(DDL),
yang berguna
untuk menspesifikasi tipe
data,
struktur,
dan
constraint
data. Semua
spesifikasi
di
simpan
dalam
database.
2.
Data
Manipulation
Language
(DML),
yang
dapat
menambah,
mengubah,
menghapus,
dan
mengembalikan
data
dengan memberikan
fasilitas
data
query  berupa query  language. Query  language  yang sering digunakan
adalah Structured Query Language (SQL).
3.
Pengendalian akses database, antara lain:
-
Sistem keamanan : mencegah user
yang tidak
memiliki
hak akses untuk
mengakses database.
-
Sistem Integrasi, menjaga konsistensi data.
  
19
-
Pengendalian share data.
-
Backup dan Recovery sistem.
-
Katalog deskripsi data dalam database
4.
Mekanisme View untuk menyediakan data
yang diinginkan dan diperlukan
user saja.
2.1.5.1 Komponen DBMS
Ada lima komponen utama dalam DBMS, yaitu
1.   Hardware, yang berupa komputer hingga  jaringan komputer.
2.   Software,  yaitu  DBMS,  aplikasi  program,  sistem  operasi,  dan  software
jaringan (bila diperlukan untuk jaringan).
3.   Data 
yang 
merupakan 
data 
operasional 
dan 
metadata 
yang 
digunakan
perusahaan.
4.   Prosedur, 
yaitu 
instruksi  dan  aturan 
yang 
harus  ada  pada  desain  dan
kegunaan dari database dan DBMS.
5.   People, antara lain:
-
Data Administration (DA)
DA mengatur sumber daya data, meliputi perencanaan database,
pengembangan dan pemeliharaan standar, kebijakan, prosedur, dan
desain database logikal dan konseptual.
-
Database Administration (DBA)
DBA
mengatur realisasi fisik dari aplikasi database yang
meliputi
desain 
fisik  database dan 
implementasi,  pengaturan  keamanan  dan
  
20
kontrol
integritas,
pengawasan
performa sistem
dan
pengaturan
ulang
database.
-
Desainer Database (Logikal dan Fisikal)
Desainer database logical melakukan identifikasi data (entitas dan
atribut), hubungan antara data, dan batasan data yang disimpan dalam
database. Desainer
database
fisikal
memutuskan
bagaimana
desain
database logikal diimplementasikan.
-
Application Developers
Application  developers 
mengimplementasikan  program  aplikasi
yang menyediakan kebutuhan bagi end-user.
-
End-Users
End User dapat digolongkan menjadi 2 bagian :
1.   Naïve users, adalah pengguna yang tidak perlu tahu mengenai DBMS,
hanya 
mengoperasikan 
dengan 
perintah 
sederhana  dan 
memilih
pilihan dari menu.
2.   Sophisticated users,
pengguna
yang
mengetahui
struktur basis data
dan fasilitas DBMS.
2.1.5.2 Keuntungan dan Kerugian DBMS
Ada  beberapa  keuntungan  yang  didapat  dengan 
memakai  DBMS,
yaitu:
Mengontrol redudansi data.
Konsistensi data.
Lebih banyak informasi dari jumlah data yang sama.
  
21
Share data.
Meningkatkan integritas data.
Meningkatkan keamanan.
Standar pelaksanaan.
-
Skala ekonomi (data operasional organisasi dijadikan satu database dan
membuat aplikasi pada satu sumber data sehingga akan menghemat
biaya).
Keseimbangan aksesibilitas data dan data responsiveness.
Meningkatkan produktivitas.
Meningkatkan pemeliharaan melalu data independence.
Meningkatkan   konkurensi   (mengurangi   loss  informasi   dan   loss
integrasi).
Meningkatkan layanan backup dan recovery.
Sementara itu, yang menjadi kerugian DBMS:
Kompleksitas.
Ukuran.
Biaya DBMS.
Biaya penambahan perangkat keras.
Biaya konversi (biaya staf spesialis, biaya pelatihan).
Performance ( tidak dapat berjalan secepat yang diinginkan).
Resiko kesalahan yang lebih tinggi.
  
22
2.1.6 Data Warehouse
Teori mengenai data warehouse meliputi :
2.1.6.1 Pengertian Data Warehouse
Berikut adalah beberapa pengertian data warehouse dari banyak
ahli yang mengemukakan pendapatnya:
1.   Menurut  Inmon  (2005,  p29),  data warehouse adalah  koleksi  data
yang mempunyai sifat berorientasi pada subjek, terintegrasi, variasi
waktu, dan koleksi data-nya tidak mengalami perubahan dalam
mendukung proses pengambilan keputusan di manajemen.
2. 
Menurut Ralph Kimball (2002,p397),
data warehouse
adalah “The
conglomeration of organization’s data warehouse staging and
presentation areas, where operational data is specifically structured
for query and analysis performance.” Pengertian tersebut dapat
diartikan
penggabungan
antara
tingkatan data warehouse
yang
ada
pada suatu organisasi dengan area prestasi, dimana data operasional
secara
spesifik
disusun untuk
query
dan
analisis
performa,
serta
kemudahan dalam penggunaan.
3.
Menurut Berson dan Smith (2001, p4), data warehouse adalah
gabungan
teknologi-teknologi    yang    bertujuan    mengefektifkan
integrasi
database
operasional
ke
dalam lingkungan
yang
memungkinkan penggunaan secara strategis.
4.   Menurut Turban (p418), Data warehouse adalah tempat penyimpanan
data historis yang berorientasi subjek, yang diatur agar dapat diakses
dan diterima untuk aktivitas proses analisis.
  
23
5.   Menurut  Paulraj  (p14),  Data warehouse adalah  suatu  lingkungan
yang
terkomputerisasi
dimana
user dapat menemukan informasi
strategis,
dapat
berhubungan
langsung dengan data yang mereka
butuhkan
untuk
membuat
keputusan bisnis
yang
lebih
baik.
Data
warehouse berisi informasi tentang keseluruhan data perusahaan yang
telah terintegrasi.
2.1.6.2 Karakteristik Data warehouse
Menurut  Inmon(2005,  p29),  data warehouse
memiliki  empat
karakteristik utama, antara lain sebagai be rikut:
1.   Subject-Oriented
Data warehouse berorientasi subject
artinya data warehouse
didesain untuk
menganalisa data berdasarkan subject-subject tertentu
dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.
Data  warehouse 
diorganisasikan  disekitar  subjek-subjek
utama
dari
perusahaan(customers,
products
dan
sales) dan tidak
diorganisasikan pada area-area aplikasi utama(customer invoicing,
stock control dan product sales). Hal
ini dikarenakan kebutuhan dari
data
warehouse
untuk menyimpan data-data yang bersifat sebagai
penunjang suatu keputusan, dari pada
aplikasi
yang
berorientasi
terhadap
data.
Jadi
dengan
kata lain,
data
yang
disimpan
adalah
berorientasi kepada subjek bukan terhadap proses.
  
24
Operasional
Data warehouse
Auto
Customer
Life
Policy
Health
Premium
Casuality
Claim
Gambar 2.3  Data warehouse subject oriented
2.   Integrated
Data warehouse dapat menyimpan data-data yang berasal dari
sumber-sumber
yang
terpisah
kedalam suatu
format
yang
konsisten
dan saling terintegrasi satu dengan lainnya. Dengan demikian data
tidak bisa
dipecah-pecah
karena
data
yang
ada
merupakan
suatu
kesatuan
yang
menunjang
keseluruhan
konsep data
warehouse
itu
sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai
cara
sepeti
konsisten
dalam penamaan
variabel,
konsisten
dalam
ukuran variabel, konsisten dalam struktur pengkodean dan konsisten
dalam atribut fisik dari data.
  
25
Gambar 2.4 Pokok persoalan dari integrasi (Inmon, 2005, p31).
3.   Time Variant
Model analisis
yang diterapkan pada sebuah data warehouse
berfokus pada perubahan data
faktual berdasarkan
waktu. Dalam hal
ini data warehouse harus mampu menyimpan data untuk suatu objek
tertentu
dalam kurun
waktu
yang
berbeda-beda.
Waktu
merupakan
bagian data yang sangat penting di dalam data warehouse
  
26
Operational
Data Warehouse
Time horizon – current to 60-90 days
Time Horizon – 5 – 10 Years
Update of Records
Sophisticated snapshots of data
Key structure may or may not contain
key structure contains an element of time
element of time
Gambar 2.5 Time Variant (Inmon, 2005, p32).
4.   Non-volatile
Karakteristik
keempat
dari data
warehouse
adalah
non-
volatile, maksudnya data pada data warehouse tidak di-update secara
real time tetapi di refresh dari sistem operasional secara reguler. Data
yang
baru
selalu
ditambahkan
sebagai
suplemen
bagi database
itu
sendiri dari pada sebagai sebuah perubahan. Database tersebut secara
kontinu
menyerap
data
baru
ini, kemudian
secara incremental
disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat melakukan
update,
insert
dan
delete terhadap
data
yang
mengubah
isi
dari
database
sedangkan pada data
warehouse
hanya ada dua kegiatan
memanipulasi
data
yaitu
loading
data
(mengambil
data)
dan
akses
data 
(mengakses 
data 
warehouse  seperti 
melakukan 
query 
atau
  
27
menampilan
laporan
yang dibutuhkan,
tidak
ada
kegiatan
updating
data).
Gambar 2.6 Pokok persoalan dari nonvolatile (Inmon, 2005, p32).
2.1.6.3  Bentuk Data Warehouse
Berikut ini adalah bentuk-bentuk dari data warehouse :
2.1.6.3.1
Functional Data Warehouse
Functional  data  warehouse 
ini  merupakan  bentuk
database dimana data warehouse dibuat lebih dari satu dan
dikelompokkan 
berdasarkan 
masing-masing 
fungsi 
yang 
ada
dalam perusahaan,
seperti
fungsi financial
/
keuangan,
fungsi
marketing
/
pemasaran,
fungsi
kinerja personalia,
dan
lain-lain.
Keuntungan dari bentuk ini adalah sistem akan
mudah dibangun
dengan  biaya  yang  relatif  murah.  Kerugian  dari  penggunaan
bentuk
ini
adalah
resiko
kehilangan konsistensi data dan
terbatasnya kemampuan pengguna dalam hal pengumpulan  data.
  
28
Source
Branch
Function
Data
Warehouse
Source
Function
Data
Warehouse
Operasional
Workstation
Gambar 2.7
Functional Data Warehouse
2.1.6.3.2
Centralized Data Warehouse
Centralized   data 
warehouse   ini  merupakan   database
fisikal tunggal yang memuat semua data untuk area fungsional
yang  khusus,  departemen,  divisi,  atau  perusahaan. 
Data
warehouse ini digunakan ketika terdapat kebutuhan akan data
informasional 
dan 
terdapat 
banyak  end-user
yang 
sudah
terhubung ke komputer pusat atau jaringan.
Bentuknya menyerupai functional
data warehouse, akan
tetapi sumber datanya lebih dahulu dikumpulkan atau
diintegrasikan
pada
suatu
tempat terpusat,
baru
kemudian
data
tersebut
dibagi-bagi
berdasarkan fungsi-fungsi yang dibutuhkan
oleh
perusahaan.
Bentuk data
warehouse terpusat ini sering
digunakan
oleh
perusahaan-perusahaan
yang
belum mempunyai
jaringan    eksternal.    Keuntungan    bentuk    centralized   data
  
29
warehouse ini adalah data benar-benar terpadu karena konsistensi
yang
tinggi.
Namun
demikian
membutuhkan
waktu
yang
lama
dan biaya yang mahal dalam membentuk data warehouse seperti
ini.
Source
Source
Centralized
data
warehouse
Function
Data
Warehouse
Source
Function
Data
Warehouse
Operation
Gambar 2.8  Centralized Data Warehouse
Workstation
2.1.6.3.3
Distributed Data Warehouse
Distributed   data   warehouse   adalah  data   warehouse
dimana komponen tertentu dari data warehouse
tersebut
didistribusikan
melewati
sebuah database
fisikal
yang
berbeda.
Distributed data warehouse biasanya melibatkan data yang paling
teredundansi,
dan
sebagai
akibatnya,
menimbulkan
proses
load
dan update yang sangat kompleks.
Distributed
data
warehouse
ini menggunakan gateway
yang
berfungsi
sebagai
jembatan
antara
lokasi data
warehouse
dengan
workstation
yang
menggunakan
sistem yang
beranekaragam,   sehingga   pada   bentuk   data  warehouse  ini
  
30
memungkinkan perusahaan untuk mengakses sumber data yang
terdapat
diluar
lokasi
perusahaan
(eksternal).
Bentuk data
warehouse ini
mempunyai kelebihan dalam hal pengaksesan data
dari luar perusahaan yang telah mengalami
sinkronisasi terlebih
dahulu dan tetap terjaga konsistensinya. Tetapi bentuk ini juga
memiliki kerugian yaitu bentuk ini merupakan yang paling mahal
dan paling kompleks untuk diterapkan karena sistem operasinya
dikelola secara terpisah.
Source
Source
Data
warehouse
Gateway
Source
Operation
Workstation
Gambar 2.9  Distributed Data Warehouse
2.1.6.4 Struktur Data warehouse
Level  kedetailan  data  dalam  struktur  data warehouse terbagi
menjadi 5 tingkat yaitu:
1. Old Detail Data
Data ini merupakan data historis dari current detail data, dapat
berupa hasil cadangan atau archive data yang disimpan dalam storage
  
31
terpisah. 
Karena 
bersifat 
back-up(cadangan),
maka 
biasanya 
data
disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang rendah.
Penyusunan file atau directory dari data ini di susun berdasarkan umur
dari data yang bertujuan mempermudah untuk pencarian atau
pengaksesan kembali.
2. Current Detail Data
Current
detail
data
merupakan
data
detil
yang
aktif saat
ini,mencerminkan keadaan yang sedang berjalan dan merupakan level
terendah
dalam data
warehouse.
Didalam
area
ini
warehouse
menyimpan
seluruh
detail data
yang terdapat pada
skema
basis
data.
Jumlah
data
sangat
besar
sehingga
memerlukan
storage
yang
besar
pula dan dapat diakses secara cepat. Dampak negatif yang ditimbulkan
adalah kerumitan untuk mengatur data menjadi meningkat dan biaya
yang diperlukan menjadi mahal.
3. Light Summarized Data
Data
ini
merupakan
ringkasan
atau
rangkuman
dari current
detail data. Data ini dirangkum berdasar periode atau dimensi lainnya
sesuai dengan kebutuhan.
Ringkasan dari current
detail
data  
belum
bersifat
total
summary.Data-data
ini
memiliki detil
tingkatan yang lebih tinggi
dan
mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan
  
32
data ini di sebut juga dengan data mart. Akses terhadap data jenis ini
banyak 
digunakan
untuk view suatu kondisi
yang sedang atau sudah
berjalan.
4. Highly Summarized Data
Data
ini
merupakan
tingkat
lanjutan
dari Lightly
summarized
data, merupakan
hasil ringkasan
yang bersifat totalitas, dapat di akses
misal
untuk
melakukan analisis perbandingan data berdasarkan urutan
waktu tertentu dan analisis menggunakan data multidimensi.
5. Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat
jenis data diatas. Menurut Poe (1996),
metadata
adalah ‘data tentang
data’ dan menyediakan
informasi tentang struktur data dan
hubungan
antara struktur data di dalam atau antara storage (tempat penyimpanan
data).
Metadata berisikan data yang menyimpan proses perpindahan
data
meliputi
database structure ,
contents,detail data dan
summary
data, matrics , versioning, aging criteria , versioning, transformation
criteria. Metadata khusus dan memegang peranan yang sangat penting
dalam data warehouse.
Metadata sendiri mengandung :
1. Struktur data
  
33
Sebuah direktori yang membantu user untuk melakukan
analisis Decission Support System dalam pencarian letak atau lokasi
dalam data warehouse.
2. Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri
merupakan panduan
untuk algoritma dalam melakukan pemrosesan
summary data antara current detail data dengan lightly summarized
data dan antara lightly summarized data dengan highly summaried
data.
3. Mapping
Sebagai panduan pemetaan (mapping) data pada saat data di
transform/diubah
dari
lingkup
operasional
menjadi
lingkup data
warehouse.
  
34
Gambar 2.10 Struktur data warehouse Inmon(2005, p34)
2.1.6.5 Arsitektur Data Warehouse
Menurut
Connoly
(2002,
p1052),
ada sepuluh
komponen
utama
yang dimiliki oleh data warehouse yaitu:
1.   Operasional Data
Sumber  data  untuk  data warehouse bersumber  dari  data-data
berikut:
-
Mainframe data operasional yang ada dalam jaringan database.
-
Data departemental yang ada dalam hak akses dalam sistem file.
-
Data privasi di simpan di dalam server pribadi dan workstation.
  
35
-
Sistem external, seperti internet, atau database yang terkait dengan
customer dan suppliers.
2.   Operasional Datastore
Tempat penyimpanan data operasional yang sifatnya saat ini dan
terintegrasi dan dipakai untuk analisis. Biasanya operational datastore
terstruktur dan tersuplai dengan data dengan cara yang sama dengan
data warehouse.
Tetapi
memungkinkan
untuk
memindahkan
ke data
warehouse secara sederhana.
3.   Load Manager
Load
manager
disebut
juga
sebagai
komponen front-end,
menampilkan 
semua 
operasi  gabungan 
dengan 
menarik 
dan
menyimpan
data
ke data warehouse.
Data
bisa
langsung dikeluarkan
langsung dari sumber data, atau data store operasional. Operasi yang
dilakukan
load
manager,
bisa
termasuk
transformasi
sederhana
dari
data untuk menyiapkan data yang akan dimasukan data warehouse.
4.   Warehouse Manager
Menangani semua operasi yang berhubungan dengan management
data
dalam data
warehouse.
Operasi-operasi
yang
dijalankan
oleh
warehouse manager, mencakup:
a. Analisis data untuk menjaga kekonsistenan data.
  
36
b. Melakukan transformasi dan pengabungan sumber data dari tempat
penyimpanan sementara ke dalam tabel-tabel data warehouse.
c. Melakukan denormalisasi (jika perlu).
d. Melakukan aggregations (jika perlu).
e. menyimpan (archive) dan backup data.
5.   Query Manager
Query manager disebut juga sebagai component backend, untuk
menangani semua operasi yang berhubungan dengan manajemen
permintaan user
(user
queries).
Operasi
yang dijalankan
oleh query
manager meliputi kegiatan mengarahakan permintaan ke tabel-tabel
data 
yang 
tepat 
dan 
melakukan  penjadwalan  eksekusi  pada
permintaan.
6.   Detailed Data
Pada bagian ini, warehouse menyimpan detail semua data dalam
skema
database
yang
umumnya
detail
data tidak
disimpan
secara
online, tetapi ada dengan
meng-aggregate
data
sama  tingkat
detail
berikutnya.
7.   Lightly and Highly Summarized Data
Disini
warehouse
menyimpan
semua
data
yang dihasilkan
oleh
manager warehouse
secara
light dan high. Tujuannya untuk
meningkatkan kecepatan performa dari query.
  
37
8.   Archive / Back-up Data
Digunakan untuk menyimpan detailed data dan data
yang
telah
diringkas. Tujuannya adalah untuk penyimpanan(archiving)
dan
backup. Data kemudian ditransfer ke
media
penyimpanan
seperti
magnetic tape atau optical disk.
9.   Metadata
Bagian ini digunakan untuk penarikan dan peyimpanan proses
data, proses management warehouse. Dan juga, bagian dari proses
management query.
10. End-user Access Tools
Prinsip tujuan dari data warehouse,
adalah
untuk
menyediakan
informasi
sebagai
bantuan bagi
para pengguna
dalam bidang
bisnis,
ynng melakukan strategi untuk pengambilan keputusan. Menurut
beberapa
ahli, End-user access
tools
dapat
dikategorikan
menjadi
5
golongan utama, yaitu:
a. Reporting and Query Tools
Reporting tools
meliputi
production
reporting
tools dan
report writer. Production reporting tools digunakan untuk
menghasilkan laporan operasional reguler atau daya pemicu kerja
yang tinggi. Seperti order customer, invoice, dan gaji karyawan.
Query
tools
untuk
relasional
data
warehouse,
di-design
untuk
menerima SQL dan syntax-nya, untuk query penyimpanan
  
38
data untuk data warehouse. Tools ini, melindungi end users dari
kompleksitas SQL dan struktur database.
b. Application Development Tools
Kebutuhan dari end user, kemampuan membuat
laporan
yang built-in dan tools query yang tidak
mencukupi, dikarenakan
kebutuhan analisis tidak bisa dilakukan, atau karena interaksi user
membutuhkan tingkat profesional yang tinggi.
c. Executive Information System (EIS) tools
EIS   lebih   dikenal   sebagai   ‘Everybody’s   information
system’
yang semula dikembangkan untuk mendukung strategi
kebutuhan
tingkat tinggi. Tools
EIS
mulanya
terasosiasi dengan
mainframe, sehingga memungkinkan user membuat aplikasi
pendukung pengambilan keputusan, dalam menyediakan overview
data organisasi dan mengakses sumber data eksternal.
d. OnLine Analitical Proccessing (OLAP) tools
Pengguna
yang
handal OLAP
tools
berbasis
pada konsep
basis
data
multi-dimensi
dan
memperbolehkan pengguna
untuk
menganalisis data multi-dimensional view yang kompleks.
  
39
e. Data Mining Tools
Data mining adalah proses
yang
memiliki makna tentang
korelasi yang baru, patterns, dan trend dengan data dalam jumlah
besar
menggunakan
teknik
statistik,
matematika,
dan
kecerdasan
buatan. Data mining memiliki potensi untuk menggantikan
kemampuan  dari  OLAP  tools,  sebagai  penampilan  utama  dari
data mining
adalah
kemampuan
untuk
membangun
prediksi
dibandingkan dengan model-model retrospective.
2.1.6.6 Data Warehouse Data Flows
Data flows yang ada
pada data warehouse terdiri dari 5 bagian,
yaitu, :
-
Inflow
Proses   yang   berhubungan   dengan   penarikan,   pembersihan,   dan
mengisi data dari sumber ke dalam data warehouse.
-
Upflow
Proses
yang terhubung dengan
menambahkan
nilai ke data di dalam
warehouse, melewati ringkasan pengepakan, dan penyebaran data.
-
Downflow
Prosesnya berhubungan dengan penyimpanan dan back-up data dalam
data warehouse.
-
Outflow
Proses
yang berhubungan
dengan
membuat data tersedia untuk end-
users.
  
40
-
Meta-flow
Proses yang berkaitan dengan manajemen meta-data.
2.1.6.7 Data mart
Data mart yang akan dibahas meliputi :
2.1.6.7.1 Pengertian Data Mart
Menurut Kimball (2002, p396), Datamart adalah bagian
dari
logikal
dan
fisikal
dari
area
cakupan
yang dimiliki
oleh
data warehouse. Sedangkan menurut Connoly dan Begg (2005,
p1171)  Data  mart merupakan  bagian  dari  data  warehouse,
yang mendukung kebutuhan informasi bagian departemen atau
fungsi bisnis tertentu.
2.1.6.7.2 Karakteristik Data mart
Karakteristik  -  karakteristik  yang  terdapat  pada  data
mart adalah sebagai berikut:
1.   Data mart memfokuskan hanya pada kebutuhan-kebutuhan
pemakai
yang terkait dalam sebuah departemen atau
fungsi
bisnis.
2.   Data mart biasanya  tidak  mengandung  data  operasional
yang rinci seperti pada data warehouse.
3. Data
mart 
hanya 
mengandung 
sedikit 
informasi
dibandingkan
dengan
data
warehouse.
Data mart
lebih
mudah dipahami dan dinavigasi
  
41
2.1.6.8 Skema Bintang / Star Schema
Teori skema bintang meliputi :
2.1.6.8.1 Pengertian Skema Bintang
Menurut Connolly (2002, p1079), skema bintang adalah
struktur logikal yang mempunyai sebuah table fakta yang berisi data
fakta di tengah dan dikelilingi oleh table-tabel dimensi yang berisi
data referensi atau keterangan yang biasanya dapat didenormalisasi.
Menurut Inmon (2005, p128), skema bintang adalah struktur
desain
yang
dibutuhkan
untuk mengatur
data
dengan
cara
denormalisasi  dalam  jumlah  yang  besar  ke  dalam  sebuah  entity
dalam sebuah data mart untuk mengoptimalkan akses data.
Kesimpulannya, skema bintang adalah suatu stuktur  logikal
data  yang mempunyai suatu tabel fakta yang dikelilingi oleh tabel-
tabel multidimensi serta kompatibel dengan kebutuhan bisnis.
2.1.6.8.2 Karakteristik dari Skema Bintang
Skema
bintang
memiliki
beberapa
macam karakteristik
sebagai berikut:
1. Pusat skema bintang adalah fact table.
2. Fact  table  berisi   indikator   –   indikator   kinerja   pokok/Key
Performance Indicators.
3. Indikator  –  indikator  kinerja  pokok  tersebut  adalah  atribut  –
atribut dari fact table.
  
42
4. Obyek – obyek informasi dan waktu adalah kunci utama dari fact
table.
5. Tabel di sekeliling fact table adalah dimension table.
6. Tiap dimension table di-relasikan fact table berdasarkan primary
key-nya.
7. Skema
bintang
diimplementasikan
menggunakan
teknologi
database relasional.
2.1.6.8.3 Keuntungan Menggunakan Skema Bintang
Skema  bintang  memiliki  keuntungan  yang  tidak  didapat  oleh
skema relasional biasa. Keuntungan skema bintang, antara lain:
1.   Respon 
data 
yang 
lebih 
cepat 
dihasilkan 
dari 
perancangan
database.
2.   Kemudahan dalam mengembangkan atau memodifikasi data terus
berubah.
3.   End user dapat  menyesuaikan  cara  berpikir  dan  menggunakan
data, konsep ini dikenal juga dengan istilah pararel dalam
perancangan database.
4.
Menyederhanakan
pemahaman
dan
penelusuran metadata
bagi
pemakai dan pengembang.
  
43
2.1.6.8.4 Perancangan Skema Bintang
Skema bintang memiliki dua macam tabel, yaitu;
1.
Tabel Fakta (Fact Table)
Merupakan  tabel  yang  umumnya  mengandung  angka  dan
data
history dimana
key
(kunci)
yang
dihasilkan
sangat
unik,
karena
key
tersebut
terdiri
dari foreign
key (kunci
asing)
yang
merupakan
primary
key (kunci
utama)
dari
beberapa
dimension
table yang berhubungan. Tabel fakta sering juga disebut major
table.
2.
Tabel Dimensi (Dimension Table)
Tabel yang berisikan kategori dengan ringkasan data detail
yang dapat dilaporkan. Seperti laporan laba pada tabel fakta  dapat
dilaporkan
sebagai
dimensi waktu(yang
berupa
perbulan,
perkuartal   dan   pertahun).Tabel   dimensi   sering   juga   disebut
sebagai minor table.
2.1.6.8.5 Ketentuan Pembacaan Skema Bintang
Adapun  ketentuan  pembacaan  skema  bintang  adalah  sebagai
berikut:
1.   Bagian yang ada di bawah tabel adalah kolom-kolom dari tabel.
2.   Primary key dan foreign key diberi kotak.
3.   Primary key diarsir, sedangkan foreign key yang bukan primary key
tidak
4.   Foreign key
yang 
berhubungan  ditunjukan  dengan 
garis 
yang
menghubungkan tabel-tabel.
  
44
5.   Kolom yang bukan primary key atau foreign key disebut kolom data
pada tabel fakta dan atribut pada tabel dimensi.
2.1.6.8.6 Jenis-Jenis Skema Bintang
Ada beberapa macam jenis skema bintang, yaitu:
1.   Simple Star Schema
Dalam skema ini, setiap tabel harus memiliki primary key
yang terdiri dari satu kolom atau
lebih dan primary key
tersebut
harus
bersifat
unik.
Foreign
key
adalah
kolom
pada
satu
tabel
yang nilainya didefinisikan oleh primary key pada tabel lain.
Tabel dimensi 1
Tabel Fakta
Tabel dimensi 3
Kunci 1
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 2
Kunci 3
Atribut
Atribut
...........
Atribut
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 3
Kolom Data
Kolom Data
...........
Kolom Data
Keterangan :
Kunci n
= Kunci Utama
Gambar 2.1 Simple Star Schema (Poe, 1996, p124)
  
45
Kunci 1
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 3
Kunci 2
Kolom Data
............
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 3
Kunci 2
Kolom Data
............
Kunci 3
Atribut 
Atribut 
........... ...........
Atribut 
Kunci 1
Kunci 2
Kunci 3
Kolom Data
............
Tabel dimensi
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 2
Kunci 3
Kolom Data
............
2.   Multiple Fact Star Schema
Skema bintang dapat
memiliki lebih dari satu tabel fakta,
karena adanya
fakta
yang tidak saling berhubungan.
Misalnya di
samping penjualan, terdapat tabel fakta forecasting dan tabel fakta
result. Walaupun terdapat banyak tabel fakta, tabel dimensinya
tetap digunakan bersama-sama.
Tabel dimensi
Tabel Fakta
Kunci 1
Atribut
Atribut
...........
Atribut
Tabel Fakta
Tabel dimensi
Kunci 3
Atribut
Atribut
Atribut
Gambar 2.2  Multiple Fact Star Schema (Poe, 1996, p126)
  
46
2.1.6.8.7 Variasi Skema Bintang
Variasi-variasi yang ada pada skema bintang adalah
1.
Skema Snowflake
Snowflake  
merupakan variasi lain dari skema bintang
dimana tabel dimensi dari skema bintang tidak mengandung atau
berisi  data  yang  didenormalisasi.  Prinsip  dasar  dari  skema  ini
tidak jauh berbeda dari skema bintang. Penggunaan tabel dimensi
sangatlah menonjol, karena itulah perbedaan mendasar dari skema
bintang dan skema
snowflake. Skema snowflake menggunakan
beberapa tabel fakta dan tabel dimensi yang sudah mengalami
normalisasi,  sedangkan  skema  bintang  menggunakan  tabel
dimensi
yang
masih
denormalisasi.
Skema
snowflake
dibuat
berdasarkan  OLTP  sehingga  semua  data  akan  termuat  detail
dalam setiap tabel fakta dan tabel dimensi.
Keuntungan
dari
skema
snowflake
adalah kecepatan
memindahkan data
dari
data OLTP
ke dalam metadata, sebagai
kebutuhan
dari
alat pengambil
keputusan tingkat tinggi di mana
dengan tipe seperti ini seluruh struktur dapat digunakan
sepenuhnya, dan banyak yang
beranggapan lebih nyaman
merancang dalam normal ketiga.
Kerugian yang didapat adalah memiliki masalah besar
dalam hal
kinerja
(performance),
hal
ini
disebabkan
semakin
banyaknya
join
antar
tabel-tabel
yang
dilakukan
dalam skema
snowflake ini maka semakin lambat kinerja yang dilakukan.
  
47
2.
Skema Bintang dengan 2 Tabel Fakta
Sebuah   skema   bintang   yang   menyediakan   atribut   yang
lengkap, konsisten, dan mudah
dimengerti memungkinkan bagi
pemakai untuk memperoleh penampilan data yang mudah digunakan
dan mudah dimengerti. Perancangan skema bintang yang baik
membantu pemakai untuk menulis pencarian yang diinginkan dengan
cara yang dimengerti.
2.1.6.9 Metodologi Perancangan Data Warehouse
Menurut Connolly (2002, p1083) Metodologi Perancangan Data
Warehouse nine-steps methodology yang terdiri dari:
a. Pemilihan Proses
Sebuah  proses  (fungsi)  mengarahkan  tentang  sebuah  subjek
yang ada pada
suatu data
mart.
Data mart
yang
pertama
dibangun
harus
bisa
disampaikan
pada
waktunya, sesuai dengan anggaran dan
menjawab sebagian besar pertanyaan bisnis yang penting. Pilihan yang
paling tepat untuk
data mart adalah
yang terkait dengan penjualan.
Sumber data sebaiknya yang mudah diakses dan berkualitas tinggi.
Sebagai
contoh, dalam memilih data mart yang pertama untuk
DreamHome pertama kali kita menentukan proses bisnis diskrit dari
DreamHome meliputi:
-
Properti sales
-
Properti rentals (leasing)
-
Properti Viewing
  
48
-
Properti advertising
-
Properti maintenance
b. Pemilihan Grain
Keputusan grain untuk tabel fakta menentukan grain dari setiap
tabel dimensi. Sebagai contoh,
jika
grain
untuk
tabel
fakta property
sales adalah individualnya dari property sale, maka grain dari dimensi
klien adalah detail dari klien yang mewakili properti tertentu.
c. Identifikasi Dimensi
Tabel dimensi menyiapkan konteks untuk menanyakan
pertanyaan
tentang
fakta
yang
ada
didalam tabel
fakta.
Kumpulan
dimensi yang dibuat dengan baik akan mempermudah dalam mengerti
dan mengunakan data mart.
Kemudian mengidentifikasikan detail
dimensi  yang  secukupnya  untuk  mengambarkan  klien  dan  properti
pada grain yang tepat Sebagai contoh, setiap klien dari tabel dimensi
ClientBuyer   
digambarkan dengan atribut clientID,
clientNo.
clientName, clientType, city, region, dan country. Ketidaklengkapan
dari dimensi yang dikumpulkan akan mengurangi fungsi dari data mart
sampai ke enterprise.
Jika
ada
dimensi
yang
sama
dalam
dua data mart,
maka
keduanya pasti memiliki dimensi yang sama atau salah satunya pasti
melengkapi
yang
lainya.
Hanya
dengan
cara
ini
dua
data mart bisa
berbagi dalam satu atau
lebih dimensi
yang ada dalam aplikasi yang
  
49
sama.
Ketika
dimensi
digunakan
dalam lebih
dari
satu data
mart,
dimensi yang satunya harus bisa disesuaikan. Sebagai contoh dimensi
yang harus disesuaikan antara property sales dan property advertising
adalah
dimensi time,
PropertyForSale,
Branch, dan
Promotion.
Jika
dimensi-dimensi
ini tidak sesuai atau
mereka
dibiarkan
menyimpang
dari sinkronisasi diantara data mart, maka keseluruhan data pada data
warehouse akan gagal, Dikarenakan kedua data mart
tidak dapat
digunakan bersama-sama.
d. Pemilihan Fakta
Grain  dari tabel fakta
menentukan  fakta 
mana  yang  bisa
dipakai
dalam data
mart. Semua
fakta
harus dinyatakan
secara
pasti
oleh grain.
Dengan kata
lain, jika grain dari tabel fakta merupakan
indiviual property sale, maka semua fakta numeric harus menunjuk
kepada bagian penjualan tertentu. Fakta juga harus numerik dan
ditambah. Tambahan fakta lainnya bisa ditambah ke dalam tabel fakta
kapan saja selama fakta itu konsisten dengan grain
dari tabel itu.
e. Penyimpanan perhitungan data yang ada didalam tabel fakta
Ketika semua fakta sudah ditentukan, maka fakta ini harus
diperiksa kembali. Apakah fakta ini dapat dipakai atau tidak. Contoh
umum
fakta
yang
dipakai adalah
kebutuhan sebuah
toko
ketika
fakta
yang ada dapat membandingkan laba dan rugi. Situasi ini dapat terjadi
ketika tabel fakta berdasarkan invoice atau sales.
  
50
f. Mengumpulkan semua tabel dimensi
Pada
tahap
ini,
kita
kembali
ke
dalam dimensi
tabel
dan
menambah deskripsi yang sebanyak-banyaknya. Deskripsi harus jelas
dan
mudah
dimengerti
sehingga
cukup jelas. Sebagai contoh, tabel-
tabel dimensi yang telah diperiksa dan akan dipakai dikumpulkan dan
disusun kembali agar mudah dimengerti.
g. Pemilihan Durasi Database
Durasi dapat mengatur seberapa jauh tabel fakta ini dapat
berlaku. Sebagian besar perusahaan, mempunyai kebutuhan untuk
melihat data pada periode tertentu dalam
jangka waktu satu atau dua
tahun. Untuk tipe perusahaan lainnya, seperti asuransi. Mungkin
membutuhkan data yang periodenya lebih lama yaitu sekitar lima atau
lebih dari lima tahun. Ada 2 fakta yang besar yang dapat diambil dari
design data warehouse. Pertama, Semakin tua suatu data semakin sulit
unuk digunakan atau dibaca. Kedua, dimensi yang dibunakan adalah
dimensi yang lebih lama bukan yang saat ini. Masalah seperti ini
dikenal
juga sebagai
masalah Slowly Changing dimension
yang
akan
dibahas lebih detail pada point berikutnya.
h. Menelusuri Perlahan Perubahan Tabel Dimensi
Yang
dimaksud
dengan
masalah slowly changing dimension,
contohnya adalah deskripsi yang jelas tentang klien dan cabang yang
sudah lama haurs dipakai dengan data transaksi yang lama. Data yang
  
51
penting
seperti    ini    harus    dibuat    kunci    yang    umum    untuk
menghilangkan snapshot yang ganda dari data klien dan cabang dalam
periode tertentu.
Ada tiga tipe dasar dari dimensi yang berubah secara perlahan,
yang pertama ketika atribut dari dimensi ditulis kembali, yang kedua
ketika
terjadi
perubahan dimensi menyebabkan
adanya
tabel
dimensi
yang baru yang dibuat, yang ketiga perubahan atribut dimensi
menyebabkan atribut alternatif dibentuk sehingga baik nilai yang lama
dan
yang baru
dapat di akses
secara bersamaan
pada
tabel
dimensi
yang sama.
i. Penentuan Prioritas dan Cara Query
Dalam langkah
ini,
memperkirakan untuk
membuat rancangan
fisikal.
Yang
paling
penting dalam rancangan
fisikal
yang
memperngaruhi persepsi data mart
end-user’s adalah urutan dari
perintah
fisikal
yang
ada
dalam tabel
dan
ketersediaan
ringkasan.
Dibalik semua ini ada tambahan rancangan fisikal yang mempengaruhi
administration, backup, indexing performance, dan security.
Pada
langkah terakhir dalam metodologi
ini,
harus
merancang
data mart
yang
mendukung
kebutuhan
bisnis proses dan juga
mempermudah
dalam integrasi
dengan
lain
yang
terkait
dengan
data
mart untuk data warehouse sebuah perusahaan.
  
52
2.1.7
Estimasi Disk
Ada beberapa langkah yang perlu diikuti dalam menghitung kapasitas
disk:
1.   Menentukan jumlah baris didalam tabel (num_rows)
2.   Ukuran tergantung pada tipe data dan panjangnya
-
Jumlah kolom (num_cols)
-
Jumlah fixed length column (byte) (fixed_datasize)
-
Jumlah variable length column (Num_variable_cols)
-
Ukuran maksimal variable length column (max_var_size)
3.   Menghitung null bitmap jika dalam tabel terdapat fixed length
column
Null bitmap (null_bitmap) = 2 + ((Num_cols+7):8)
4.   Menghitung  kapasitas  jika  terdapat  variable length column
dalam tabel
Total size of variable length columns (variable_data_size) =
2+(num_variable_cols x 2) + max_var_size
5.   Menghitung ukuran baris
Total
row
size
(row_size)
=
fixed_data_size
+
variable_data_size + Null bitmap +4
6.   Menghitung jumlah baris per halaman (8096 byte per page)
Numbers 
of 
rows 
per 
page 
(Rows_per_page
8096 
:
(row_size + 2)
  
53
7.   Jika terdapat clustered index didalam tabel, maka menghitung
free rows per page didasarkan pada fill factor. Jika tidak ada
clustered
index
yang
dibuat,
maka
fill
factor diasumsikan
sebagai 100.
Number of free row per page(Free_rows_per_page) = 8096 x
((100 – fill factor) : 100) : (row_size+2)
8. Menghitung 
jumlah 
halaman 
yang 
dibutuhkan 
untuk
menyimpan semua baris
Number of pages (num_pages)= num_rows : (rows_per_page
free_rows_per_page)
9.   Menghitung kapasitas yang dibutuhkan untuk menyimpan
data dalam tabel (8192 byte per pages)
Tabel size (bytes) = 8192 x num_pages
Menghitung ukuran tabel dengan index
Berikut
ini cara
yang digunakan
untuk
menghitung tabel
yang didalamnya terdapat index:
1.   Menghitung kapasitas yang digunakan untuk menyimpan data
2.   Menghitung
kapasitas
yang
digunakan
untuk
menyimpan
index
clustered
3.   Menghitung
kapasitas
yang
digunakan
untuk
menyimpan
index
non-clustered
4.   Menghitung nilai-nilai yang telah dihitung diatas
  
54
Pada setiap perhitungan selalu mencantumkan jumlah baris yang akan
ada didalam tabel.
Number of rows in the table = num_rows
Menghitung kapasitas yang digunakan untuk menyimpan data:
-
space used to store data = data_spaced_used
Menghitung kapasitas yang digunakan untuk menyimpan index:
1.   Definisi  dari  index dapat  berupa  fixed length dan  variable length
column
Jumlah kolom dalam index key (num_key_cols)
Jumlah semua fixed length column key (byte) (fixed_key_size)
Jumlah
variable
length
column
dalam
index
key
(num_variable_key_cols)
Ukuran
maksimum
dari
variable
length
column
key
(max_var_key_size)
2.   Index Null Bitmap (Index_Null_bitmap) = 2+((Num_key_cols + 7): 8)
3.   Jika  terdapat  variable length column dalam  index,  maka  dihitung
berapa  kapasitas  yang  digunakan  untuk  menyimpan  kolom  dalam
baris index.
Total
size
of
variable
lenght
columns
(variable_key_size)
=
2+(num_variable_key_cols x 2) + max_var_key_size
4.   Menghitung ukuran baris index
  
55
Total
index
row
size
(Index_row_size)
=
fixed_key_size
+
variable_key_size + index_null_bitmap + 1 + 8
5.   Menghitung jumlah baris per halaman (8096 byte per page)
Number
of
index
rows
per
page
(Index_rows_per_page)
=
8096
:
(index_row_size + 2)
6.   Menghitung  jumlah 
halaman 
yang  dibutuhkan  untuk 
menyimpan
semua baris index pada setiap level dari index
Number of pages (level 0) (num_pages_level_0) = (data_space_used :
8192) : index_rows_per_page
Number
of
pages
(level
1)
(num_pages_level_0)
=
num_pages_level_0 : index_rows_per_page
Perhitungan  terus  dilakukan  sampai  level n (num_pages_level_n)
sama dengan satu (index root page)
Menghitung  jumlah 
halaman 
yang  dibutuhkan  untuk 
menyimpan
setiap level dari index
Total number of pages (num_index_pages) = num_pages_level_0 +
num_pages_level_1 + .... + num_pages_level_n
7.   Menghitung
ukuran index (8192 byte per page) index size (bytes) =
8192 x num_index_pages
Menghitung ukuran tabel
Total tabel size (bytes) = data_space_used + clustered_index_size +
non-clustered_index_size + .....n
  
56
Menghitung pertumbuhan setiap tahun selama lima tahun
1.   Menghitung master
Rn = R
(n-1)
* (1 + i )
n
R = Jumlah record
n = Tahun
i = Persentase Pertumbuhan data, sebesar 10%
2.   Menghitung Transaksi
Rn = R
(n-1) 
+ R
(n-1) 
* (1 + i )
R = Jumlah record
n = Tahun
i = Persentase Pertumbuhan data, sebesar 10%
2.2 Teori Khusus
Teori
khusus
yang
akan
diuraikan
mengenai business intelligence, internet,
Enterprise Resource Planning (ERP), Data Flow Diagram (DFD), State Transition
Diagram (STD), sistem penjualan, sistem pembelian, dan sistem persediaan.
2.2.1 Business Intelligence
Teori mengenai business intelligence meliputi :
2.2.1.1
Pengertian Business Intelligence
Business
intelligence (BI)
merupakan
sistem dan
aplikasi
yang
berfungsi
untuk
mengubah
data-data dalam
suatu
perusahaan
atau
organisasi (data operasional, data transaksional, atau data lainnya) ke
dalam bentuk pengetahuan.
Aplikasi
ini
melakukan analisis data-data di
  
57
masa lampau, menganalisisnya dan kemudian menggunakan pengetahuan
tersebut untuk mendukung keputusan dan perencanaan organisasi.
2.2.1.2
Manfaat Business Intelligence
Beberapa keuntungan
yang bisa didapatkan bila suatu organisasi
mengimplementasikan business intelligence adalah sebagai berikut:
a. Meningkatkan nilai data dan informasi organisasi
Melalui
pembangunan
business
intelligence,
maka
seluruh
data
dan informasi dapat diintegrasikan sedemikian rupa sehingga
menghasilkan pengambilan keputusan yang lengkap. Informasi-
informasi
yang
dulunya
tidak 
dicakupkan sebagai salah satu faktor
pengambilan  keputusan  (terisolasi)  dapat  dengan  mudah  dilakukan
‘connect
and
combine’ dengan
menggunakan
business intelligence.
Data dan informasi yang dihasilkan pun juga menjadi lebih mudah
diakses dan lebih mudah untuk dimengerti  (friendly-users info).
b. Memudahkan pemantauan kinerja organisasi
Dalam mengukur kinerja suatu organisasi seringkali dipergunakan
ukuran  yang  disebut  Key Performance Indicator (KPI).  KPI  tidak
selalu diukur dengan satuan uang, namun dapat juga berdasarkan
kecepatan
pelaksanaan suatu
layanan. Business
intelligence
dapat
dengan mudah menunjukkan pencapaian KPI suatu organisasi dengan
mudah, cepat dan
tepat.
Dengan demikian akan
memudahkan pihak -
  
58
pihak
yang
terlibat
dalam
pengambilan
keputusan
untuk
langkah
-
langkah antisipasi yang diperlukan.
c. Meningkatkan nilai investasi teknologi informasi yang sudah ada
Business Intelligence tidak
perlu/harus
mengubah
atau
menggantikan
sistem informasi
yang
sudah
digunakan
sebelumnya.Sebaliknya,
Business
Intelligence hanya
menambahkan
layanan pada sistem-sistem tersebut sehingga data dan informasi
yang
sudah 
ada 
dapat menghasilkan informasi yang komprehensif dan
memiliki kegunaan yang lebih baik.
d. Menciptakan pegawai yang memiliki akses informasi yang baik (well-
informed workers)
Dalam melaksanakan pekerjaannya sehari-hari, seluruh
level dari
suatu 
organisasi 
(mulai 
dari  pegawai/bawahan 
sampai 
dengan
pimpinan) selalu berkaitan dan/atau membutuhkan akses data dan
informasi. Business Intelligence  
mempermudah      
seluruh      
level
pegawai  dalam
mengakses  data dan      
informasi   yang   diperlukan
sehingga membantu membuat suatu keputusan.Jika seperti ini tercapai,
maka 
misi 
dan 
strategi 
organisasi yang sudah ditetapkan dapat
dengan lebih mudah terlaksana terpantau tingkat pencapaiannya.
  
59
e. Meningkatkan efisiensi biaya
Business Intelligence dapat
meningkatkan
efisiensi
karena
mempermudah   seseorang dalam melakukan
pekerjaan,
hemat
waktu
dan mudah pemanfaatannya. Waktu yang dibutuhkan untuk mencari
data dan mendapatkan informasi yang dibutuhkan semakin singkat dan
cara untuk mendapatkannya pun tidak memerlukan pengetahuan
(training) yang rumit. Dengan demikian training-training yang bisanya
sering
dilakukan
dengan
biaya
yang cukup  
besar, dapat dihemat
sedemikian rupa.
2.2.2
Internet
Teori mengenai internet meliputi :
2.2.2.1 Definisi Internet
Internet adalah kumpulan
jaringan yang mempunyai
mekanisme
berkemampuan untuk menyebarkan informasi di
seluruh
dunia
dan
sebuah
media untuk berkolaborasi dan
berinteraksi antara individu-individu dengan komputernya tanpa
memperhatikan lokasi geografisnya.
Internet 
menurut 
Oetomo  et 
al 
(2003, 
p.157)  adalah
sebuah jaringan komputer yang sangat besar yang terdiri dari
jaringan-jaringan kecil yang saling
terhubung
yang
menjangkau
seluruh dunia.
  
60
Internet yang digunakan orang saat ini, bermula dari
jaringan komputer yang digunakan oleh departemen pertahanan
Amerika Serikat. Jaringan komputer tersebut dikenal dengan
ARPANET, yang
digunakan pada saat terjadinya perang dingin
antara Amerika dengan Rusia. Selanjutnya ARPANET
dikembangkan menjadi jaringan yang lebih luas lagi yang disebut
internet. Perkembangan internet menjadi sangat pesat, karena
banyak
fasilitas
yang
ditawarkan
seperti e-mail,
USENET,
newsgroup, file transfer, telnet, bulletin board service, WWW,
Internet Telephony dan Internet Fax.
(Oetomo et al, 2003, p.71)
2.2.2.2 Mekanisme Internet
Internet  bekerja  dalam  jaringan  yang  besar,  karena  itu
untuk
melakukan
perpindahan
data antar
komputer
dibutuhkan
beberapa hal seperti alamat tujuan dan perantara (Internet Service
Provider) serta sebuah protokol untuk menjamin sampainya data
pada tujuan.
Untuk  menghubungkan  host-host  dalam  internet
digunakan
protokol
TCP/IP
(Transmission Control Protocol /
Internet  Protocol).  TCP  (Transmission  Control  Protocol)
berfungsi untuk membagi-bagi informasi yang akan dikirim
menjadi
paket
data
yang
kecil dan
merakitnya
kembali
menjadi
bentuk aslinya, sedangkan IP (Internet Protocol) berfungsi untuk
  
61
menjamin paket
yang dikirim mencapai tujuan dimana standar IP
membagi alamat menjadi sepuluh digit dengan setiap kelompok
digit memiliki referensi pengalamatan tersendiri.
TCP/IP
dibangun
dalam sistem
operasi
UNIX
dan
digunakan
oleh
internet,
menjadikan
TCP/IP sebagai
standar de
facto
untuk transmisi
data
dalam
jaringan.
Bahkan
TCP/IP
didukung
oleh
sistem operasi
jaringan
yang
memiliki
protokol
sendiri (misalnya Netware).
2.2.2.3 Protokol Aplikasi di Internet
Ada beberapa jenis protokol aplikasi dalam internet
yang
dikenal yaitu:
•   File Transfer Protocol (FTP)
Berdasarkan pendapat Oetomo et al (2003, p72) File
Transfer
Protocol
(FTP) adalah
suatu
protokol
yang
memungkinkan perusahaan dan konsumen berkomunikasi
secara interaktif dengan komputer-komputer
lain
yang sedang
terhubung
dalam internet.
FTP
menyediakan
fasilitas
penyalinan  
file secara elektronik dari
satu komputer ke
komputer lainnya melalui internet.
Berdasarkan pendapat McLeod (2001, jilid 1, p76) File
Transfer
Protocol
(FTP) adalah
perangkat
lunak
yang
memungkinkan
user
untuk
menyalin
file ke
komputer
dari
Website mana saja.
  
62
Hypertext Transfer Protocol (HTTP)
Protokol
yang
digunakan
oleh web
server
untuk
mengirim dan
menerima
informasi.
Bisa
digunakan
untuk
mengirim
dan
menerima
teks,
grafik,
gambar,
suara,
video,
dan file multimedia lainnya. (Oetomo et al, 2003, p155)
Menurut ( Wahana Komputer Semarang,
adalah sebuah protokol yang
berfungsi  sebagai  suatu  sistem  pendistribusian  dan
penggunaan informasi secara bersama di internet.
Gopher
Protokol yang dikembangkan oleh Universitas
Minnesota sebagai suatu cara untuk mengambil dokumen.
Selanjutnya,
Gopher
dimodifikasi
menjadi
sistem yang
digerakkan oleh menu yang digunakan untuk
mengambil file.
(McLeod, 2001, jilid 1, p77).
Telnet
Protokol ini digunakan untuk berhubungan dengan
komputer lain di dalam internet. (Oetomo et al, 2003, p2)
2.2.3
Data Flow Diagram (DFD)
Data Flow Diagram (DFD)
(Parno, 2000) adalah representasi
pembuatan
model
yang
memungkinkan
professional
sistem untuk
menggambarkan
sistem
sebagai
suatu
jaringan
proses
fungsional
yang
  
63
dihubungkan satu sama lain dengan alur data, baik secara manual maupun
komputerisasi.
Yang
membedakan
DFD dengan
flowchart adalah
DFD
menunjukkan
aliran
dari
data
sedangkan flowchart
menunjukkan aliran
kontrol dari suatu program. Sebuah DFD dapat juga digunakan untuk
visualisasi dari proses data.
2.2.3.1 Notasi-Notasi DFD
Ada
beberapa
notasi
yang
berbeda
dalam
mendesain
DFD.
Notasi-notasi tersebut antara lain:
Gambar 2.11   Notasi-notasi DFD
2.2.4
State Transition Diagram (STD)
Menurut
Whitten
(2004,
p673),
State
Transition Diagram
digunakan untuk menggambarkan urutan dan variasi dari layar yang bisa
ditampilkan
ketika
pengguna
sistem berada
pada
terminal.
Kita
dapat
membayangkannya
sebagai
peta
jalan.
Setiap
layar
sebagai
analogi dari
setiap   kota.   Tidak   semua   jalan   melewati   semua   kota.   Segiempat
digunakan untuk mewakili tampilan layar. Panah mewakili aliran kendali
  
64
dan kejadian pemicu yang menyebabkan layar menjadi aktif atau
mendapatkan fokus. Segiempat hanya menerangkan apa yang dapat
muncul selama interaksi. Arah panah menandakan urutan dimana layar-
layar ini ditampilkan. Setiap panah,
masing-masing
dengan
labelnya
sendiri,   digambar   dengan   arahnya   masing-masing   karena   tindakan
berbeda memicu aliran kendali dari dan kepada sebuah layar yang ada.
2.2.5
Sistem Penjualan
Penjualan  menurut  Mulyadi  (1993,  p199)  dibagi  menjadi  tiga
yaitu  penjualan  tunai,  penjualan  kredit  dan  sistem  retur  penjualan.
Sistem penjualan
tunai
dilaksanakan
oleh
perusahaan
dengan
cara
mewajibkan pembeli melakukan pembayaran harga barang terlebih
dahulu sebelum barang diserahkan oleh perusahaan kepada pembeli.
Dokumen yang digunakan yang untuk sistem penjualan tunai
adalah :
1.   Faktur penjualan tunai
2.   Bukti setor bank
3.   Pita register kas
4.   Rekap harga pokok penjualan
Sistem  penjualan  kredit  dilaksanakan  oleh  perusahaan  dengan
cara mengirimkan barang dengan order yang diterima dari pembeli dan
untuk jangka waktu tertentu, perusahaan mempunyai tagihan kepada
pembeli
tersebut.
Dokumen
yang
digunakan
untuk
sistem penjualan
kredit adalah :
  
65
1.   Surat order  pengiriman dan tembusan
2.   Faktur dan tembusan
Sistem retur
penjualan terjadi
jika
pembeli
mengembalikan
barang yang
dibelinya kepada perusahaan penjual barang tersebut.
Pengembalian barang oleh pembeli harus diotorisasi oleh bagian order
penjualan dan diterima oleh bagian penerimaan barang di perusahaan
penjualan
barang
tersebut.
Dokumen
yang
digunakan
dalam transaksi
retur penjualan adalah memo kredit dan laporan penerimaan barang.
2.2.6
Sistem Pembelian
Sistem pembelian
menurut
Mulyadi
(1993,
p305)
digunakan
dalam perusahaan
untuk
pengadaan
barang
yang
diperlukan
oleh
perusahaan. Transaksi pembelian dapat digolongkan menjadi dua yaitu
pembelian   impor   dan   pembelian   lokal.   Pembelian   lokal   adalah
pembelian dari pemasok dalam negeri, sedangkan pembelian impor
adalah pembelian dari pemasok luar negeri.
Informasi
yang
diperlukan
oleh manajemen
dari
kegiatan
pembelian adalah :
1.   Jenis  persediaan 
yang  telah 
mencapai  titik  pemesanan  kembali
(reorder point).
2.   Order pembelian yang telah dikirim oleh pemasok.
3.   Order pembelian yang telah dipenuhi oleh pemasok.
4.   Total saldo utang dagang pada tanggal tertentu.
5.   Saldo utang dagang kepada pemasok tertentu.
  
66
6.   Tambahan kuantitas dan harga pokok persediaan dari pembelian.
Dokumen yang digunakan dalam sistem pembelian adalah :
1.   Surat permintaan pembelian
2.   Surat permintaan penawaran harga
3.   Surat order pembelian
4.   Laporan penerimaan barang
5.   Surat perubahan order
6.   Bukti kas keluar
2.2.7
Sistem Persediaan
Sistem  persediaan  menurut  Mulyadi  (1993,  p555)  bertujuan
untuk mencatat mutasi tiap jenis
persediaan yang disimpan dalam
gudang.
Dalam perusahaan
manufaktur,
persediaan
terdiri
dari
:
persediaan produk jadi, persediaan produk
dalam
proses,
persediaan
bahan baku, persediaan bahan penolong, persediaan bahan habis pakai
pabrik,
dan
persediaan
suku
cadang.
Dalam perusahaan
dagang,
persediaan
hanya
terdiri
dari
satu golongan,
yaitu
persediaan
barang
dagangan, yang merupakan barang yang
dibeli
untuk
dijual
kembali.
Transaksi yang mengubah persediaan produk jadi, persediaan bahan
baku, persediaan bahan penolong, persediaan bahan habis pakai pabrik,
dan
persediaan
suku
cadang,
bersangkutan
dengan
transaksi intern
perusahaan dan transaksi yang menyangkut
pihak
luar
perusahaan
(penjualan   dan   pembelian),   sedangkan   transaksi   yang   mengubah
  
67
persediaan  produk  dalam  proses  seluruhnya  berupa  transaksi  intern
perusahaan.