BAB 2
LANDASAN TEORI
2.1 Teori Umum
Teori- teori umum yang dibahas mengenai sistem basis data dan data warehouse.
2.1.1 Data
Pembahasan mengenai data akan diuraikan secara lengkap pada sub bab
di bawah ini.
2.1.1.1 Pengertian Data
Data
merupakan
sumber
dari
sebuah
informasi.
Menurut
Hall
(2001, p14), data adalah fakta yang dapat atau tidak dapat diproses
(disuling, dirangkum atau diperbaiki) dan tidak berpengaruh secara
langsung pada pengguna. Sebaliknya, informasi menyebabkan pengguna
melakukan suatu tindakan yang dapat dilakukan atau tidak dilakukan.
Menurut
Laudon
(2006,
p13),
data
adalah
kumpulan
fakta
yang
masih
mentah yang menjelaskan aktifitas-aktifitas yang terjadi dalam organisasi
atau
lingkungan
fisik,
sebelum
terorganisir
dan
diubah
menjadi
bentuk
yang dimengerti dan dapat digunakan.
Jadi, data adalah sumber dari informasi yang nantinya dapat
digunakan menjadi suatu yang bentuk yang lebih berguna dan berarti.
12
|
13
2.1.2 Sistem Basis Data
Teori mengenai sistem basis data meliputi :
2.1.2.1 Pengertian Sistem Basis Data
Basis
data
saat
ini
merupakan
bagian dari kehidupan sehari-hari
yang
tanpa
kita
sadari
bahwa
kita
selalu
menggunakannya.
Basis
data
atau yang kita kenal dengan nama database adalah kumpulan data
yang
berelasi
dan
Database
Management
System (DBMS)
yang
merupakan
perangkat lunak yang mengatur dan mengontrol akses ke basis data.
Maka pengertian sistem basis data
adalah
kumpulan
program
aplikasi basis data
yang berinteraksi dengan basis data. Contoh aplikasi
database, aplikasi database perpustakaan univesitas Bina Nusantara.
Aplikasi ini dapat memberikan informasi mengenai keterangan buku di
perpustakaan, keterangan pembaca, dan keterangan peminjaman. Aplikasi
ini dapat mengetahui informasi buku melalui indeks yang
terkomputerisasi
dengan
menggunakan bar
code.
Bar
code
berfungsi
untuk mengetahui kapan buku ini masuk dan keluar di perpustakaan.
Menurut Connolly (2002, p14),
database adalah sebuah
pembagian
kumpulan
data
yang
berelasi secara logika, dan keterangan
data yang didesain untuk mendapatkan informasi yang dibutuhkan sebuah
organisasi. Basis data dapat melakukan pelaporan data besar dimana
semua bagian dan pengguna dapat menggunakannya, menghilangkan data
berulang, dan semua data diintegrasikan dengan meminimumkan
duplikasi data.
Basis data
juga sebagai system catalog (data dictionary
atau metadata) yang mampu mendeskripsikan dirinya sebagai kumpulan
|
14
record
yang
terintegrasi,
data
yang
berelasi
secara logika terdiri
dari
entities,
attributes,
dan relationships
di
mana
ketiganya
dianalisa
untuk
kebutuhan informasi pada perusahaan.
2.1.2.2 Pendekatan File Based System
Menurut Connolly (2002, p7), filed-based system adalah
kumpulan
program aplikasi
yang
melayani end-user
seperti
pembuatan
laporan.
Setiap
program
mendefinisi
dan
mengatur
masing-masing
datanya sendiri. Sistem ini berjalan secara manual dalam pengisian data,
data
disimpan
pada
lemari
penyimpanan.
Sistem ini
tidak
dapat
menyimpan data dalam jumlah besar.
Masalahnya
sistem ini
memiliki
keterbatasan dalam mengolah
data, seperti:
1. Data yang terpisah dan terisolasi.
2. Duplikasi data, data yang sama terdapat pada program aplikasi lain.
3.
Ketergantungan data, perubahan yang terjadi pada satu program,
menyebabkan penyesuaian dengan program lain, penyesuaian tersebut
membuat stuktur program awal kembali.
4. Format
file
yang
tidak
kompatibel,
program ditulis
dengan
bahasa
yang berbeda-beda sehingga tidak mudah mengakses file lain.
5. Query / ukuran aplikasi yang tetap.
|
15
2.1.2.3 Aplikasi Basis Data
Contoh aplikasi basis data menurut Kronke (2006, p5) dapat
dikategorikan sebagai berikut:
Aplikasi Basis Data Single-User
Aplikasi ini digunakan penjual tunggal yang menjaga alur
pelanggan
dan
merupakan
hubungan penjual
dengan
pelanggan.
Contoh
sales
contact
manager,
penggunanya satu sales
dengan
ukuran
data
sebesar
1000
baris,
dan
produknya database
terpusat.
Misalnya Gold Mine and Act.
Aplikasi Basis Data Multiuser
Aplikasi ini digunakan lebih dari satu pengguna. Contoh aplikasi
jadwal pasien yang digunakan oleh 15 sampai 50 pengguna, seperti
perawat,
dokter, dan
bagian administrasi.
Besar
data
mencapai
100.000 baris data dengan 5 sampai 10 tabel yang berbeda.
Aplikasi Basis Data e-Commerce
Aplikasi ini digunakan untuk memasukkan data pemesanan,
penagihan, pengiriman, dan
layanan pelanggan. Contohnya
Amazon.com dan
Drugstore.com yang menggunakan halaman web
yang
mereka kirim ke
konsumen.
Konsumen
dapat
mengoperasikan
dengan menambah belanja, memesan pembelian, dan pembatalan
pembelian.
|
16
Aplikasi Basis Data Data Mining
Aplikasi ini menggunakan data yang dihasilkan dari proses
pemesanan dan sistem operasi lain untuk menghasilkan informasi
yang membantu mengatur perusahaan dengan merangkum data yang
ada.
2.1.3 Model Relasional
Di
dalam model
relasional,
semua data
secara
logika terstruktur
dalam
tabel.
Setiap
tabel
mempunyai
nama dan
terdiri
dari
kolom-kolom yang
dinamakan atribut. Setiap baris mengandung setiap nilai untuk setiap atribut.
Di
dalam
model
relational
dikenal
istilah-istilah relation,
attribute,
domain,
degree, dan cardinality. Menurut
Connolly
(2002, p72), relation atau
relasi
adalah
sebuah
tabel
yang
terdiri dari
baris
dan
kolom.
Atribut
adalah
penamaan kolom yang ada didalam sebuah table. Domain adalah kumpulan dari
nilai-nilai
yang
diijinkan pada
satu atau
lebih
atribut.
Tuple
adalah penamaan
baris
yang
terdapat
dalam
sebuah
tabel.
Degree
of
a
relation
adalah
jumlah
atribut yang dapat ditampung. Cardinality of a relation adalah jumlah baris yang
terdapat pada sebuah tabel.
2.1.4 Basis Data Relasional
Menurut Connolly (2002, p74), relational database merupakan kumpulan
relasi yang sudah dinormalisasikan dengan nama berbeda. Ciri-ciri yang dimiliki
oleh sebuah relasi antara lain:
|
17
1. Memiliki
nama
yang
berbeda antara
satu
relasi dengan
relasi
lainnya di
dalam skema relasional.
2. Setiap cell di dalam relasi mengandung sebuah nilai tunggal.
3. Setiap atribut memiliki nama yang berbeda.
4. Nilai dari sebuah atribut berasal dari domain yang sama.
5. Setiap baris pada relasi berbeda. Tidak ada baris yang bernilai sama.
6. Urutan dari atribut tidak terlalu berpengaruh.
7. Secara teoritis, urutan dari tuple atau baris tidak berpengaruh namun dalam
implementasinya urutannya dapat mempengaruhi waktu pengaksesan.
Karena antara
setiap baris
tidak
memiliki
nilai
sama,
maka
diperlukan
sebuah relational key yang dapat mengidentifikasikan setiap baris di dalam relasi
secara unik. Beberapa relational key yang dikenal antara lain sebagai berikut:
a. Super key
Sebuah atribut atau kumpulan dari atribut yang secara unik
mengidentifikasi baris yang ada dalam sebuah relasi.
b. Candidate key
Sebuah candidate key harus
memiliki dua ciri-ciri,
yaitu secara
unik
mengidentifikasi sebuah baris dan tidak ada nilai
lain
yang
memiliki sifat
yang unik tersebut (irreducibility).
c. Primary key
Merupakan candidate key yang dipilih
untuk
mengidentifikasi baris-
baris didalam sebuah relasi secara unik.
|
18
d. Foreign key
Merupakan atribut atau kumpulan atribut didalam sebuah relasi yang
juga merupakan candidate key.
e. Composite key
Merupakan
gabungan
dari
dua
atribut
atau
lebih
yang
membentuk
sebuah primary key.
2.1.5 Database Management System
Menurut Connolly
(2002,
p16),
Database
Management
System (DBMS)
adalah
sebuah
sistem perangkat
lunak
yang
memungkinkan
user
mendefinisi,
membentuk,
mengatur dan
mengontrol
akses
ke database.
DBMS berinteraksi
dengan pengguna aplikasi program dan database.
DBMS menyediakan fasilitas :
1.
Data Definition Language
(DDL),
yang berguna
untuk menspesifikasi tipe
data,
struktur,
dan
constraint
data. Semua
spesifikasi
di
simpan
dalam
database.
2.
Data
Manipulation
Language
(DML),
yang
dapat
menambah,
mengubah,
menghapus,
dan
mengembalikan
data
dengan memberikan
fasilitas
data
query berupa query language. Query language yang sering digunakan
adalah Structured Query Language (SQL).
3.
Pengendalian akses database, antara lain:
-
Sistem keamanan : mencegah user
yang tidak
memiliki
hak akses untuk
mengakses database.
-
Sistem Integrasi, menjaga konsistensi data.
|
19
-
Pengendalian share data.
-
Backup dan Recovery sistem.
-
Katalog deskripsi data dalam database
4.
Mekanisme View untuk menyediakan data
yang diinginkan dan diperlukan
user saja.
2.1.5.1 Komponen DBMS
Ada lima komponen utama dalam DBMS, yaitu
1. Hardware, yang berupa komputer hingga jaringan komputer.
2. Software, yaitu DBMS, aplikasi program, sistem operasi, dan software
jaringan (bila diperlukan untuk jaringan).
3. Data
yang
merupakan
data
operasional
dan
metadata
yang
digunakan
perusahaan.
4. Prosedur,
yaitu
instruksi dan aturan
yang
harus ada pada desain dan
kegunaan dari database dan DBMS.
5. People, antara lain:
-
Data Administration (DA)
DA mengatur sumber daya data, meliputi perencanaan database,
pengembangan dan pemeliharaan standar, kebijakan, prosedur, dan
desain database logikal dan konseptual.
-
Database Administration (DBA)
DBA
mengatur realisasi fisik dari aplikasi database yang
meliputi
desain
fisik database dan
implementasi, pengaturan keamanan dan
|
20
kontrol
integritas,
pengawasan
performa sistem
dan
pengaturan
ulang
database.
-
Desainer Database (Logikal dan Fisikal)
Desainer database logical melakukan identifikasi data (entitas dan
atribut), hubungan antara data, dan batasan data yang disimpan dalam
database. Desainer
database
fisikal
memutuskan
bagaimana
desain
database logikal diimplementasikan.
-
Application Developers
Application developers
mengimplementasikan program aplikasi
yang menyediakan kebutuhan bagi end-user.
-
End-Users
End User dapat digolongkan menjadi 2 bagian :
1. Naïve users, adalah pengguna yang tidak perlu tahu mengenai DBMS,
hanya
mengoperasikan
dengan
perintah
sederhana dan
memilih
pilihan dari menu.
2. Sophisticated users,
pengguna
yang
mengetahui
struktur basis data
dan fasilitas DBMS.
2.1.5.2 Keuntungan dan Kerugian DBMS
Ada beberapa keuntungan yang didapat dengan
memakai DBMS,
yaitu:
-
Mengontrol redudansi data.
-
Konsistensi data.
-
Lebih banyak informasi dari jumlah data yang sama.
|
21
-
Share data.
-
Meningkatkan integritas data.
-
Meningkatkan keamanan.
-
Standar pelaksanaan.
-
Skala ekonomi (data operasional organisasi dijadikan satu database dan
membuat aplikasi pada satu sumber data sehingga akan menghemat
biaya).
-
Keseimbangan aksesibilitas data dan data responsiveness.
-
Meningkatkan produktivitas.
-
Meningkatkan pemeliharaan melalu data independence.
-
Meningkatkan konkurensi (mengurangi loss informasi dan loss
integrasi).
-
Meningkatkan layanan backup dan recovery.
Sementara itu, yang menjadi kerugian DBMS:
-
Kompleksitas.
-
Ukuran.
-
Biaya DBMS.
-
Biaya penambahan perangkat keras.
-
Biaya konversi (biaya staf spesialis, biaya pelatihan).
-
Performance ( tidak dapat berjalan secepat yang diinginkan).
-
Resiko kesalahan yang lebih tinggi.
|
22
2.1.6 Data Warehouse
Teori mengenai data warehouse meliputi :
2.1.6.1 Pengertian Data Warehouse
Berikut adalah beberapa pengertian data warehouse dari banyak
ahli yang mengemukakan pendapatnya:
1. Menurut Inmon (2005, p29), data warehouse adalah koleksi data
yang mempunyai sifat berorientasi pada subjek, terintegrasi, variasi
waktu, dan koleksi data-nya tidak mengalami perubahan dalam
mendukung proses pengambilan keputusan di manajemen.
2.
Menurut Ralph Kimball (2002,p397),
data warehouse
adalah The
conglomeration of organizations data warehouse staging and
presentation areas, where operational data is specifically structured
for query and analysis performance. Pengertian tersebut dapat
diartikan
penggabungan
antara
tingkatan data warehouse
yang
ada
pada suatu organisasi dengan area prestasi, dimana data operasional
secara
spesifik
disusun untuk
query
dan
analisis
performa,
serta
kemudahan dalam penggunaan.
3.
Menurut Berson dan Smith (2001, p4), data warehouse adalah
gabungan
teknologi-teknologi yang bertujuan mengefektifkan
integrasi
database
operasional
ke
dalam lingkungan
yang
memungkinkan penggunaan secara strategis.
4. Menurut Turban (p418), Data warehouse adalah tempat penyimpanan
data historis yang berorientasi subjek, yang diatur agar dapat diakses
dan diterima untuk aktivitas proses analisis.
|
23
5. Menurut Paulraj (p14), Data warehouse adalah suatu lingkungan
yang
terkomputerisasi
dimana
user dapat menemukan informasi
strategis,
dapat
berhubungan
langsung dengan data yang mereka
butuhkan
untuk
membuat
keputusan bisnis
yang
lebih
baik.
Data
warehouse berisi informasi tentang keseluruhan data perusahaan yang
telah terintegrasi.
2.1.6.2 Karakteristik Data warehouse
Menurut Inmon(2005, p29), data warehouse
memiliki empat
karakteristik utama, antara lain sebagai be rikut:
1. Subject-Oriented
Data warehouse berorientasi subject
artinya data warehouse
didesain untuk
menganalisa data berdasarkan subject-subject tertentu
dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.
Data warehouse
diorganisasikan disekitar subjek-subjek
utama
dari
perusahaan(customers,
products
dan
sales) dan tidak
diorganisasikan pada area-area aplikasi utama(customer invoicing,
stock control dan product sales). Hal
ini dikarenakan kebutuhan dari
data
warehouse
untuk menyimpan data-data yang bersifat sebagai
penunjang suatu keputusan, dari pada
aplikasi
yang
berorientasi
terhadap
data.
Jadi
dengan
kata lain,
data
yang
disimpan
adalah
berorientasi kepada subjek bukan terhadap proses.
|
![]() 24
Operasional
Data warehouse
Auto
Customer
Life
Policy
Health
Premium
Casuality
Claim
Gambar 2.3 Data warehouse subject oriented
2. Integrated
Data warehouse dapat menyimpan data-data yang berasal dari
sumber-sumber
yang
terpisah
kedalam suatu
format
yang
konsisten
dan saling terintegrasi satu dengan lainnya. Dengan demikian data
tidak bisa
dipecah-pecah
karena
data
yang
ada
merupakan
suatu
kesatuan
yang
menunjang
keseluruhan
konsep data
warehouse
itu
sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai
cara
sepeti
konsisten
dalam penamaan
variabel,
konsisten
dalam
ukuran variabel, konsisten dalam struktur pengkodean dan konsisten
dalam atribut fisik dari data.
|
![]() 25
Gambar 2.4 Pokok persoalan dari integrasi (Inmon, 2005, p31).
3. Time Variant
Model analisis
yang diterapkan pada sebuah data warehouse
berfokus pada perubahan data
faktual berdasarkan
waktu. Dalam hal
ini data warehouse harus mampu menyimpan data untuk suatu objek
tertentu
dalam kurun
waktu
yang
berbeda-beda.
Waktu
merupakan
bagian data yang sangat penting di dalam data warehouse
|
![]() 26
Operational
Data Warehouse
Time horizon current to 60-90 days
Time Horizon 5 10 Years
Update of Records
Sophisticated snapshots of data
Key structure may or may not contain
key structure contains an element of time
element of time
Gambar 2.5 Time Variant (Inmon, 2005, p32).
4. Non-volatile
Karakteristik
keempat
dari data
warehouse
adalah
non-
volatile, maksudnya data pada data warehouse tidak di-update secara
real time tetapi di refresh dari sistem operasional secara reguler. Data
yang
baru
selalu
ditambahkan
sebagai
suplemen
bagi database
itu
sendiri dari pada sebagai sebuah perubahan. Database tersebut secara
kontinu
menyerap
data
baru
ini, kemudian
secara incremental
disatukan dengan data sebelumnya.
Berbeda dengan database operasional yang dapat melakukan
update,
insert
dan
delete terhadap
data
yang
mengubah
isi
dari
database
sedangkan pada data
warehouse
hanya ada dua kegiatan
memanipulasi
data
yaitu
loading
data
(mengambil
data)
dan
akses
data
(mengakses
data
warehouse seperti
melakukan
query
atau
|
![]() 27
menampilan
laporan
yang dibutuhkan,
tidak
ada
kegiatan
updating
data).
Gambar 2.6 Pokok persoalan dari nonvolatile (Inmon, 2005, p32).
2.1.6.3 Bentuk Data Warehouse
Berikut ini adalah bentuk-bentuk dari data warehouse :
2.1.6.3.1
Functional Data Warehouse
Functional data warehouse
ini merupakan bentuk
database dimana data warehouse dibuat lebih dari satu dan
dikelompokkan
berdasarkan
masing-masing
fungsi
yang
ada
dalam perusahaan,
seperti
fungsi financial
/
keuangan,
fungsi
marketing
/
pemasaran,
fungsi
kinerja personalia,
dan
lain-lain.
Keuntungan dari bentuk ini adalah sistem akan
mudah dibangun
dengan biaya yang relatif murah. Kerugian dari penggunaan
bentuk
ini
adalah
resiko
kehilangan konsistensi data dan
terbatasnya kemampuan pengguna dalam hal pengumpulan data.
|
![]() ![]() 28
Source
Branch
Function
Data
Warehouse
Source
Function
Data
Warehouse
Operasional
Workstation
Gambar 2.7
Functional Data Warehouse
2.1.6.3.2
Centralized Data Warehouse
Centralized data
warehouse ini merupakan database
fisikal tunggal yang memuat semua data untuk area fungsional
yang khusus, departemen, divisi, atau perusahaan.
Data
warehouse ini digunakan ketika terdapat kebutuhan akan data
informasional
dan
terdapat
banyak end-user
yang
sudah
terhubung ke komputer pusat atau jaringan.
Bentuknya menyerupai functional
data warehouse, akan
tetapi sumber datanya lebih dahulu dikumpulkan atau
diintegrasikan
pada
suatu
tempat terpusat,
baru
kemudian
data
tersebut
dibagi-bagi
berdasarkan fungsi-fungsi yang dibutuhkan
oleh
perusahaan.
Bentuk data
warehouse terpusat ini sering
digunakan
oleh
perusahaan-perusahaan
yang
belum mempunyai
jaringan eksternal. Keuntungan bentuk centralized data
|
![]() ![]() 29
warehouse ini adalah data benar-benar terpadu karena konsistensi
yang
tinggi.
Namun
demikian
membutuhkan
waktu
yang
lama
dan biaya yang mahal dalam membentuk data warehouse seperti
ini.
Source
Source
Centralized
data
warehouse
Function
Data
Warehouse
Source
Function
Data
Warehouse
Operation
Gambar 2.8 Centralized Data Warehouse
Workstation
2.1.6.3.3
Distributed Data Warehouse
Distributed data warehouse adalah data warehouse
dimana komponen tertentu dari data warehouse
tersebut
didistribusikan
melewati
sebuah database
fisikal
yang
berbeda.
Distributed data warehouse biasanya melibatkan data yang paling
teredundansi,
dan
sebagai
akibatnya,
menimbulkan
proses
load
dan update yang sangat kompleks.
Distributed
data
warehouse
ini menggunakan gateway
yang
berfungsi
sebagai
jembatan
antara
lokasi data
warehouse
dengan
workstation
yang
menggunakan
sistem yang
beranekaragam, sehingga pada bentuk data warehouse ini
|
![]() ![]() 30
memungkinkan perusahaan untuk mengakses sumber data yang
terdapat
diluar
lokasi
perusahaan
(eksternal).
Bentuk data
warehouse ini
mempunyai kelebihan dalam hal pengaksesan data
dari luar perusahaan yang telah mengalami
sinkronisasi terlebih
dahulu dan tetap terjaga konsistensinya. Tetapi bentuk ini juga
memiliki kerugian yaitu bentuk ini merupakan yang paling mahal
dan paling kompleks untuk diterapkan karena sistem operasinya
dikelola secara terpisah.
Source
Source
Data
warehouse
Gateway
Source
Operation
Workstation
Gambar 2.9 Distributed Data Warehouse
2.1.6.4 Struktur Data warehouse
Level kedetailan data dalam struktur data warehouse terbagi
menjadi 5 tingkat yaitu:
1. Old Detail Data
Data ini merupakan data historis dari current detail data, dapat
berupa hasil cadangan atau archive data yang disimpan dalam storage
|
31
terpisah.
Karena
bersifat
back-up(cadangan),
maka
biasanya
data
disimpan dalam storage alternatif seperti tape-desk.
Data ini biasanya memilki tingkat frekuensi akses yang rendah.
Penyusunan file atau directory dari data ini di susun berdasarkan umur
dari data yang bertujuan mempermudah untuk pencarian atau
pengaksesan kembali.
2. Current Detail Data
Current
detail
data
merupakan
data
detil
yang
aktif saat
ini,mencerminkan keadaan yang sedang berjalan dan merupakan level
terendah
dalam data
warehouse.
Didalam
area
ini
warehouse
menyimpan
seluruh
detail data
yang terdapat pada
skema
basis
data.
Jumlah
data
sangat
besar
sehingga
memerlukan
storage
yang
besar
pula dan dapat diakses secara cepat. Dampak negatif yang ditimbulkan
adalah kerumitan untuk mengatur data menjadi meningkat dan biaya
yang diperlukan menjadi mahal.
3. Light Summarized Data
Data
ini
merupakan
ringkasan
atau
rangkuman
dari current
detail data. Data ini dirangkum berdasar periode atau dimensi lainnya
sesuai dengan kebutuhan.
Ringkasan dari current
detail
data
belum
bersifat
total
summary.Data-data
ini
memiliki detil
tingkatan yang lebih tinggi
dan
mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan
|
32
data ini di sebut juga dengan data mart. Akses terhadap data jenis ini
banyak
digunakan
untuk view suatu kondisi
yang sedang atau sudah
berjalan.
4. Highly Summarized Data
Data
ini
merupakan
tingkat
lanjutan
dari Lightly
summarized
data, merupakan
hasil ringkasan
yang bersifat totalitas, dapat di akses
misal
untuk
melakukan analisis perbandingan data berdasarkan urutan
waktu tertentu dan analisis menggunakan data multidimensi.
5. Metadata
Metadata bukan merupakan data hasil kegiatan seperti keempat
jenis data diatas. Menurut Poe (1996),
metadata
adalah data tentang
data dan menyediakan
informasi tentang struktur data dan
hubungan
antara struktur data di dalam atau antara storage (tempat penyimpanan
data).
Metadata berisikan data yang menyimpan proses perpindahan
data
meliputi
database structure ,
contents,detail data dan
summary
data, matrics , versioning, aging criteria , versioning, transformation
criteria. Metadata khusus dan memegang peranan yang sangat penting
dalam data warehouse.
Metadata sendiri mengandung :
1. Struktur data
|
33
Sebuah direktori yang membantu user untuk melakukan
analisis Decission Support System dalam pencarian letak atau lokasi
dalam data warehouse.
2. Algoritma
Algoritma digunakan untuk summary data. Metadata sendiri
merupakan panduan
untuk algoritma dalam melakukan pemrosesan
summary data antara current detail data dengan lightly summarized
data dan antara lightly summarized data dengan highly summaried
data.
3. Mapping
Sebagai panduan pemetaan (mapping) data pada saat data di
transform/diubah
dari
lingkup
operasional
menjadi
lingkup data
warehouse.
|
![]() 34
Gambar 2.10 Struktur data warehouse Inmon(2005, p34)
2.1.6.5 Arsitektur Data Warehouse
Menurut
Connoly
(2002,
p1052),
ada sepuluh
komponen
utama
yang dimiliki oleh data warehouse yaitu:
1. Operasional Data
Sumber data untuk data warehouse bersumber dari data-data
berikut:
-
Mainframe data operasional yang ada dalam jaringan database.
-
Data departemental yang ada dalam hak akses dalam sistem file.
-
Data privasi di simpan di dalam server pribadi dan workstation.
|
35
-
Sistem external, seperti internet, atau database yang terkait dengan
customer dan suppliers.
2. Operasional Datastore
Tempat penyimpanan data operasional yang sifatnya saat ini dan
terintegrasi dan dipakai untuk analisis. Biasanya operational datastore
terstruktur dan tersuplai dengan data dengan cara yang sama dengan
data warehouse.
Tetapi
memungkinkan
untuk
memindahkan
ke data
warehouse secara sederhana.
3. Load Manager
Load
manager
disebut
juga
sebagai
komponen front-end,
menampilkan
semua
operasi gabungan
dengan
menarik
dan
menyimpan
data
ke data warehouse.
Data
bisa
langsung dikeluarkan
langsung dari sumber data, atau data store operasional. Operasi yang
dilakukan
load
manager,
bisa
termasuk
transformasi
sederhana
dari
data untuk menyiapkan data yang akan dimasukan data warehouse.
4. Warehouse Manager
Menangani semua operasi yang berhubungan dengan management
data
dalam data
warehouse.
Operasi-operasi
yang
dijalankan
oleh
warehouse manager, mencakup:
a. Analisis data untuk menjaga kekonsistenan data.
|
36
b. Melakukan transformasi dan pengabungan sumber data dari tempat
penyimpanan sementara ke dalam tabel-tabel data warehouse.
c. Melakukan denormalisasi (jika perlu).
d. Melakukan aggregations (jika perlu).
e. menyimpan (archive) dan backup data.
5. Query Manager
Query manager disebut juga sebagai component backend, untuk
menangani semua operasi yang berhubungan dengan manajemen
permintaan user
(user
queries).
Operasi
yang dijalankan
oleh query
manager meliputi kegiatan mengarahakan permintaan ke tabel-tabel
data
yang
tepat
dan
melakukan penjadwalan eksekusi pada
permintaan.
6. Detailed Data
Pada bagian ini, warehouse menyimpan detail semua data dalam
skema
database
yang
umumnya
detail
data tidak
disimpan
secara
online, tetapi ada dengan
meng-aggregate
data
sama tingkat
detail
berikutnya.
7. Lightly and Highly Summarized Data
Disini
warehouse
menyimpan
semua
data
yang dihasilkan
oleh
manager warehouse
secara
light dan high. Tujuannya untuk
meningkatkan kecepatan performa dari query.
|
37
8. Archive / Back-up Data
Digunakan untuk menyimpan detailed data dan data
yang
telah
diringkas. Tujuannya adalah untuk penyimpanan(archiving)
dan
backup. Data kemudian ditransfer ke
media
penyimpanan
seperti
magnetic tape atau optical disk.
9. Metadata
Bagian ini digunakan untuk penarikan dan peyimpanan proses
data, proses management warehouse. Dan juga, bagian dari proses
management query.
10. End-user Access Tools
Prinsip tujuan dari data warehouse,
adalah
untuk
menyediakan
informasi
sebagai
bantuan bagi
para pengguna
dalam bidang
bisnis,
ynng melakukan strategi untuk pengambilan keputusan. Menurut
beberapa
ahli, End-user access
tools
dapat
dikategorikan
menjadi
5
golongan utama, yaitu:
a. Reporting and Query Tools
Reporting tools
meliputi
production
reporting
tools dan
report writer. Production reporting tools digunakan untuk
menghasilkan laporan operasional reguler atau daya pemicu kerja
yang tinggi. Seperti order customer, invoice, dan gaji karyawan.
Query
tools
untuk
relasional
data
warehouse,
di-design
untuk
menerima SQL dan syntax-nya, untuk query penyimpanan
|
38
data untuk data warehouse. Tools ini, melindungi end users dari
kompleksitas SQL dan struktur database.
b. Application Development Tools
Kebutuhan dari end user, kemampuan membuat
laporan
yang built-in dan tools query yang tidak
mencukupi, dikarenakan
kebutuhan analisis tidak bisa dilakukan, atau karena interaksi user
membutuhkan tingkat profesional yang tinggi.
c. Executive Information System (EIS) tools
EIS lebih dikenal sebagai Everybodys information
system
yang semula dikembangkan untuk mendukung strategi
kebutuhan
tingkat tinggi. Tools
EIS
mulanya
terasosiasi dengan
mainframe, sehingga memungkinkan user membuat aplikasi
pendukung pengambilan keputusan, dalam menyediakan overview
data organisasi dan mengakses sumber data eksternal.
d. OnLine Analitical Proccessing (OLAP) tools
Pengguna
yang
handal OLAP
tools
berbasis
pada konsep
basis
data
multi-dimensi
dan
memperbolehkan pengguna
untuk
menganalisis data multi-dimensional view yang kompleks.
|
39
e. Data Mining Tools
Data mining adalah proses
yang
memiliki makna tentang
korelasi yang baru, patterns, dan trend dengan data dalam jumlah
besar
menggunakan
teknik
statistik,
matematika,
dan
kecerdasan
buatan. Data mining memiliki potensi untuk menggantikan
kemampuan dari OLAP tools, sebagai penampilan utama dari
data mining
adalah
kemampuan
untuk
membangun
prediksi
dibandingkan dengan model-model retrospective.
2.1.6.6 Data Warehouse Data Flows
Data flows yang ada
pada data warehouse terdiri dari 5 bagian,
yaitu, :
-
Inflow
Proses yang berhubungan dengan penarikan, pembersihan, dan
mengisi data dari sumber ke dalam data warehouse.
-
Upflow
Proses
yang terhubung dengan
menambahkan
nilai ke data di dalam
warehouse, melewati ringkasan pengepakan, dan penyebaran data.
-
Downflow
Prosesnya berhubungan dengan penyimpanan dan back-up data dalam
data warehouse.
-
Outflow
Proses
yang berhubungan
dengan
membuat data tersedia untuk end-
users.
|
40
-
Meta-flow
Proses yang berkaitan dengan manajemen meta-data.
2.1.6.7 Data mart
Data mart yang akan dibahas meliputi :
2.1.6.7.1 Pengertian Data Mart
Menurut Kimball (2002, p396), Datamart adalah bagian
dari
logikal
dan
fisikal
dari
area
cakupan
yang dimiliki
oleh
data warehouse. Sedangkan menurut Connoly dan Begg (2005,
p1171) Data mart merupakan bagian dari data warehouse,
yang mendukung kebutuhan informasi bagian departemen atau
fungsi bisnis tertentu.
2.1.6.7.2 Karakteristik Data mart
Karakteristik - karakteristik yang terdapat pada data
mart adalah sebagai berikut:
1. Data mart memfokuskan hanya pada kebutuhan-kebutuhan
pemakai
yang terkait dalam sebuah departemen atau
fungsi
bisnis.
2. Data mart biasanya tidak mengandung data operasional
yang rinci seperti pada data warehouse.
3. Data
mart
hanya
mengandung
sedikit
informasi
dibandingkan
dengan
data
warehouse.
Data mart
lebih
mudah dipahami dan dinavigasi
|
41
2.1.6.8 Skema Bintang / Star Schema
Teori skema bintang meliputi :
2.1.6.8.1 Pengertian Skema Bintang
Menurut Connolly (2002, p1079), skema bintang adalah
struktur logikal yang mempunyai sebuah table fakta yang berisi data
fakta di tengah dan dikelilingi oleh table-tabel dimensi yang berisi
data referensi atau keterangan yang biasanya dapat didenormalisasi.
Menurut Inmon (2005, p128), skema bintang adalah struktur
desain
yang
dibutuhkan
untuk mengatur
data
dengan
cara
denormalisasi dalam jumlah yang besar ke dalam sebuah entity
dalam sebuah data mart untuk mengoptimalkan akses data.
Kesimpulannya, skema bintang adalah suatu stuktur logikal
data yang mempunyai suatu tabel fakta yang dikelilingi oleh tabel-
tabel multidimensi serta kompatibel dengan kebutuhan bisnis.
2.1.6.8.2 Karakteristik dari Skema Bintang
Skema
bintang
memiliki
beberapa
macam karakteristik
sebagai berikut:
1. Pusat skema bintang adalah fact table.
2. Fact table berisi indikator indikator kinerja pokok/Key
Performance Indicators.
3. Indikator indikator kinerja pokok tersebut adalah atribut
atribut dari fact table.
|
42
4. Obyek obyek informasi dan waktu adalah kunci utama dari fact
table.
5. Tabel di sekeliling fact table adalah dimension table.
6. Tiap dimension table di-relasikan fact table berdasarkan primary
key-nya.
7. Skema
bintang
diimplementasikan
menggunakan
teknologi
database relasional.
2.1.6.8.3 Keuntungan Menggunakan Skema Bintang
Skema bintang memiliki keuntungan yang tidak didapat oleh
skema relasional biasa. Keuntungan skema bintang, antara lain:
1. Respon
data
yang
lebih
cepat
dihasilkan
dari
perancangan
database.
2. Kemudahan dalam mengembangkan atau memodifikasi data terus
berubah.
3. End user dapat menyesuaikan cara berpikir dan menggunakan
data, konsep ini dikenal juga dengan istilah pararel dalam
perancangan database.
4.
Menyederhanakan
pemahaman
dan
penelusuran metadata
bagi
pemakai dan pengembang.
|
43
2.1.6.8.4 Perancangan Skema Bintang
Skema bintang memiliki dua macam tabel, yaitu;
1.
Tabel Fakta (Fact Table)
Merupakan tabel yang umumnya mengandung angka dan
data
history dimana
key
(kunci)
yang
dihasilkan
sangat
unik,
karena
key
tersebut
terdiri
dari foreign
key (kunci
asing)
yang
merupakan
primary
key (kunci
utama)
dari
beberapa
dimension
table yang berhubungan. Tabel fakta sering juga disebut major
table.
2.
Tabel Dimensi (Dimension Table)
Tabel yang berisikan kategori dengan ringkasan data detail
yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat
dilaporkan
sebagai
dimensi waktu(yang
berupa
perbulan,
perkuartal dan pertahun).Tabel dimensi sering juga disebut
sebagai minor table.
2.1.6.8.5 Ketentuan Pembacaan Skema Bintang
Adapun ketentuan pembacaan skema bintang adalah sebagai
berikut:
1. Bagian yang ada di bawah tabel adalah kolom-kolom dari tabel.
2. Primary key dan foreign key diberi kotak.
3. Primary key diarsir, sedangkan foreign key yang bukan primary key
tidak
4. Foreign key
yang
berhubungan ditunjukan dengan
garis
yang
menghubungkan tabel-tabel.
|
![]() 44
5. Kolom yang bukan primary key atau foreign key disebut kolom data
pada tabel fakta dan atribut pada tabel dimensi.
2.1.6.8.6 Jenis-Jenis Skema Bintang
Ada beberapa macam jenis skema bintang, yaitu:
1. Simple Star Schema
Dalam skema ini, setiap tabel harus memiliki primary key
yang terdiri dari satu kolom atau
lebih dan primary key
tersebut
harus
bersifat
unik.
Foreign
key
adalah
kolom
pada
satu
tabel
yang nilainya didefinisikan oleh primary key pada tabel lain.
Tabel dimensi 1
Tabel Fakta
Tabel dimensi 3
Kunci 1
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 2
Kunci 3
Atribut
Atribut
...........
Atribut
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 3
Kolom Data
Kolom Data
...........
Kolom Data
Keterangan :
Kunci n
= Kunci Utama
Gambar 2.1 Simple Star Schema (Poe, 1996, p124)
|
![]() ![]() 45
Kunci 1
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 3
Kunci 2
Kolom Data
............
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 3
Kunci 2
Kolom Data
............
Kunci 3
Atribut
Atribut
........... ...........
Atribut
Kunci 1
Kunci 2
Kunci 3
Kolom Data
............
Tabel dimensi
Kunci 2
Atribut
Atribut
...........
Atribut
Kunci 1
Kunci 2
Kunci 3
Kolom Data
............
2. Multiple Fact Star Schema
Skema bintang dapat
memiliki lebih dari satu tabel fakta,
karena adanya
fakta
yang tidak saling berhubungan.
Misalnya di
samping penjualan, terdapat tabel fakta forecasting dan tabel fakta
result. Walaupun terdapat banyak tabel fakta, tabel dimensinya
tetap digunakan bersama-sama.
Tabel dimensi
Tabel Fakta
Kunci 1
Atribut
Atribut
...........
Atribut
Tabel Fakta
Tabel dimensi
Kunci 3
Atribut
Atribut
Atribut
Gambar 2.2 Multiple Fact Star Schema (Poe, 1996, p126)
|
46
2.1.6.8.7 Variasi Skema Bintang
Variasi-variasi yang ada pada skema bintang adalah
1.
Skema Snowflake
Snowflake
merupakan variasi lain dari skema bintang
dimana tabel dimensi dari skema bintang tidak mengandung atau
berisi data yang didenormalisasi. Prinsip dasar dari skema ini
tidak jauh berbeda dari skema bintang. Penggunaan tabel dimensi
sangatlah menonjol, karena itulah perbedaan mendasar dari skema
bintang dan skema
snowflake. Skema snowflake menggunakan
beberapa tabel fakta dan tabel dimensi yang sudah mengalami
normalisasi, sedangkan skema bintang menggunakan tabel
dimensi
yang
masih
denormalisasi.
Skema
snowflake
dibuat
berdasarkan OLTP sehingga semua data akan termuat detail
dalam setiap tabel fakta dan tabel dimensi.
Keuntungan
dari
skema
snowflake
adalah kecepatan
memindahkan data
dari
data OLTP
ke dalam metadata, sebagai
kebutuhan
dari
alat pengambil
keputusan tingkat tinggi di mana
dengan tipe seperti ini seluruh struktur dapat digunakan
sepenuhnya, dan banyak yang
beranggapan lebih nyaman
merancang dalam normal ketiga.
Kerugian yang didapat adalah memiliki masalah besar
dalam hal
kinerja
(performance),
hal
ini
disebabkan
semakin
banyaknya
join
antar
tabel-tabel
yang
dilakukan
dalam skema
snowflake ini maka semakin lambat kinerja yang dilakukan.
|
47
2.
Skema Bintang dengan 2 Tabel Fakta
Sebuah skema bintang yang menyediakan atribut yang
lengkap, konsisten, dan mudah
dimengerti memungkinkan bagi
pemakai untuk memperoleh penampilan data yang mudah digunakan
dan mudah dimengerti. Perancangan skema bintang yang baik
membantu pemakai untuk menulis pencarian yang diinginkan dengan
cara yang dimengerti.
2.1.6.9 Metodologi Perancangan Data Warehouse
Menurut Connolly (2002, p1083) Metodologi Perancangan Data
Warehouse nine-steps methodology yang terdiri dari:
a. Pemilihan Proses
Sebuah proses (fungsi) mengarahkan tentang sebuah subjek
yang ada pada
suatu data
mart.
Data mart
yang
pertama
dibangun
harus
bisa
disampaikan
pada
waktunya, sesuai dengan anggaran dan
menjawab sebagian besar pertanyaan bisnis yang penting. Pilihan yang
paling tepat untuk
data mart adalah
yang terkait dengan penjualan.
Sumber data sebaiknya yang mudah diakses dan berkualitas tinggi.
Sebagai
contoh, dalam memilih data mart yang pertama untuk
DreamHome pertama kali kita menentukan proses bisnis diskrit dari
DreamHome meliputi:
-
Properti sales
-
Properti rentals (leasing)
-
Properti Viewing
|
48
-
Properti advertising
-
Properti maintenance
b. Pemilihan Grain
Keputusan grain untuk tabel fakta menentukan grain dari setiap
tabel dimensi. Sebagai contoh,
jika
grain
untuk
tabel
fakta property
sales adalah individualnya dari property sale, maka grain dari dimensi
klien adalah detail dari klien yang mewakili properti tertentu.
c. Identifikasi Dimensi
Tabel dimensi menyiapkan konteks untuk menanyakan
pertanyaan
tentang
fakta
yang
ada
didalam tabel
fakta.
Kumpulan
dimensi yang dibuat dengan baik akan mempermudah dalam mengerti
dan mengunakan data mart.
Kemudian mengidentifikasikan detail
dimensi yang secukupnya untuk mengambarkan klien dan properti
pada grain yang tepat Sebagai contoh, setiap klien dari tabel dimensi
ClientBuyer
digambarkan dengan atribut clientID,
clientNo.
clientName, clientType, city, region, dan country. Ketidaklengkapan
dari dimensi yang dikumpulkan akan mengurangi fungsi dari data mart
sampai ke enterprise.
Jika
ada
dimensi
yang
sama
dalam
dua data mart,
maka
keduanya pasti memiliki dimensi yang sama atau salah satunya pasti
melengkapi
yang
lainya.
Hanya
dengan
cara
ini
dua
data mart bisa
berbagi dalam satu atau
lebih dimensi
yang ada dalam aplikasi yang
|
49
sama.
Ketika
dimensi
digunakan
dalam lebih
dari
satu data
mart,
dimensi yang satunya harus bisa disesuaikan. Sebagai contoh dimensi
yang harus disesuaikan antara property sales dan property advertising
adalah
dimensi time,
PropertyForSale,
Branch, dan
Promotion.
Jika
dimensi-dimensi
ini tidak sesuai atau
mereka
dibiarkan
menyimpang
dari sinkronisasi diantara data mart, maka keseluruhan data pada data
warehouse akan gagal, Dikarenakan kedua data mart
tidak dapat
digunakan bersama-sama.
d. Pemilihan Fakta
Grain dari tabel fakta
menentukan fakta
mana yang bisa
dipakai
dalam data
mart. Semua
fakta
harus dinyatakan
secara
pasti
oleh grain.
Dengan kata
lain, jika grain dari tabel fakta merupakan
indiviual property sale, maka semua fakta numeric harus menunjuk
kepada bagian penjualan tertentu. Fakta juga harus numerik dan
ditambah. Tambahan fakta lainnya bisa ditambah ke dalam tabel fakta
kapan saja selama fakta itu konsisten dengan grain
dari tabel itu.
e. Penyimpanan perhitungan data yang ada didalam tabel fakta
Ketika semua fakta sudah ditentukan, maka fakta ini harus
diperiksa kembali. Apakah fakta ini dapat dipakai atau tidak. Contoh
umum
fakta
yang
dipakai adalah
kebutuhan sebuah
toko
ketika
fakta
yang ada dapat membandingkan laba dan rugi. Situasi ini dapat terjadi
ketika tabel fakta berdasarkan invoice atau sales.
|
50
f. Mengumpulkan semua tabel dimensi
Pada
tahap
ini,
kita
kembali
ke
dalam dimensi
tabel
dan
menambah deskripsi yang sebanyak-banyaknya. Deskripsi harus jelas
dan
mudah
dimengerti
sehingga
cukup jelas. Sebagai contoh, tabel-
tabel dimensi yang telah diperiksa dan akan dipakai dikumpulkan dan
disusun kembali agar mudah dimengerti.
g. Pemilihan Durasi Database
Durasi dapat mengatur seberapa jauh tabel fakta ini dapat
berlaku. Sebagian besar perusahaan, mempunyai kebutuhan untuk
melihat data pada periode tertentu dalam
jangka waktu satu atau dua
tahun. Untuk tipe perusahaan lainnya, seperti asuransi. Mungkin
membutuhkan data yang periodenya lebih lama yaitu sekitar lima atau
lebih dari lima tahun. Ada 2 fakta yang besar yang dapat diambil dari
design data warehouse. Pertama, Semakin tua suatu data semakin sulit
unuk digunakan atau dibaca. Kedua, dimensi yang dibunakan adalah
dimensi yang lebih lama bukan yang saat ini. Masalah seperti ini
dikenal
juga sebagai
masalah Slowly Changing dimension
yang
akan
dibahas lebih detail pada point berikutnya.
h. Menelusuri Perlahan Perubahan Tabel Dimensi
Yang
dimaksud
dengan
masalah slowly changing dimension,
contohnya adalah deskripsi yang jelas tentang klien dan cabang yang
sudah lama haurs dipakai dengan data transaksi yang lama. Data yang
|
51
penting
seperti ini harus dibuat kunci yang umum untuk
menghilangkan snapshot yang ganda dari data klien dan cabang dalam
periode tertentu.
Ada tiga tipe dasar dari dimensi yang berubah secara perlahan,
yang pertama ketika atribut dari dimensi ditulis kembali, yang kedua
ketika
terjadi
perubahan dimensi menyebabkan
adanya
tabel
dimensi
yang baru yang dibuat, yang ketiga perubahan atribut dimensi
menyebabkan atribut alternatif dibentuk sehingga baik nilai yang lama
dan
yang baru
dapat di akses
secara bersamaan
pada
tabel
dimensi
yang sama.
i. Penentuan Prioritas dan Cara Query
Dalam langkah
ini,
memperkirakan untuk
membuat rancangan
fisikal.
Yang
paling
penting dalam rancangan
fisikal
yang
memperngaruhi persepsi data mart
end-users adalah urutan dari
perintah
fisikal
yang
ada
dalam tabel
dan
ketersediaan
ringkasan.
Dibalik semua ini ada tambahan rancangan fisikal yang mempengaruhi
administration, backup, indexing performance, dan security.
Pada
langkah terakhir dalam metodologi
ini,
harus
merancang
data mart
yang
mendukung
kebutuhan
bisnis proses dan juga
mempermudah
dalam integrasi
dengan
lain
yang
terkait
dengan
data
mart untuk data warehouse sebuah perusahaan.
|
52
2.1.7
Estimasi Disk
Ada beberapa langkah yang perlu diikuti dalam menghitung kapasitas
disk:
1. Menentukan jumlah baris didalam tabel (num_rows)
2. Ukuran tergantung pada tipe data dan panjangnya
-
Jumlah kolom (num_cols)
-
Jumlah fixed length column (byte) (fixed_datasize)
-
Jumlah variable length column (Num_variable_cols)
-
Ukuran maksimal variable length column (max_var_size)
3. Menghitung null bitmap jika dalam tabel terdapat fixed length
column
Null bitmap (null_bitmap) = 2 + ((Num_cols+7):8)
4. Menghitung kapasitas jika terdapat variable length column
dalam tabel
Total size of variable length columns (variable_data_size) =
2+(num_variable_cols x 2) + max_var_size
5. Menghitung ukuran baris
Total
row
size
(row_size)
=
fixed_data_size
+
variable_data_size + Null bitmap +4
6. Menghitung jumlah baris per halaman (8096 byte per page)
Numbers
of
rows
per
page
(Rows_per_page)
=
8096
:
(row_size + 2)
|
53
7. Jika terdapat clustered index didalam tabel, maka menghitung
free rows per page didasarkan pada fill factor. Jika tidak ada
clustered
index
yang
dibuat,
maka
fill
factor diasumsikan
sebagai 100.
Number of free row per page(Free_rows_per_page) = 8096 x
((100 fill factor) : 100) : (row_size+2)
8. Menghitung
jumlah
halaman
yang
dibutuhkan
untuk
menyimpan semua baris
Number of pages (num_pages)= num_rows : (rows_per_page
free_rows_per_page)
9. Menghitung kapasitas yang dibutuhkan untuk menyimpan
data dalam tabel (8192 byte per pages)
Tabel size (bytes) = 8192 x num_pages
Menghitung ukuran tabel dengan index
Berikut
ini cara
yang digunakan
untuk
menghitung tabel
yang didalamnya terdapat index:
1. Menghitung kapasitas yang digunakan untuk menyimpan data
2. Menghitung
kapasitas
yang
digunakan
untuk
menyimpan
index
clustered
3. Menghitung
kapasitas
yang
digunakan
untuk
menyimpan
index
non-clustered
4. Menghitung nilai-nilai yang telah dihitung diatas
|
54
Pada setiap perhitungan selalu mencantumkan jumlah baris yang akan
ada didalam tabel.
Number of rows in the table = num_rows
Menghitung kapasitas yang digunakan untuk menyimpan data:
-
space used to store data = data_spaced_used
Menghitung kapasitas yang digunakan untuk menyimpan index:
1. Definisi dari index dapat berupa fixed length dan variable length
column
Jumlah kolom dalam index key (num_key_cols)
Jumlah semua fixed length column key (byte) (fixed_key_size)
Jumlah
variable
length
column
dalam
index
key
(num_variable_key_cols)
Ukuran
maksimum
dari
variable
length
column
key
(max_var_key_size)
2. Index Null Bitmap (Index_Null_bitmap) = 2+((Num_key_cols + 7): 8)
3. Jika terdapat variable length column dalam index, maka dihitung
berapa kapasitas yang digunakan untuk menyimpan kolom dalam
baris index.
Total
size
of
variable
lenght
columns
(variable_key_size)
=
2+(num_variable_key_cols x 2) + max_var_key_size
4. Menghitung ukuran baris index
|
55
Total
index
row
size
(Index_row_size)
=
fixed_key_size
+
variable_key_size + index_null_bitmap + 1 + 8
5. Menghitung jumlah baris per halaman (8096 byte per page)
Number
of
index
rows
per
page
(Index_rows_per_page)
=
8096
:
(index_row_size + 2)
6. Menghitung jumlah
halaman
yang dibutuhkan untuk
menyimpan
semua baris index pada setiap level dari index
Number of pages (level 0) (num_pages_level_0) = (data_space_used :
8192) : index_rows_per_page
Number
of
pages
(level
1)
(num_pages_level_0)
=
num_pages_level_0 : index_rows_per_page
Perhitungan terus dilakukan sampai level n (num_pages_level_n)
sama dengan satu (index root page)
Menghitung jumlah
halaman
yang dibutuhkan untuk
menyimpan
setiap level dari index
Total number of pages (num_index_pages) = num_pages_level_0 +
num_pages_level_1 + .... + num_pages_level_n
7. Menghitung
ukuran index (8192 byte per page) index size (bytes) =
8192 x num_index_pages
Menghitung ukuran tabel
Total tabel size (bytes) = data_space_used + clustered_index_size +
non-clustered_index_size + .....n
|
56
Menghitung pertumbuhan setiap tahun selama lima tahun
1. Menghitung master
Rn = R
(n-1)
* (1 + i )
n
R = Jumlah record
n = Tahun
i = Persentase Pertumbuhan data, sebesar 10%
2. Menghitung Transaksi
Rn = R
(n-1)
+ R
(n-1)
* (1 + i )
R = Jumlah record
n = Tahun
i = Persentase Pertumbuhan data, sebesar 10%
2.2 Teori Khusus
Teori
khusus
yang
akan
diuraikan
mengenai business intelligence, internet,
Enterprise Resource Planning (ERP), Data Flow Diagram (DFD), State Transition
Diagram (STD), sistem penjualan, sistem pembelian, dan sistem persediaan.
2.2.1 Business Intelligence
Teori mengenai business intelligence meliputi :
2.2.1.1
Pengertian Business Intelligence
Business
intelligence (BI)
merupakan
sistem dan
aplikasi
yang
berfungsi
untuk
mengubah
data-data dalam
suatu
perusahaan
atau
organisasi (data operasional, data transaksional, atau data lainnya) ke
dalam bentuk pengetahuan.
Aplikasi
ini
melakukan analisis data-data di
|
57
masa lampau, menganalisisnya dan kemudian menggunakan pengetahuan
tersebut untuk mendukung keputusan dan perencanaan organisasi.
2.2.1.2
Manfaat Business Intelligence
Beberapa keuntungan
yang bisa didapatkan bila suatu organisasi
mengimplementasikan business intelligence adalah sebagai berikut:
a. Meningkatkan nilai data dan informasi organisasi
Melalui
pembangunan
business
intelligence,
maka
seluruh
data
dan informasi dapat diintegrasikan sedemikian rupa sehingga
menghasilkan pengambilan keputusan yang lengkap. Informasi-
informasi
yang
dulunya
tidak
dicakupkan sebagai salah satu faktor
pengambilan keputusan (terisolasi) dapat dengan mudah dilakukan
connect
and
combine dengan
menggunakan
business intelligence.
Data dan informasi yang dihasilkan pun juga menjadi lebih mudah
diakses dan lebih mudah untuk dimengerti (friendly-users info).
b. Memudahkan pemantauan kinerja organisasi
Dalam mengukur kinerja suatu organisasi seringkali dipergunakan
ukuran yang disebut Key Performance Indicator (KPI). KPI tidak
selalu diukur dengan satuan uang, namun dapat juga berdasarkan
kecepatan
pelaksanaan suatu
layanan. Business
intelligence
dapat
dengan mudah menunjukkan pencapaian KPI suatu organisasi dengan
mudah, cepat dan
tepat.
Dengan demikian akan
memudahkan pihak -
|
58
pihak
yang
terlibat
dalam
pengambilan
keputusan
untuk
langkah
-
langkah antisipasi yang diperlukan.
c. Meningkatkan nilai investasi teknologi informasi yang sudah ada
Business Intelligence tidak
perlu/harus
mengubah
atau
menggantikan
sistem informasi
yang
sudah
digunakan
sebelumnya.Sebaliknya,
Business
Intelligence hanya
menambahkan
layanan pada sistem-sistem tersebut sehingga data dan informasi
yang
sudah
ada
dapat menghasilkan informasi yang komprehensif dan
memiliki kegunaan yang lebih baik.
d. Menciptakan pegawai yang memiliki akses informasi yang baik (well-
informed workers)
Dalam melaksanakan pekerjaannya sehari-hari, seluruh
level dari
suatu
organisasi
(mulai
dari pegawai/bawahan
sampai
dengan
pimpinan) selalu berkaitan dan/atau membutuhkan akses data dan
informasi. Business Intelligence
mempermudah
seluruh
level
pegawai dalam
mengakses data dan
informasi yang diperlukan
sehingga membantu membuat suatu keputusan.Jika seperti ini tercapai,
maka
misi
dan
strategi
organisasi yang sudah ditetapkan dapat
dengan lebih mudah terlaksana terpantau tingkat pencapaiannya.
|
59
e. Meningkatkan efisiensi biaya
Business Intelligence dapat
meningkatkan
efisiensi
karena
mempermudah seseorang dalam melakukan
pekerjaan,
hemat
waktu
dan mudah pemanfaatannya. Waktu yang dibutuhkan untuk mencari
data dan mendapatkan informasi yang dibutuhkan semakin singkat dan
cara untuk mendapatkannya pun tidak memerlukan pengetahuan
(training) yang rumit. Dengan demikian training-training yang bisanya
sering
dilakukan
dengan
biaya
yang cukup
besar, dapat dihemat
sedemikian rupa.
2.2.2
Internet
Teori mengenai internet meliputi :
2.2.2.1 Definisi Internet
Internet adalah kumpulan
jaringan yang mempunyai
mekanisme
berkemampuan untuk menyebarkan informasi di
seluruh
dunia
dan
sebuah
media untuk berkolaborasi dan
berinteraksi antara individu-individu dengan komputernya tanpa
memperhatikan lokasi geografisnya.
Internet
menurut
Oetomo et
al
(2003,
p.157) adalah
sebuah jaringan komputer yang sangat besar yang terdiri dari
jaringan-jaringan kecil yang saling
terhubung
yang
menjangkau
seluruh dunia.
|
60
Internet yang digunakan orang saat ini, bermula dari
jaringan komputer yang digunakan oleh departemen pertahanan
Amerika Serikat. Jaringan komputer tersebut dikenal dengan
ARPANET, yang
digunakan pada saat terjadinya perang dingin
antara Amerika dengan Rusia. Selanjutnya ARPANET
dikembangkan menjadi jaringan yang lebih luas lagi yang disebut
internet. Perkembangan internet menjadi sangat pesat, karena
banyak
fasilitas
yang
ditawarkan
seperti e-mail,
USENET,
newsgroup, file transfer, telnet, bulletin board service, WWW,
Internet Telephony dan Internet Fax.
(Oetomo et al, 2003, p.71)
2.2.2.2 Mekanisme Internet
Internet bekerja dalam jaringan yang besar, karena itu
untuk
melakukan
perpindahan
data antar
komputer
dibutuhkan
beberapa hal seperti alamat tujuan dan perantara (Internet Service
Provider) serta sebuah protokol untuk menjamin sampainya data
pada tujuan.
Untuk menghubungkan host-host dalam internet
digunakan
protokol
TCP/IP
(Transmission Control Protocol /
Internet Protocol). TCP (Transmission Control Protocol)
berfungsi untuk membagi-bagi informasi yang akan dikirim
menjadi
paket
data
yang
kecil dan
merakitnya
kembali
menjadi
bentuk aslinya, sedangkan IP (Internet Protocol) berfungsi untuk
|
61
menjamin paket
yang dikirim mencapai tujuan dimana standar IP
membagi alamat menjadi sepuluh digit dengan setiap kelompok
digit memiliki referensi pengalamatan tersendiri.
TCP/IP
dibangun
dalam sistem
operasi
UNIX
dan
digunakan
oleh
internet,
menjadikan
TCP/IP sebagai
standar de
facto
untuk transmisi
data
dalam
jaringan.
Bahkan
TCP/IP
didukung
oleh
sistem operasi
jaringan
yang
memiliki
protokol
sendiri (misalnya Netware).
2.2.2.3 Protokol Aplikasi di Internet
Ada beberapa jenis protokol aplikasi dalam internet
yang
dikenal yaitu:
File Transfer Protocol (FTP)
Berdasarkan pendapat Oetomo et al (2003, p72) File
Transfer
Protocol
(FTP) adalah
suatu
protokol
yang
memungkinkan perusahaan dan konsumen berkomunikasi
secara interaktif dengan komputer-komputer
lain
yang sedang
terhubung
dalam internet.
FTP
menyediakan
fasilitas
penyalinan
file secara elektronik dari
satu komputer ke
komputer lainnya melalui internet.
Berdasarkan pendapat McLeod (2001, jilid 1, p76) File
Transfer
Protocol
(FTP) adalah
perangkat
lunak
yang
memungkinkan
user
untuk
menyalin
file ke
komputer
dari
Website mana saja.
|
62
Hypertext Transfer Protocol (HTTP)
Protokol
yang
digunakan
oleh web
server
untuk
mengirim dan
menerima
informasi.
Bisa
digunakan
untuk
mengirim
dan
menerima
teks,
grafik,
gambar,
suara,
video,
dan file multimedia lainnya. (Oetomo et al, 2003, p155)
adalah sebuah protokol yang
berfungsi sebagai suatu sistem pendistribusian dan
penggunaan informasi secara bersama di internet.
Gopher
Protokol yang dikembangkan oleh Universitas
Minnesota sebagai suatu cara untuk mengambil dokumen.
Selanjutnya,
Gopher
dimodifikasi
menjadi
sistem yang
digerakkan oleh menu yang digunakan untuk
mengambil file.
(McLeod, 2001, jilid 1, p77).
Telnet
Protokol ini digunakan untuk berhubungan dengan
komputer lain di dalam internet. (Oetomo et al, 2003, p2)
2.2.3
Data Flow Diagram (DFD)
Data Flow Diagram (DFD)
(Parno, 2000) adalah representasi
pembuatan
model
yang
memungkinkan
professional
sistem untuk
menggambarkan
sistem
sebagai
suatu
jaringan
proses
fungsional
yang
|
![]() 63
dihubungkan satu sama lain dengan alur data, baik secara manual maupun
komputerisasi.
Yang
membedakan
DFD dengan
flowchart adalah
DFD
menunjukkan
aliran
dari
data
sedangkan flowchart
menunjukkan aliran
kontrol dari suatu program. Sebuah DFD dapat juga digunakan untuk
visualisasi dari proses data.
2.2.3.1 Notasi-Notasi DFD
Ada
beberapa
notasi
yang
berbeda
dalam
mendesain
DFD.
Notasi-notasi tersebut antara lain:
Gambar 2.11 Notasi-notasi DFD
2.2.4
State Transition Diagram (STD)
Menurut
Whitten
(2004,
p673),
State
Transition Diagram
digunakan untuk menggambarkan urutan dan variasi dari layar yang bisa
ditampilkan
ketika
pengguna
sistem berada
pada
terminal.
Kita
dapat
membayangkannya
sebagai
peta
jalan.
Setiap
layar
sebagai
analogi dari
setiap kota. Tidak semua jalan melewati semua kota. Segiempat
digunakan untuk mewakili tampilan layar. Panah mewakili aliran kendali
|
64
dan kejadian pemicu yang menyebabkan layar menjadi aktif atau
mendapatkan fokus. Segiempat hanya menerangkan apa yang dapat
muncul selama interaksi. Arah panah menandakan urutan dimana layar-
layar ini ditampilkan. Setiap panah,
masing-masing
dengan
labelnya
sendiri, digambar dengan arahnya masing-masing karena tindakan
berbeda memicu aliran kendali dari dan kepada sebuah layar yang ada.
2.2.5
Sistem Penjualan
Penjualan menurut Mulyadi (1993, p199) dibagi menjadi tiga
yaitu penjualan tunai, penjualan kredit dan sistem retur penjualan.
Sistem penjualan
tunai
dilaksanakan
oleh
perusahaan
dengan
cara
mewajibkan pembeli melakukan pembayaran harga barang terlebih
dahulu sebelum barang diserahkan oleh perusahaan kepada pembeli.
Dokumen yang digunakan yang untuk sistem penjualan tunai
adalah :
1. Faktur penjualan tunai
2. Bukti setor bank
3. Pita register kas
4. Rekap harga pokok penjualan
Sistem penjualan kredit dilaksanakan oleh perusahaan dengan
cara mengirimkan barang dengan order yang diterima dari pembeli dan
untuk jangka waktu tertentu, perusahaan mempunyai tagihan kepada
pembeli
tersebut.
Dokumen
yang
digunakan
untuk
sistem penjualan
kredit adalah :
|
65
1. Surat order pengiriman dan tembusan
2. Faktur dan tembusan
Sistem retur
penjualan terjadi
jika
pembeli
mengembalikan
barang yang
dibelinya kepada perusahaan penjual barang tersebut.
Pengembalian barang oleh pembeli harus diotorisasi oleh bagian order
penjualan dan diterima oleh bagian penerimaan barang di perusahaan
penjualan
barang
tersebut.
Dokumen
yang
digunakan
dalam transaksi
retur penjualan adalah memo kredit dan laporan penerimaan barang.
2.2.6
Sistem Pembelian
Sistem pembelian
menurut
Mulyadi
(1993,
p305)
digunakan
dalam perusahaan
untuk
pengadaan
barang
yang
diperlukan
oleh
perusahaan. Transaksi pembelian dapat digolongkan menjadi dua yaitu
pembelian impor dan pembelian lokal. Pembelian lokal adalah
pembelian dari pemasok dalam negeri, sedangkan pembelian impor
adalah pembelian dari pemasok luar negeri.
Informasi
yang
diperlukan
oleh manajemen
dari
kegiatan
pembelian adalah :
1. Jenis persediaan
yang telah
mencapai titik pemesanan kembali
(reorder point).
2. Order pembelian yang telah dikirim oleh pemasok.
3. Order pembelian yang telah dipenuhi oleh pemasok.
4. Total saldo utang dagang pada tanggal tertentu.
5. Saldo utang dagang kepada pemasok tertentu.
|
66
6. Tambahan kuantitas dan harga pokok persediaan dari pembelian.
Dokumen yang digunakan dalam sistem pembelian adalah :
1. Surat permintaan pembelian
2. Surat permintaan penawaran harga
3. Surat order pembelian
4. Laporan penerimaan barang
5. Surat perubahan order
6. Bukti kas keluar
2.2.7
Sistem Persediaan
Sistem persediaan menurut Mulyadi (1993, p555) bertujuan
untuk mencatat mutasi tiap jenis
persediaan yang disimpan dalam
gudang.
Dalam perusahaan
manufaktur,
persediaan
terdiri
dari
:
persediaan produk jadi, persediaan produk
dalam
proses,
persediaan
bahan baku, persediaan bahan penolong, persediaan bahan habis pakai
pabrik,
dan
persediaan
suku
cadang.
Dalam perusahaan
dagang,
persediaan
hanya
terdiri
dari
satu golongan,
yaitu
persediaan
barang
dagangan, yang merupakan barang yang
dibeli
untuk
dijual
kembali.
Transaksi yang mengubah persediaan produk jadi, persediaan bahan
baku, persediaan bahan penolong, persediaan bahan habis pakai pabrik,
dan
persediaan
suku
cadang,
bersangkutan
dengan
transaksi intern
perusahaan dan transaksi yang menyangkut
pihak
luar
perusahaan
(penjualan dan pembelian), sedangkan transaksi yang mengubah
|
67
persediaan produk dalam proses seluruhnya berupa transaksi intern
perusahaan.
|