BAB 2
LANDASAN TEORI
2.1.
Teori Teori Umum
2.1.1.
Pengertian Data, Informasi, dan Database
Menurut Turban Rainer Potter (2001,p17), Data are raw facts
or elementary descriptions of things, events, activities, and
transactions, that are captured, recorded, stored and classified, but
not organized to convey
any specific meaning, yang berarti data
merupakan
fakta
mentah
atau
deskripsi
awal
mengenai
suatu
barang,
kejadian,
aktifitas,
dan
transaksi
yang
diperoleh,
disimpan,
dan
diklasifikasikan,
namun
tidak diorganisasikan untuk
menyampaikan arti yang spesifik.
Menurut
Turban
Rainer
Potter
(2001,p17),
Information
is a
collection of facts(data)
organized in some manner so that they are
meaningful to a recipient, yang berarti informasi adalah sekumpulan
data yang sudah diolah, dibentuk,
atau dimanipulasi sesuai dengan
keperluan tertentu sehingga mempunyai arti bagi penerima. Informasi
dapat berbentuk dokumen, laporan ataupun multimedia.
Menurut Thomas Connoly (2005, p14),
Database is a shared
collection of logically related data, and a description of this data,
designed
to
meet the information needs of an organization
,
yang
berarti
bahwa
database
merupakan suatu
kumpulan
dari
data
yang
|
berhubungan
secara
logika
dan
diskripsi
dari
data
data
tersebut,
yang didesign untuk kebutuhan informasi dari suatu organisasi.
Jadi,
dapat
disimpukan
bahwa data
merupakan
suatu
bentuk
keterangan
dalam bentuk
teks
maupun
numerik
yang
didapat
dari
berbagai
macam
sumber
yang
belum
diolah
atau
dimanipulasi
menjadi
informasi. Data suatu perusahaan pada
umumnya diperoleh
dari hasil kegiatan operasional sehari-hari
atau
hasil
transaksi.
Informasi adalah hasil dari pengolahan data-data untuk membuat
analisa
kegiatan
operasional
yang telah
dilakukan
oleh
perusahaan,
yang pada akhirnya dapat membantu perusahaan mengambil
keputusan untuk menentukan strategi perusahaan selanjutnya.
Sedangkan database merupakan kumpulan data yang disimpan dalam
tabel
tabel yang saling berhubungan, dan digunakan oleh sistem
aplikasi
dalam perusahaan,
yang
dirancang
agar
sesuai
dengan
informasi yang dibutuhkan oleh suatu perusahaan.
2.1.2.
Pengertian OnLine Transaction Processing (OLTP) dan OnLine
Analytical Processing (OLAP)
OLTP
(On-Line
Transaction
Processing) menggambarkan
kebutuhan
sistem dalam
ruang
lingkup
operasional
dan
merupakan
proses
yang
mendukung
operasi
bisnis sehari-hari. Sebuah
perusahaan biasanya
memiliki
sejumlah sistem sistem OLTP
yang
berbeda
untuk proses
-
proses bisnis seperti pengontrolan
inventory,
faktur pelanggan, dan point-of-sale. Sistem sistem ini menghasilkan
|
![]() data operasional
yang mendetil, bersifat current (terbaru), dan dapat
diperbaruhi.
Sistem -
sistem OLTP
dioptimalkan
untuk
sejumlah
transaksi
yang bersifat dapat diprediksi, berulang, dan dapat
diperbaruhi. Data OLTP diatur
menurut kebutuhan transaksi yang
berhubungan
dengan
aplikasi
bisnis
dan
mendukung
keputusan
sehari-hari untuk sejumlah pengguna operasional.
OLAP(On-Line
Analytical
Processing) adalah proses analisis
sejumlah
besar
data
multidimension yang
bersifat
dinamis.
OLAP
dideskripsikan sebagai sebuah teknologi yang menggunakan suatu
view bersifat multidimension mengenai sejumlah data yang
teragregasi dan menyediakan akses
informasi
yang
strategis
untuk
kebutuhan analisis lebih lanjut. OLAP memungkinkan pengguna
memperoleh
pengertian
dan
pengetahuan yang lebih mendalam
mengenai berbagai aspek data perusahaan melalui akses data yang
cepat, konsisten, dan interaktif. OLAP
dapat
membantu
proses
pengambilan keputusan untuk menanggapi kejadian yang akan
datang.
Berikut ini adalah table perbandingan OLTP dan OLAP :
OLTP
OLAP
Digunakan
untuk
mendukung
kegiatan
transaksi sehari-hari
Digunakan untuk mendukung kegiatan
Analisis
Menggunakan view single dimensi
Menggunakan view multi dimensi
Mendukung keputusan sehari-hari
Mendukung keputusan masa depan
|
![]() Tidak bergantung pada OLAP
Bergantung pada data yang tersimpan
dalam sistem OLTP
Melayani pengguna operasional
Melayani pengguna managerial
Operasi query-nya sederhana dan
berulang-ulang
Operasi query-nya lebih rumit, bersifat
ad hoc, dan tidak melibatkan operasi
update data
Menggunakan data sehari-hari
Menggunakan data yang terangkum
dalam data cube
Tabel 2.1 Perbedaan OLAP dan OLTP
2.2.
Konsep Data Warehouse
2.2.1.
Pengertian Data Warehouse
Menurut W.H. Inmon (2005, p389), A data warehouse is a
collection of integrated, subject oriented databases designed to
support the DSS function, where each unit of data is relevant to some
moment
in
time,
yang
mengandung
pengertian
bahwa Data
Warehouse merupakan kumpulan database yang bersifat berorientasi
subjek dan terintegrasi yang dirancang untuk mendukung sistem
pengambilan keputusan (DSS), dimana setiap data berhubungan
dengan suatu kejadian pada suatu waktu.
Menurut
Turban Rainer Potter
(2001,G-4),
A
data
warehouse
is a centralized repository of corporate data, needed mainly for
internally-oriented decision support extracted from transaction
|
processing system, corporate suppliers data and external database,
yang berarti sebuah
data warehouse
adalah penyimpanan gabungan
data secara terpusat, diperlukan khususnya untuk decision support
internal
yang
diekstrak
dari
sistem proses
transaksi,
gabungan data
pemasok dan database eksternal.
Menurut Ralph Kimball(2004), A data warehouse is a copy of
transaction data specifically structured for querying and reporting.
yang artinya data warehouse adalah salinan (copy) dari data transaksi
yang tersusun untuk laporan dan query.
Dari definisi-definisi diatas dapat ditarik suatu kesimpulan yaitu
data warehouse adalah suatu tempat penyimpanan data yang
mengintegrasikan
data-data
perusahaan dari
berbagai
sumber
ke
dalam sebuah
penyimpanan
tunggal
dimana
pengguna
dapat
lebih
mudah mengambil data, menghasilkan laporan, dan melakukan
analisis, sehingga dapat mendukung
pengambilan keputusan pihak
eksekutif perusahaan.
Data-data
dari
operational database
dan
external
source
diekstrak,
disaring,
di-summary
dan
kemudian
di-load ke
data
warehouse. Karena
data warehouse mengandung
data-data
historis,
maka seringkali aktivitasnya meliputi pengambilan kembali data-data
yang telah benar-benar di rangkum (summarized).
|
2.2.2.
Karakteristik Data Warehouse
Karakteristik data warehouse menurut W.H. Inmon (2005, p31)
dan Connolly (2005, p1047) adalah sebagai berikut:
1. Subject-oriented
Data
warehouse
diatur
sesuai
dengan
subjek-subjek utama
perusahaan (seperti pelanggan, produk, dan penjualan), bukan
sesuai dengan area aplikasi utama
(seperti faktur pelanggan,
pengontrolan stok, dan penjualan
produk). Ini didasari dengan
kebutuhan
untuk
menyimpan
data yang
mendukung
keputusan,
bukan data berorientasi aplikasi.
2. Integrated
Data dalam data warehouse bersifat terintegrasi karena bersumber
dari
sistem-sistem aplikasi
yang
berbeda
dalam perusahaan.
Sumber data demikian sering tidak
konsisten,
misalnya
karena
berbeda
format.
Sumber
data
yang terintegrasi
ini
harus
dibuat
konsisten
untuk
memberikan
data
yang
seragam pada
para
pengguna.
3. Time-variant
Data dalam data warehouse bersifat tepat dan valid dalam jangka
waktu
tertentu.
Data
dalam data
warehouse
terdiri
dari
serangkaian snapshot, masing-masing menunjukkan data
operasional yang diambil pada suatu waktu tertentu.
|
4. Non-volatile
Data
dalam
data
warehouse
tidak
di-update
dalam real
time
melainkan
diperbaruhi
secara
periodik
dari
sistem operasional.
Data baru selalu ditambahkan sebagai tambahan bagi data
waerhouse, bukan sebagai pengganti. data waerhouse secara terus
menerus mengambil data baru, menambahkannya dan
mengintegrasikannya dengan data sebelumnya.
2.2.3.
Anatomi Data Warehouse
Anatomi yang digunakan adalah data warehouse terpusat. Data
warehouse terpusat merupakan pendekatan data warehouse
dimana
data diambil dari seluruh sistem yang ada kemudian disimpan di
dalam pusat penyimpanan data, yang kemudian dapat digunakan
untuk membuat data warehouse fungsional sesuai dengan kebutuhan.
User yang membutuhkan data dapat langsung mengambil data dari
kumpulan data tersebut, karena itu pendekatan terpusat ini merupakan
pendekatan paling baik yang digunakan. Penggunaan pendekatan
terpusat ini membutuhkan cost yang cukup besar dan
membutuhkan
waktu yang lama untuk membangun sistem tersebut.
|
![]() Gambar 2.1 Data Warehouse Terpusat
Sumber:
2.2.4.
Arsitektur Data Warehouse
Gambar 2.2 Arsitektur Data Warehouse
Sumber : Database Systems(Connoly,2005)
|
Komponen komponen utama sebuah data warehouse antara lain:
1. Operational Data
Data-data untuk data warehouse yang dapat bersumber dari :
-
Mainframe data
operasional
yang
berada
pada
tingkatan
database generasi pertama dan database jaringan.
-
Data departemen yang berada pada sistem file seperti
VSAM, RMS , dan DBMS Relational
-
Data pribadi yang ada di server pribadi , bila ada.
-
Sistem-sistem
eksternal
seperti
internet atau database
yang
berbungan dengan pemasok atau pelanggan
perusahaan.
2. Operational Data Store
Operational Data Store atau ODS merupakan
sebuah tempat
penyimpanan data operasional yang akan digunakan untuk
kebutuhan analisis . ODS
merupakan
tempat
penyimpanan
sementara sebelum data dipindahkan ke data warehouse.
3. Load Manager
Load Manager melakukan semua
operasi yang berhubungan
dengan mengambil data dan meletakkan data ke data warehouse .
Data data diambil atau diekstrak dari operational datastore .
|
4. Warehouse Manager
Warehouse manager melakukan semua operasi yang berhubungan
dengan manajemen data di dalam data warehouse. Operasi-
operasi yang dilakukan antara lain :
-
Melakukan analisis data untuk menjaga konsistensi
data.
-
Melakukan
transformasi dan penggabungan data
sumber dari ODS ke dalam-dalam tabel-tabel
data
warehouse.
-
Menciptakan indeks dan view pada base tables.
-
Melakukan denormalisasi (jika diperlukan).
-
Melakukan agregasi (jika diperlukan).
-
Melakukan back-up dan archive / penyimpanan data.
5. Query Manager
Query manager melakukan semua operasi yang berhubungan
dengan
manajemen user queries. Komponen ini dibangun
menggunakan vendor end-user data access tools, data warehouse
monitoring tools,
fasilitas
database, dan custom-built programs.
Kompleksitas
query
manager
ditentukan oleh fasilitas yang
disediakan oleh end-user access tools dan database. Operasi yang
dilakukan oleh komponen ini berupa pengarahan query pada
tabel-tabel yang tepat dan penjadwalan eksekusi query.
|
6. Detailed Data
Menyimpan semua data detil dalam skema database.Detil
data ini dapat diperoleh dengan
melakukan agregasi. Data detil
ditambahkan ke dalam data warehouse secara periodik untuk
mendukung agregasi data.
Alasan perlu diperhatikannya detailed
data adalah sebagai berikut:
a. Menggambarkan kejadian yang baru terjadi dan selalu
menjadi perhatian utama.
b. Hampir selalu disimpan di media penyimpanan karena cepat
diakses tetapi mahal dan kompleks dalam pengaturannya.
c. Dapat digunakan dalam membuat rekapitulasi sehingga
current detail data harus akurat.
7. Lightly and Highly Summarized Data
Menyimpan semua data yang telah diringkas oleh data warehouse
manager . Tujuan dari peringkasan data yang ada yaitu untuk
mempercepat
performa
query. Setiap
ada
data baru
yang
masuk
ke
dalam data
warehouse
,
ringkasan data
akan terus
diperbaharui.
Lightly
summary
data
adalah ringkasan dari data tingkat
rendah yang terdapat pada data detail yang sedang aktif (current
detail data), tetapi belum bersifat total summary (ringkasan secara
total). Data
ini banyak ditampilkan dalam bentuk view dari
kondisi yang sedang berjalan atau sudah berjalan.
|
Highly summary data adalah suatu hasil data yang bersifat
total summary (ringkasan secara total). Data ini tersusun rapi dan
mudah diakses terutama untuk melakukan analisis perbandingan
data berdasarkan urutan waktu dan analisis yang menggunakan
data multi dimensi. Sumber data tersebut dapat berasal dari data
yang sedang aktif ataupun di luar data warehouse.
8. Archive/Backup Data
Menyimpan detil data dan juga ringkasan data dengan tujuan
untuk mem-backup data. Data-data yang di-backup kemudian
dapat disimpan di media pemyimpanan data seperti magnetic tape
atau optical disc.
9. Meta Data
Meta data merupakan data tentang data. Yaitu data yang berisi
informasi mengenai data-data yang terdapat pada data warehouse
tersebut.
Meta data dapat digunakan untuk :
-
Proses
extract
dan
loading data
,
memetakan
sumber
data dalam data warehouse.
-
Proses
dalam
manajemen data
warehouse.
Meringkas
data dari data detail menjadi lightly summary data dan
dari lightly summary
data
menjadi
highly
summary
data.
|
-
Sebagai bagian dari proses manajemen query,
mengarahkan query ke sumber data yang tepat. Suatu
panduan
pemetaan data pada saat data
ditransformasi/diubah dari lingkup data operasional
menjadi lingkup data warehouse.
10. End-User Access Tools
Merupakan tools yang digunakan oleh para pengguna
untuk
berinteraksi dengan data warehouse.
-
Reporting and Query Tools
Digunakan
untuk
menghasilkan
laporan secara
berkala,
sedangkan
query tools digunakan untuk
menerima
SQL
atau
menghasilkan SQL statements
untuk proses query data yang ada di data warehouse.
-
Application Development Tools
Menggunakan Graphical Access Tools yang digunakan
untuk
client
server environment.
Aplikasi
yang
ada
diintegrasikan dengan OLAP
tools
dan dapat
mengakses semua sistem database utama.
-
Executive Information System(EIS) Tools
Suatu tools yang dikembangkan untuk mendukung
keputusan high level yang strategis.
|
-
Online Analitical Processing(OLAP) Tools
Tools yang mengsumsikan bahwa data diatur dengan
model multidimensi yang didukung dengan Database
Multi Dimensi atau sebuah relational database.
-
Data Mining Tools
Tools untuk melalukan penggalian sejumlah data
menggunakan teknik statistik, matematis, dan artificial
intelligence.
2.2.5.
Granularity
Menurut W.H. Inmon (2005, p43), Granularity refers to the
level of detail or summarization of the units of data in the data
warehouse, yang mengandung pengertian bahwa
granularity
merupakan
tingkat detail ringkasan dari data data yang ada.
Semakin
detail
ringkasannya maka
semakin
rendah
tingkat
granularity tersebut, semakin tidak detail ringkasannya maka semakin
tinggi tingkat granularity yang ada. Hal yang perlu diperhatikan
adalah
tingkat granularity tidak boleh terlalu rendah
maupun tinggi.
Ketika
granularity
yang
diperlukan
sudah
ditentukan
maka
desain
dan
implementasi
akan
berjalan
dengan
baik. Granularity akan
berpengaruh bagaimana efisiennya data yang disimpan untuk sebagai
pertimbangan analisis oleh manajemen suatu perusahaan.
|
2.2.6.
Data Flow dalam Data Warehouse
Aliran data dalam data warehouse terdapat lima aliran data
utama (Connolly ,2005 ,p1162), yaitu:
1. Inflow
Inflow
adalah
proses
penggabungan
dengan Extraction,
Cleansing, and Loading data dari sistem sumber ke data
warehouse.
2. Upflow
Upflow adalah proses penggabungan dengan penambahan
nilai ke data di dalam data warehouse
melalui ringkasan,
packaging, dan distribusi data.
3. Downflow
Downflow adalah proses penggabungan dengan arsip dan
back up data di dalam data warehouse.
4. Outflow
Proses penggabungan dengan membuat data menjadi siap
pakai bagi end user, alias informasi.
5. Metaflow
Proses penggabungan dengan manajemen meta data.
2.2.7.
Skema Data Warehouse
2.2.7.1.Tabel Fakta
Menurut
Thomas
Connoly
(2005,p1183),
Every
dimensional model(DM) is composed of one table with a
|
composite primary key, called the fact table, yang berarti
tabel
fakta
adalah
satu
tabel
pada DM
yang
isinya
composite Primary Key(PK).
Jadi
PK pada
tabel
fakta
merupakan beberapa Foreign Key(FK).
2.2.7.2.Tabel Dimensi
Menurut
Thomas
Connoly
(2005,p1183),
a set of
smaller
tables
called
dimesion
tables,
yang
berarti
tabel
dimensi
adalah
sekumpulan
tabel-tabel
yang
lebih
kecil
dari tabel fakta pada DM. Setiap tabel dimensi mempunyai
non-composite PK.
2.2.7.3.Pemodelan Dimensional
Menurut Thomas
Connoly (2005,p1183),
Dimensionality
modelling
is a logical design technique
that aims to present the data in a standard, intuitive form
that allows for high-performance access, yang berarti
pemodelan dimensional
adalah
teknik desain
logika
yang
bertujuan
untuk
menyajikan
data
dalam
standard,
bentuk
intuitif yang mempunyai akses performa tinggi.
2.2.7.4.Skema Bintang
Skema bintang atau Star Schema
adalah struktur
logika yang mempunyai sebuah tabel fakta yang berisi
|
data
faktual
di
tengahnya
dan
dikelilingi
oleh
tabel
dimensi yang berisikan data referensi (dimana data bisa
didenormalisasi).
Keuntungan memakai Skema Bintang adalah sebagai
berikut :
a.
Efisiensi, struktur relational skema
bintang yang
sederhana membuat data menjadi lebih efisien,
sehingga
membantu proses pengaksesan data
menggunakan
alat
atau
tool
untuk menampilkan
data termasuk yaitu laporan tertulis dan query.
b. Kemampuan
untuk
mengatasi
perubahan
kebutuhan,
skema
bintang
dapat
beradaptasi
terhadap perubahan kebutuhan pengguna, karena
semua tabel dimensi memiliki kesamaan dalam hal
menyediakan akses ke tabel fakta. Artinya bahwa
desain skema sebaiknya mampu mendukung ad
hoc query dari pengguna.
c. Extensibility,
model
dimensional
dapat
dikembangkan. Seperti
menambah tabel fakta
selama data masih konsisten, menambah tabel
dimensi selama ada nilai tunggal di tabel dimensi
tersebut
yang
mendefinisikan
setiap
record tabel
fakta yang ada, menambahkan attribute tabel
dimensi, dan memecah record
tabel dimensi yang
|
ada menjadi level yang lebih rendah dari level
sebelumnya.
d.
Kemampuan untuk menggambarkan situasi bisnis
pada
umumnya,
pendekatan
standar
untuk
menangani
situasi
umum didunia
bisnis
terus
bertambah.
e. Proses query lebih mudah dilakukan, aplikasi data
warehouse
yang
mencari
data
dari level yang
dibawahnya
akan
dengan
mudah
menambah
jumlah atribut pada tabel dimensi dari sebuah
skema bintang. Aplikasi yang mencari data dari
level yang setara akan menghubungkan tabel fakta
yang terpisah melalui tabel dimensi yang dapat
diakses bersama.
2.2.8.
Keuntungan Penggunaan Data Warehouse
Keuntungan yang dapat diberikan oleh sebuah data warehouse
adalah sebagai berikut :
1. Meningkatkan kemudahan user dalam
mengakses data
yang ada
dengan cakupan yang lebih luas.
2. Membantu eksekutif
perusahaan
terutama
di
bagian
manajemen
untuk mengambil keputusan dari laporan-laporan yang ada.
3. Meningkatkan konsistensi data yang ada pada perusahaan.
4. Meningkatkan produktifitas pada pengolahan data.
|
5. Dapat mengintegrasikan atau mengkombinasikan data yang
bersumber dari tempat atau cabang yang berbeda-beda.
2.3.
Perancangan Data Warehouse
Dalam
merancang data warehouse,
perlu dilakukan analisis pada sistem
yang
sedang
berjalan,
fungsi
bisnis
yang ada
di
perusahaan
dan
kendala
yang
ada. Hal ini dilakukan untuk mendapatkan informasi mengenai data data yang
diperlukan dalam membangun aplikasi data warehouse. Analisis sistem
dilakukan
dengan
cara
menganalisis
database
yang
ada
apakah sudah
ternormalisasi dengan benar dan data-data yang diperlukan tersedia.
2.3.1.
Pengertian Dimensionality Modelling
Dimensionality modeling merupakan sebuah teknik perancangan
logikal yang bertujuan untuk menampilkan data dalam bentuk standar
dan
memiliki
akses
performa
tinggi.
Setiap Dimentionality
Model
terbentuk
dari
satu
tabel
dengan primary
key
yang
biasa
disebut
dengan tabel fakta, dan serangkaian tabel yang lebih kecil yang
disebut
tabel
dimensi.
Tiap
tabel
dimensi
memiliki
sebuah
primary
key yang berhubungan dengan sebuah komponen composite key pada
tabel fakta. Dengan kata lain, primary key pada tabel fakta, terbentuk
dari dua atau lebih foreign key. Struktur karakteristik yang
menyerupai bintang ini disebut skema bintang.
Hal penting lainnya dari Dimentionality Model yaitu semua
natural
key
digantikan
dengan
surrogate
key,
dimana
setiap
|
penggabungan dengan tabel fakta
harus
menggunakan surrogate key,
bukan natural key. Setiap surrogate key harus memiliki struktur
umum
berdasarkan
integer
yang
sederhana.
Penggunaan
surrogate
key
memperbolehkan
data
pada data
warehouse
tidak
memiliki
ketergantungan
dengan
data
yang digunakan
dan
diciptakan
oleh
sistem OLTP.
DM pada umumnya digunakan untuk mendesain komponen
database
pada
data
warehouse.
Sedangkan
ER digunakan
untuk
mendeskripsikan sistem
database
OLTP. Model
ER
merupakan
sebuah teknik untuk mengidentifikasi hubungan antara entitas. Fungsi
utama dari model ER adalah untuk
menghilangkan perulangan data
(data
redundancy).
Hal
ini
menguntungkan
dalam pemrosesan
transaksi, karena transaksi - transaksi tersebut menjadi lebih
sederhana. Contohnya: Pada proses update nama produk, akan lebih
mudah apabila hanya melakukan update untuk satu record pada tabel
master daripada harus meng-update banyak record untuk setiap
transaksi. Model ER tidak mendukung perancangan data warehouse,
karena performanya kurang baik dalam pemrosesan data secara
massal.
Kunci utama yang dapat digunakan dalam memahami hubungan
antara ER dengan DM yaitu: sebuah model ER pada umumnya dibagi
menjadi beberapa model DM. Model DM saling berhubungan melalui
tabel-tabel dimensi.
|
2.3.2.
Denormalisasi
Menurut Adelman (2004, p244) denormalisasi adalah suatu
proses penggabungan tabel yang dilakukan dengan cermat dan hati-
hati yang bertujuan untuk meningkatkan kinerja pengaksesan data.
Pada dasarnya denormalisasi
merupakan proses
yang melanggar
aturan third normal form (3NF).
Menurut Mannino (2001, p553) denormalisasi menggabungkan
tabel-tabel
sehingga
dapat mempermudah
dalam melakukan query.
Denormalisasi merupakan kebalikan dari normalisasi. Denormalisasi
berguna untuk meningkatkan kinerja query.
Keuntungan melakukan proses denormalisasi adalah
1.
Mengurangi jumlah relasi yang terjadi antar tabel yang harus
diproses pada saat pencarian, sehingga akan meningkatkan
kecepatan proses query data.
2.
Memetakan struktur fisik database agar mudah dimengerti oleh
pengguna. Struktur tabel yang dibuat sesuai dengan hasil yang
dikehendaki oleh pengguna, dan memungkinkan terjadinya akses
langsung terhadap data.
Sedangkan kelemahan melakukan proses denormalisasi adalah:
1. Proses
denormalisasi
secara
tidak
langsung
akan
membuat
redundansi data.
2. Proses
denormalisasi
memerlukan
alokasi
memory
dan
storage
(tempat penyimpanan) yang besar.
|
2.3.3.
Agregasi
Agregasi merupakan suatu proses penciptaan nilai yang
diperoleh dengan cara menggabungkan (penjumlahan, pengambilan
nilai
minimum/maksimum,
dsb)
nilai
kolom pada
satu
atau banyak
record dalam database yang bertujuan untuk meningkatkan performa
query, karena
nilai
yang ditampilkan
merupakan gabungan dari
banyak record yang ada dalam database.
2.3.4.
Nine-Step Methodology
Metodologi perancangan data warehouse yang dikemukakan
oleh
Kimball
adalah
Nine-Step Methodology (Kimball,
2004).
Pendekatan Kimball
ini
membagi
perancangan
data
warehouse
ke
dalam beberapa bagian yang dapat diatur dengan mudah, disebut data
mart. Kemudian
integrasi dari semua data mart tersebut membentuk
sebuah
data
warehouse
perusahaan.
Langkah-langkah
dalam Nine-
Step Methodology :
1. Menentukan proses (Choosing the process)
Yang
dimaksud
dengan
proses adalah
subjek yang
akan
digunakan pada
data mart.
Data
mart
pertama
yang
perlu
diutamakan yaitu data mart
yang dapat memberikan jawaban
terhadap permasalahan bisnis yang utama dan dapat diselesaikan
dengan
biaya
yang
terjangkau
dalam waktu
yang
sesingkatnya.
Pada umumnya data mart pertama yang perlu diutamakan adalah
data mart yang berhubungan dengan fungsi bisnis penjualan.
|
2. Menentukan tingkatan kedetailan (Choosing the grain)
Memilih grain berarti menentukan data apa yang diwakilkan
oleh sebuah
tabel
fakta. Dengan ditentukannya grain
untuk tabel
fakta, maka dapat diidentifikasikan dimensi - dimensi untuk tabel
fakta tersebut. Keputusan grain
untuk sebuah tabel fakta
juga
menentukan grain untuk masing-masing tabel dimensi.
3. Identifikasi dimensi yang ada (Identifying and conforming the
dimensions).
Dimensi menentukan konteks informasi mengenai fakta -
fakta di dalam tabel fakta. Dimensi yang ditentukan dengan benar
dapat membuat data mart lebih mudah dimengerti dan digunakan.
Dimensi diidentifikasi dengan data detil yang cukup untuk
mendeskripsikan hal-hal misalnya produk, karyawan, dsb. Isi
dimensi yang tidak lengkap dapat mengurangi kegunaan sebuah
data mart bagi perusahaan. Jika terdapat dimensi yang sama pada
dua data mart, maka data mart tersebut harus menggunakan satu
dimensi yang sama. Hanya dengan cara ini, dua atau lebih
data
mart dapat berbagi dimensi pada aplikasi yang sama. Ketika
sebuah dimensi digunakan pada dua data mart atau lebih, dimensi
tersebut disebut conformed.
|
4. Memilih fakta fakta (Choosing the facts)
Grain dari tabel fakta menentukan fakta -
fakta mana yang
dapat digunakan dalam data mart. Semua fakta harus berupa
angka dan dapat dijumlahkan.
5. Menyimpan penghitungan sebelumnya dalam tabel fakta (Storing
pre-calculations in the fact table)
Setelah fakta terpilih, masing-masing
fakta
harus
diperiksa
kembali
untuk
menentukan
apakah terdapat
kemungkinan
untuk
melakukan pre-calculation. Jika ya, maka hasil dari perhitungan
tersebut disimpan kedalam suatu kolom terpisah pada tabel fakta.
6. Mengatur tabel tabel dimensi di sekitar tabel fakta (Rounding out
the dimension tables)
Pada tahap ini, terdapat penambahan deskripsi teks sebanyak
mungkin pada tabel dimensi. Deskripsi teks harus dapat
dimengerti oleh
pengguna.
Kegunaan data
mart
ditentukan
oleh
ruang lingkup dan atribut pada tabel dimensi.
7. Memilih durasi database (Choosing the duration of the database)
Pada
tahap
ini ditentukan durasi transaksi
yang
dapat
dicakup oleh sebuah tabel fakta. Di banyak perusahaan, terdapat
kebutuhan untuk melihat data hingga dua tahun yang lalu. Untuk
perusahaan seperti perusahaan asuransi, terdapat kebutuhan untuk
melihat data hingga lima tahun yang lalu atau lebih. Pertumbuhan
data yang sangat besar pada tabel fakta dapat menyebabkan dua
buah masalah dalam perancangan data warehouse. Pertama, untuk
sumber
data
yang
lama, terdapat kesulitan
dalam
membaca
dan
|
menginterpretasikan informasi yang terdapat pada media
penyimpanan yang lama. Kedua, adalah sebuah keharusan untuk
menggunakan versi lama dari dimensi yang penting, bukan versi
barunya. Kejadian ini dikenal sebagai masalah slowly changing
dimension yang akan dibahas di langkah kedelapan.
8. Melacak secara perlahan perubahan tabel dimensi (Tracking slowly
changing dimensions).
Terdapat 3 jenis slowly changing dimensions :
-
Sebuah atribut dimensi yang berubah di-overwritten (nilai
atribut yang lama diubah dengan yang baru)
Keuntungan :
Jenis ini merupakan cara yang paling mudah untuk menangani
masalah slowly changing dimension, karena tidak perlu
menyimpan atau mencari informasi yang lama.
Kerugian:
Semua sejarah mengenai data yang lama hilang. Dengan
menggunakan metodologi ini, tidak memungkinkan untuk
dilakukan pencarian sejarahnya. Informasi yang lalu mengenai
data tidak diketahui.
-
Sebuah
atribut
dimensi
yang
berubah
menyebabkan
sebuah
record baru diciptakan di dalam dimensi
Keuntungan :
Jenis ini memungkinkan tersimpannya semua informasi yang
lalu.
|
Kerugian:
Jenis kedua
ini akan menyebabkan ukuran tabel tumbuh
dengan cepat. Dengan tabel
yang memiliki
jumlah baris
yang
banyak, penyimpanan dan performa
menjadi suatu hal yang
perlu diperhatikan. Jenis kedua ini juga membuat proses ETL
menjadi rumit.
-
Sebuah
atribut
dimensi
yang
berubah
menyebabkan
sebuah
atribut alternatif diciptakan, sehingga kedua nilai atribut yang
lama
dan
baru
dapat
diakses
secara
bersamaan
dalam suatu
record dimensi yang sama.
Keuntungan :
Jenis ini tidak menyebabkan bertambah besarnya ukuran tabel,
karena
informasi
baru
di-update.
Jenis
ketiga
ini
memungkinkan tersimpannya sebagian informasi yang lalu.
Kerugian :
Jenis ketiga ini
tidak dapat
menyimpan semua informasi
lalu
bila suatu atribut diubah lebih dari sekali.
9. Menentukan prioritas query dan
mode query (Deciding the query
priorities and the query modes).
Pada langkah ini, dipertimbangkan masalah perancangan
secara
fisik. Masalah
perancangan
fisikal
yang mempengaruhi
persepsi
pengguna
akhir
mengenai
data
mart adalah
kehadiran
ringkasan
atau
agregasi
data
yang
telah
tersimpan,
dan
hal-hal
|
lainnya yang mencakup administrasi, backup, performa index, dan
keamanan.
Pada
akhir
metodologi
ini, telah
dihasilkan
sebuah
rancangan data mart yang
mendukung kebutuhan
sebuah
proses
bisnis
tertentu
dan
juga
memungkinkan integrasi yang mudah
dengan
data
mart
lainnya
untuk
membentuk
sebuah data
warehouse perusahaan.
2.3.5.
Extraction Transformation Loading (ETL)
Merupakan suatu cara bagaimana
data
dapat
dimasukkan
ke
dalam data warehouse.
Dimana caranya
terbagi
menjadi tiga tahap
yaitu:
1. Extract
Tahap Extract
merupakan
proses
mengambil
data
dari
sumber data. Data warehouse biasa mengambil data dari berbagai
sumber
yang
terpisah.
Dan
setiap
sistem dimana
data
tersebut
diambil mungkin juga menggunakan format data yang berbeda.
Format sumber data yang paling umum adalah relational
databases
dan
flat
files,
tetapi
dapat
juga
meng-include non-
relational database structure seperti IMS atau struktur data yang
lain
seperti
VSAM
atau
ISAM.
Di
bagian
Extraction termasuk
mengubah data ke dalam format untuk transformation processing.
|
2. Transform
Pada tahap ini mengaplikasikan beberapa rules dan function
pada data-data
yang
telah di extract sehingga data siap untuk di
load. Beberapa sumber data mungkin memerlukan sedikit
manipulasi data . Dalam kasus lain diperlukan juga beberapa tipe
tipe transformasi
seperti :
-
Memilih hanya beberapa kolom yang di load.
-
Translating coded values, biasa disebut data cleansing.
-
Membuat lambang
untuk
nilai-nilai tertentu(encoding free
form
values)
.contoh
: mapping
"Male"
dan
"1"
dan
"Mr"
menjadi M.
-
Membuat suatu hasil perhitungan baru.
-
Menggabungkan data dari banyak sumber.
-
Meringkas banyak baris data.
-
Meng-generate nilai-nilai surrogate key.
-
Transposing atau pivoting (mengubah multiple columns
menjadi multiple rows).
-
Memecah sebuah kolom menjadi banyak kolom.
3. Load
Pada
tahap ini
data
di load ke
data warehouse. Proses
ini
tergantung dari kebutuhan dari organisasi. Waktu dan scope untuk
mengganti
bergantung
dari
waktu
yang
tersedia
dan
kebutuhan
dari bisnis.
|
2.3.6.
Data Transformation Services (DTS)
Kebanyakan perusahaan memiliki
berbagai
format
dan
lokasi
penyimpanan data
yang berbeda. Ketika perusahaan akan melakukan
decision-making, meningkatkan performa sistem atau upgrade sistem
yang ada, data akan sering dipindahkan dari tempat yang satu ke
tempat lainnya. DTS adalah seperangkat piranti yang bisa digunakan
untuk
import, export dan transform berbagai macam data antara satu
atau
lebih sumber
data,
contohnya
Microsoft
SQL
Server, Microsoft
Excel atau Microsoft Access.
2.3.7.
Pengertian Data Mart
Menurut Peterson (2000, p54), Data Mart adalah kumpulan data
yang lebih kecil dari data warehouse yang digunakan untuk
melakukan analisis bisnis di satu divisi.
Data
mart
adalah sebuah
bagian
dari
data
warehouse
yang
mendukung kebutuhan sebuah departemen atau fungsi bisnis tertentu.
Sebuah data mart
menyimpan sebagian data dalam data warehouse,
biasanya berupa data berisi
ringkasan yang berhubungan dengan
sebuah departemen atau fungsi bisnis tertentu.
Karakteristik yang membedakan data mart dan data warehouse
antara lain :
a.
Sebuah data mart
berfokus hanya pada kebutuhan pengguna
yang berhubungan dengan sebuah departemen atau fungsi
bisnis.
|
b. Data mart biasanya tidak berisi data operasional yang
mendetil, tidak seperti data warehouse.
c. Karena data mart berisi data yang lebih sedikit dibandingkan
dengan data warehouse, data mart lebih mudah dimengerti.
Ada beberapa
pendekatan
untuk
membangun data mart.
Salah
satunya
adalah
membangun
beberapa data
mart
yang
akan
berkelanjutan
untuk
diintegrasikan
menjadi
sebuah data
warehouse.
Pendekatan lainnya adalah membangun
infrastruktur data warehouse
perusahaan pada saat
yang bersamaan dibangun pula satu data mart
atau lebih untuk memenuhi kebutuhan bisnis yang berlangsung.
2.3.8.
Analysis Services
Analysis
Services adalah
middle-tier
server
yang
digunakan
untuk
On
Line
Analytical
Processing (OLAP)
dan
data mining.
Akses data yang cepat ke data warehouse disediakan oleh Microsoft®
SQL Server 2000 Analysis Services. Data dari data warehouse di
extract, diringkas, diatur, dan disimpan di dalam struktur
multidimensional untuk mempercepat respon ke query end user. Hasil
dari proses ini dinamakan dengan cube.
Cube merupakan satu set data yang dibangun dari subset data
warehouse
dan
terorganisasi. Cube
diringkas
dalam
struktur
multidimensional
yang dibatasi oleh dimensions dan measures. Cube
menyediakan mekanisme yang mudah digunakan untuk mengambil
data dengan cepat. End user
menggunakan aplikasi klien
untuk
|
menghubungkan
ke
analysis
server dan melakukan
query pada
cube
di server. Pada beberapa aplikasi , end user menggunakan query pada
cube dengan memanipulasi user interface control yang kemudian
mendeterminasikan isi dari query.
Kemampuan yang disediakan oleh analysis services yaitu :
-
Mendesign, menciptakan, mengatur cube dari data
warehouse dan menyediakan akses ke data OLAP.
-
Mendistribusikan data di cube melewati banyak server
untuk menyediakan kapasitas penyimpanan yang besar.
-
Menciptakan
linked
cubes
untuk
mendistribusikan
akses
end-user ke
informasi
tanpa
harus
menduplikat
data
di
cube.
-
Menciptakan cube yang
ter-update secara real time ketika
data berubah.
-
Menciptakan
cube yang
mengalamatkan
kebutuhan
bisnis
secara spesifik.
2.3.9.
Analisis Matriks
Analisis matriks dilakukan untuk mendapatkan informasi
mengenai perusahaan, baik itu mengenai bagian
bagian dari
organisasi, fungsi bisnis yang dilakukan, serta subjek data dalam
perusahaan. Kemudian informasi ini dilanjutkan dengan menganalisis
critical
success
factor
perusahaan.
Hasil
dari analisis
analisis
ini
|
diharapkan
untuk
membantu
memahami
kebutuhan
informasi
perusahaan.
Dalam
analisis
matriks
dibutuhkan
pemetaan
antara elemen
elemen berikut, yaitu:
1. Unit organisasi,
yaitu bagian dari organisasi
yang
memilki tugas
khusus yang mendukung pencapaian tujuan dari organisasi.
2. Subjek data, merupakan kumpulan dari entity mengenai data yang
disimpan.
3. Lokasi, yaitu tempat unit organisasi berada.
4. Fungsi bisnis, yaitu sekumpulan aktivitas yang mendukung salah
satu aspek untuk mencapai misi perusahaan. Contohnya :
marketing, produksi, dan distribusi.
2.4.
Terminologi dalam Penjualan
2.4.1.
Penjualan
2.4.1.1. Pengertian Penjualan (selling)
Menurut
Mulyadi
(2001,
p202), penjualan terdiri
dari transaksi penjualan barang atau jasa , baik secara kredit
maupun secara tunai. Di dalam perusahaan yang bergerak di
bidang distribusi, penjualan adalah proses penting dalam
melaksanakan tujuan dari perusahaan untuk kemajuan
perusahaan yang pesat.
Dari definisi diatas dapat ditarik suatu kesimpulan
yaitu
penjualan
adalah
proses
yang
terjadi
antara
penjual
|
dengan pembeli dimana terjadi suatu transaksi baik itu
barang ataupun jasa oleh penjual kepada pembeli yang
menguntungkan keduanya.
2.4.1.2. Sistem Penjualan
Fungsi yang terkait dalam sistem penjualan adalah:
1. Fungsi Penjualan
Fungsi ini bertanggung jawab melayani kebutuhan
barang pelanggan dengan mengisi faktur penjualan yang
memungkinkan fungsi gudang dan pengiriman
melaksanakan penyerahan barang kepada pelanggan.
2. Fungsi Gudang
Fungsi ini menyediakan barang yang diperlukan oleh
pelanggan
sesuai
dengan
yang
tercantum dalam
tembusan faktur penjualan yang diterima dari bagian
penjualan.
3. Fungsi Pengiriman
Fungsi ini bertanggung jawab untuk menyerahkan
barang yang kuantitas, mutu, dan
spesifikasinya
sesuai
dengan yang tercantum dalam tembusan faktur penjualan
yang diterima dari bagian penjualan. Selain itu fungsi ini
juga bertanggung jawab untuk memperoleh tanda tangan
dari pelanggan di atas
faktur penjualan kartu kredit
|
sebagai bukti
telah diterimanya barang
yang dibeli oleh
pelanggan.
4. Fungsi Akuntansi
Fungsi
ini bertanggung jawab
untuk mencatat
transaksi
penjualan di dalam jurnal penjualan
2.4.2.
Retur
2.4.2.1. Pengertian Retur
Retur adalah tindakan pengembalian barang yang
dilakukan oleh konsumen dikarenakan ketidaksesuaian
dengan yang dipesan sebelumnya atau adanya kecacatan
produk
atau
menukar
jenis
barang
yang
telah dipesan
dimana barangnya ditukar dengan barang lagi.
2.4.2.2. Sistem Retur Penjualan
Pengembalian barang oleh pelanggan harus diotorisasi
oleh fungsi penjualan dan diterima oleh fungsi penerimaan.
Fungsi
yang
terkait
dalam melaksanakan transaksi retur
penjualan adalah (Mulyadi, 2001, p226)
1. Fungsi Penjualan
Fungsi ini bertanggung jawab atas penerimaan
pemberitahuan
mengenai
pengembalian barang
yang
telah dibeli oleh pembeli. Otorisasi penerimaan kembali
barang yang telah dijual tersebut dilakukan dengan cara
|
membuat memo kredit yang dikirimkan kepada fungsi
penerimaan.
2. Fungsi Penerimaan
Fungsi ini bertanggung jawab atas penerimaan barang
berdasarkan
otorisasi
yang
terdapat
dalam memo kredit
yang diterima dari fungsi penjualan.
3. Fungsi Gudang
Fungsi ini bertanggung jawab atas penyimpanan kembali
barang yang diterima dari retur penjualan setelah barang
tersebut diperiksa oleh fungsi penerimaan.
Barang
yang
diterima dari transaksi retur penjualan ini dicatat oleh
fungsi gudang dalam kartu gudang.
4. Fungsi Akuntansi
Fungsi ini bertanggung jawab atas pencatatan transaksi
retur
penjualan
ke
dalam
jurnal
umum dan
pencatatan
berkurangnya piutang dan bertambahnya persediaan
akibat
retur
penjualan
dalam kartu
piutang
dan
kartu
persediaan.
2.4.3.
Pengertian Persediaan (stock)
Persediaan
adalah
persediaan
barang
dagangan,
yaitu
merupakan barang yang dibeli untuk tujuan dijual kembali (Mulyadi,
2001, p553).
Terdapat lima jenis konsep persediaan :
|
-
Bahan baku(raw-materials).
-
Komponen(components).
-
Produk dalam proses pengerjaan(work in process).
-
Barang jadi(final goods).
-
Barang pasokan(supplies).
Sistem
dan
prosedur
yang
bersangkutan
dengan
sistem
persediaan
adalah :
1. Prosedur pencatatan produk jadi
2. Prosedur permintaan dan pengeluaran barang gudang
3. Sistem penghitungan fisik persediaan.
2.4.4.
Pengertian Stock Point
Stock point adalah
penjual
barang
ke
end
user
dimana
dapat
berupa mini market, hypermart, supermarket, warung dan lain lain.
2.4.5.
Pengertian End User
End User
atau biasa
disebut
dengan customer
adalah
para
pemakai produk yang dijual oleh suatu pihak tertentu.
2.4.6.
Pengertian Salesman
Salesman adalah seorang individual yang mengelola sebuah
kelompok perwakilan penjualan(Jeff Madura, 2001, p179).
|