7
BAB 2
LANDASAN TEORI
2.1
Teori Umum
Agar dapat melakukan analisis dan perancangan data warehouse, maka pada sub bab
ini akan menjelaskan beberapa konsep dasar data warehouse
yang dijadikan acuan dan
landasan. Konsep-konsep tersebut merupakan teoriteori yang berhubungan dengan
perancangan data warehouse.
2.1.1
Pengertian Data
Menurut OBrien (2005, p38) data adalah fakta mentah mengenai
fenomena fisik atau transaksi bisnis.
Menurut McLeod and Schell (2007, p12) data terdiri dari fakta dan
gambaran yang secara umum tidak dapat digunakan oleh user.
Sedangkan menurut Inmon (2005, p493) data merupakan sebuah
rekaman fakta, konsep, atau instruksi pada sebuah media penyimpanan untuk
komunikasi, pencarian, dan pemrosesan secara otomatis dan dapat dimengerti
oleh pihak yang berkepentingan.
Dapat disimpulkan bahwa data adalah kumpulan fakta mentah dari
suatu kegiatan dan transaksi yang belum diolah dan belum memiliki arti.
2.1.2
Informasi
Menurut OBrien (2005, p38) informasi adalah data yang telah diubah
menjadi konteks yang berarti dan berguna bagi pengguna.
Menurut Inmon (2005, p498) berpendapat bahwa informasi adalah data
yang dikumpulkan dan dievaluasi untuk memecahkan suatu masalah atau
membuat suatu keputusan.
|
8
Menurut Turban, Rainer, dan Potter (2006, p52) informasi adalah data
yang telah diatur sehingga memiliki makna dan nilai bagi si penerima.
Jadi dapat disimpulkan bahwa informasi adalah data yang sudah
dikelola yang bertujuan untuk menghasilkan sesuatu yang berguna bagi si
pengguna.
2.1.3
Database
Menurut Connolly dan Begg (2010, p65), database adalah koleksi data
logis yang saling berhubungan, dan merupakan deskripsi dari data yang
didesain untuk memenuhi kebutuhan informasi pada organisasi.
Menurut Frost, Day dan Slyke (2006, p6), database adalah sekumpulan
data yang digunakan oleh sebuah sistem.
Jadi database
adalah kumpulan data yang saling berhubungan dan
disimpan dengan format tertentu dan dirancang untuk menyediakan kebutuhan
informasi dalam organisasi.
2.1.4
Pengertian Database Management System (DBMS)
Menurut Connolly dan Begg (2010,p61) database management system
adalah perangkat lunak yang memungkinkan pengguna untuk mendefinisikan,
membuat, memelihara, dan mengontrol akses ke database.
Menurut Frost, Day dan Slyke (2006, p6) database management system
adalah sekumpulan program yang membantu menyimpan, mengatur dan
menggunakan sekumpulan data tanpa memperhatikan form.
Jadi Database Management System
(DBMS) adalah perangkat lunak
yang membuat, mengatur, dan menggunakan database.
|
9
2.1.5
Pengertian Online Analytical Processing (OLAP)
Menurut Connolly dan Begg (2010, p1250) OLAP merupakan sintesis,
analisis, dan isi kondolisasi dinamis dari sejumlah multidimensional data.
OLAP adalah istilah yang menggambarkan sebuah teknologi yang
menggunakan pandangan multidimensi data agregat untuk menyediakan akses
cepat ke informasi untuk keperluan analisis canggih.
Menurut Rainer dan Turban ( 2009, p417) OLAP ialah analisis data
yang dikumpulkan atau diakumulasikan oleh end user atau pengguna akhir.
Jadi OLAP merupakan cara untuk menganalisa proses data transaksi
bisnis dengan menggunakan teknik Drag and Drop, dan disimpan dalam data
warehouse sehingga data data tersebut dapat menghasilkan suatu keputusan
bisnis yang strategis.
2.1.6
Pengertian Online Transaction Processing (OLTP)
Menurut Connolly dan Begg (2010, p1199) OLTP merupakan sistem
yang telah dirancang untuk menangani suatu pemrosesan transaksi tingkat
tinggi, secara umum transaksi tersebut membuat perubahan yang kecil pada
data operasional organisasi, dan dibutuhkan untuk menangani operasi sehari-
hari pada organisasi.
Menurut Turban (2009, p214) OLTP merupakan Transaction
Processing System
(TPS) yang beroperasi pada arsitektur client/server
yang
mana memperbolehkan pemasok organisasi untuk masuk TPS dengan melalui
ekstranet dan memperhatikan tingkat persediaan perusahaan atau jadwal
produksi pada perusahaan.
Menurut Kimball (2002, p408) OLTP adalah gambaran pasti dari
seluruh aktifitas dan asosiasi sistem dengan menginput suatu data yang
dipercaya ke dalam database. OLTP menggambarkan suatu kebutuhan sistem
|
10
dalam ruang lingkup operasional dan merupakan proses yang dapat
mendukung suatu kegiatan bisnis sehari hari.
Dapat disimpulkan OLTP merupakan suatu sistem pemrosesan data yang
menyimpan transaksi data operasional dalam suatu perusahaan.
2.1.7
Key Performance Indicator (KPI)
Menurut Tozer (1996, p130) Key performance indicator
merupakan
pendekatan yang digunakan untuk mengukur kinerja yang dirancang untuk
melakukan pemonitoran atau pengawasan yang efektif mengenai tingkat
ketepatan suatu strategi bisnis dan tingkat
kesuksesan yang diraih dalam
pencapaian suatu tujuan sebagai hasil dari usaha yang telah dilakukan.
2.1.8
Pengertian Entity Relationship Diagram (ERD)
Menurut Connolly dan Begg (2010, p330) entity relationship diagram
digunakan untuk menggambarkan suatu struktur logical database
kedalam
bentuk diagram. ERD menyediakan cara yang sederhana dan mudah untuk
memahami berbagai komponen dalam desain database.
2.1.9
Pengertian Entity Relationship Modelling
Menurut Connolly
dan Begg (2010, p371), Entity Relationship
(ER)
Modeling
adalah suatu pendekatan top-down
ke perancangan database
yang
dimulai dengan mengidentifikasikan data penting yang disebut entity
dan
relationships diantara data yang harus direpresentasikan dalam model.
2.1.10
Rich Picture
Lars Mathiassen (2000, p26) berpendapat bahwa rich picture
adalah
gambaran informal menggambarkan yang fokus kepada aspek domain yang
mencuri perhatian pelukis. Rich picture mengajak untuk memahami dan
merasakan kepentingan dari aspek tersebut. Rich picture digunakan dalam
|
11
seleksi untuk menunjukkan semua persepsi yang dihadapi dalam pengembangan
sistem.
2.1.11
Pengertian Data Warehouse
Menurut Kimball dan Ross (2005, p397) data warehouse
merupakan
perpaduan dari data sebuah organisasi, baik dari staging area
maupun
presentation area, dimana data operasional secara spesifik serta terstruktur
untuk query dan analisis performansi dan memudahkan penggunaan.
Menurut Inmon (2005, p495) data warehouse merupakan sekumpulan
database
yang terintegrasi yang dirancang untuk mendukung fungsi sistem
pengambilan keputusan, dimana setiap unit data relevan pada beberapa waktu.
Menurut Connolly dan Begg (2010, p1197) data warehouse
adalah
suatu kumpulan data yang berorientasi subjek, terintegrasi, memiliki varian
waktu, dan tidak berubah. Data warehouse
terdiri dari data atomik dan
ringkasan data.
Dari definisi tersebut dapat disimpulkan data warehouse
adalah
kumpulan data yang berorientasi subjek, data terintegrasi, tidak berubah, dan
memiliki varian waktu untuk menyediakan keputusan yang tepat bagi
pengambil keputusan.
|
![]() 12
2.1.12
Arsitektur Data Warehouse
Gambar 2.1
Arsitektur Data Warehouse
(Connolly dan Begg, 2010, p1204)
Keterangan gambar :
1.
Operational Data
Sumber data dari data warehouse berasal dari :
a.
Data operasional main frame dalam hirarki generasi pertama dan
jaringan database.
b.
Data departemen dalam sistem file, seperti VSAM, RMS, dan
DBMS relasional, seperti informix dan Oracle.
c.
Data privat yang berada pada workstation dan server private.
|
13
d.
Sistem eksternal seperti internet, database, yang tersedia secara
komersial atau database
yang berhubungan dengan pemasok atau
pelanggan organisasi.
2.
Operational Data Store
Operational Data Store (ODS) adalah tempat penyimpanan sementara dari
data operasional sekarang yang terintegrasi dan digunakan untuk analisis.
Membangun ODS dapat membantu menyediakan data dengan cara yang
sama seperti data warehouse, tetapi sebenarnya bertindak secara sederhana
sebagai tempat penyimpanan sementara untuk datadata sebelum
dipindahkan ke warehouse.
3.
ETL Manager
ETL
Manager
menampilkan semua operasi yang berkaitan dengan ETL
suatu data ke dalam data warehouse. Data dapat di ekstrak langsung dari
sumber data dari penyimpanan data operasional.
4.
Warehouse Manager
Warehouse
Manager
melakukan semua organisasi yang berhubungan
dengan manajemen data dalam data warehouse. Operasi yang dilakukan
oleh warehouse manager adalah :
a.
Analisis data untuk memastikan konsistensi.
b.
Perubahan bentuk dan penggabungan data sumber dari gudang
penyimpanan sementara ke dalam tabel data warehouse.
c.
Membuat indeks dan mengacu pada tabel dasar.
d.
Pembuatan denormalisasi.
e.
Pembuatan agregasi.
f.
Melakukan back-up dan archive/back-up data.
5.
Query Manager
Query Manager
menampilkan semua operasi yang berkaitan dengan
pengaturan user queries. Kompleksitas dari query manager ditentukan dari
fasilitas yang disediakan oleh end-user access tools dan database.
|
![]() 14
6.
Detailed Data
Area warehouse ini menyimpan semua detail data dalam skema database.
Pada kebanyakan kasus, detail data tidak disimpan secara online, tetapi
dibuat tersedia dengan mengagregasikan data ke tingkat berikutnya. Akan
tetapi, secara rutin detail data dimasukkan ke warehouse untuk
menambah agregat data.
7.
Lightly and Highly Summarized Data
Area warehouse ini bersifat sementara karena akan berubah secara
terus menerus sebagai respon perubahan profil query. Tujuan
ringkasan informasi yaitu mempercepat kinerja query. Walaupun
ada peningkatan biaya operasional yang berhubungan dengan
ringkasan awal data, hal ini juga diimbangi dengan penghilangan
kebutuhan untuk melakukan operasi summary
terus menerus
(seperti sorting
atau grouping) dalam menjawab permintaan
pengguuna.
8.
Archive / Backup Data
Area warehouse ini menyimpan detail dan ringkasan data untuk
pengarsipan dan back up. Walaupun ringkasan data dihasilkan dari
detail data, mungkin perlu untuk backup ringkasan data online jika
data tersebut disimpan dibuat waktu penyimpanan detail data. Data
di transfer ke arsip penyimpanan, seperti disk optik.
9.
Metadata
Metadata
menyimpan semua definisi metadata
yang digunakan
oleh semua proses di dalam data warehouse. Tujuan dari metadata
adalah :
Proses Extract dan Load
Metadata
digunakan untuk memetakan sumber data ke
dalam pandangan umum data dalam data warehouse.
|
![]() 15
Proses manajemen warehouse
Metadata
digunakan untuk mengotomatisasi pembuatan
tabel ringkasan.
Sebagai proses manajemen query
Metadata
digunakan untuk mengarahkan suatu query
dengan sumber data yang tepat.
10. End-User Access Tools
Tujuan utama data warehouse
adalah menyediakan informasi bagi
pengguna untuk pembuatan keputusan yang strategis dalam berbisnis.
Terdapat 4 kategori end-user access tools, yaitu :
Reporting and Query Tools.
Reporting Tools
meliputi production reporting tools
dan report
writers. Production reporting tools digunakan untuk menghasilkan
laporan operasional yang teratur atau untuk mendukung sejumlah
pekerjaan dengan volume yang tinngi seperti pesanan pelanggan.
Report writer adalah desktop tools yang dibuat untuk endusers.
Query tools untuk data warehouse relational dirancang untuk dapat
menerima SQL atau untuk menghasilkan pernyataan SQL agar
dapat melakukan query
pada data yang disimpan di dalam
warehouse. Query tools
sangat popular di antara pengguna bisnis
aplikasi.
Application development tools.
Kebutuhan endusers
seperti membangun kemampuan untuk
membuat laporan dan query tools
keduanya sangat tidak memadai
karena analisa yang dibutuhkan tidak dapat dijalankan. Dalam
situasi seperti ini, pengguna akan membutuhkan application
development tools yang dirancang untuk kebutuhan client server.
Online Analytical Processing (OLAP) tools.
|
![]() 16
Online Analytical Processing tools
merupakan konsep database
multidimensi dan mengijinkan pengguna untuk menganalisa data
menggunakan sudut pandang yang kompleks dan multidimensi.
Data mining tools.
Menurut Connolly dan Begg (2010, p1207), data mining
adalah
proses menemuka korelasi, pola, dan gaya baru yang bermanfaat
dengan menggali
(mining) data dalam jumlah yang besar dengan
menggunakan teknik statistika, matematika, intelejensia semu.
2.1.13
Karakteristik Data Warehouse
Menurut Inmon (2005, p30) karakteristik dari data warehouse ada 4 ,
yaitu :
1.
Subject-Oriented
Subject-oriented
maksudnya ialah data diorganisir berdasarkan subjek
utama pada lingkungan perusahaan, bukan berorientasi pada fungsi aplikasi
lingkungan operasional. Contohnya data warehouse
perusahaan asuransi
memiliki subjek utama seperti pelanggan, klaim, dan policy.
Gambar 2.2 Subject-Oriented
(Inmon, 2005, p30)
|
![]() 17
2.
Integrated
Data warehouse harus terintegrasi karena data bersumber dari sistem
sistem aplikasi yang berbeda dalam perusahaan dengan berbedanya format.
Sumber data tersebut harus dibuat konsisten, pada saat data diambil, data
diubah, dibentuk ulang, diringkas, dirangkai ulang dan seterusnya.
Hasilnya, ketika telah berada dalam suatu data warehouse, data memiliki
gambaran atau struktur fisik terpadu tunggal.
Gambar 2.3 Integration
(Inmon, 2005, p31)
3.
Nonvolatile
Non-volatile
dalam data warehouse
adalah tidak diperbaharui secara
real-time, melainkan secara periodik yang diambil dari sistem operasional.
Data baru ditambahkan kedalam database
sebagai pelengkap, sehingga
data historis tetap tersimpan didalam database.
|
![]() 18
Gambar 2.4 Non Volatile
(Inmon, 2005, p32)
4.
Time variant
Setiap data pada data warehouse
bersifat akurat pada periode waktu
tertentu. Record yang ada pada data warehouse selalu mempunyai bentuk
penandaan waktu yang dapat menunjukan dimana record
tersebut masih
akurat baik dalam bentuk time stamp
untuk sebuah record
tunggal atau
time stamp untuk seluruh database.
Gambar 2.5 Time Variant
(Inmon, 2005, p32)
|
19
2.1.14
Keuntungan Data Warehouse
Menurut Connolly dan Begg (2010, p1198), data warehouse
telah
diimplementasikan dengan sukses dan dapat memberikan keuntungan bagi
organisasi, keuntungan keuntungan tersebut adalah :
1.
Keuntungan dalam persaingan
Return of investment
(ROI) yang tinggi bagi perusahaan yang
menerapkan data warehouse
dengan baik dan berhasil akan memberikan
mereka keuntungan persaingan. Keuntungan tersebut didapat melalui para
pengambil keputusan mengakses data yang sebelumnya tidak tersedia,
tidak diketahui dan informasi yang belum dimanfaatkan, contohnya yaitu
tren.
2.
Tingkat pengembalian yang tinggi dalam investasi
Sebuah organisasi menangani jumlah sumber daya dalam jumlah yang
besar untuk memastikan penerapan data warehouse
yang berhasil dan
biaya yang bervariasi. Berdasarkan penelitian pada tahun 1996 dari
International Data Corporation
(IDC), rata
rata tingkat pengembalian
investasi data warehouse dalam 3 tahun mencapai 40%.
3.
Meningkatkan produktivitas para pembuat keputusan perusahaan
Data warehouse
meningkatkan produktivitas dari pembuat keputusan
perusahaan dengan menciptakan database
yang terintegrasi, konsisten,
berorientasi subjek
dan data historis. Dengan merubah data menjadi
informasi yang berarti, data warehouse
memungkinkan manajer untuk
melakukan analisis data lebih akurat dan konsiten.
2.1.15
Struktur Data Warehouse
Menurut Inmon (2005, p33) struktur data warehouse
menunjukan
detail level yang berbeda pada data warehouse, yaitu older level of detail,
current level of detail, level of lightly summarized data, dan level of highly
summarized data. Struktur data warehouse tersebut dijelaskan sebagai berikut:
|
20
1.
Current Detail Data
Current detail data
adalah data detail yang sedang aktif yang
mencerminkan keadaan yang sedang berjalan pada saat ini dan merupakan
tingkat terendah dalam data warehouse.
Biasanya current detail data
memerlukan media penyimpanan data
yang cukup besar. Alasan perlu diperhatikannya current detail data
adalah sebagai berikut :
a)
Dapat digunakan dalam membuat rekapitulasi sehingga current
detail data harus akurat.
b)
Menggambarkan kejadian yang sedang terjadi dan selalu menjadi
perhatian utama.
c)
Hampir selalu disimpan
di media penyimpanan karena cepat
diakses tetap memerlukan biaya yang mahal dan pengaturan yang
kompleks.
d)
Jumlah data sangat banyak dan disimpan pada tingkat penyimpanan
terendah.
2.
Old Detail Data
Old detail data ialah data historis perusahaan yang berupa hasil back-
up
yang bisa disimpan kedalam media penyimpanan yang terpisah dan
dapat diakses kembali pada saat tertentu. Karena data tersebut berupa back-
up
maka biasanya disimpan dalam penyimpanan alternative seperti tape
atau disk. Data ini biasanya memiliki tingkat frekuensi akses yang rendah.
3.
Lightly Summarized Data
Data ini merupakan ringkasan dari current detail data.
Pada tahap ini
data dari ringkasan current detail
belum dapat digunakan karena data
|
21
tersebut masih belum bersifat total summary dan masih bersifat detail dan
biasanya disimpan pada media penyimpanan seperti disk.
Data ini dirangkum berdasarkan periode yang sesuai dengan kebutuhan
dan tingkatan. Data ini disebut juga dengan data mart. Akses terhadap data
jenis ini banyak digunakan untuk melihat suatu kondisi yang sedang atau
sudah berjalan.
4.
Highly Summarized Data
Highly summarized data
merupakan tingkat lanjutan dari lightly
summarized data, yang merupakan hasil ringkasan yang bersifat total
summary. Pada tahap ini data mudah diakses dan
pada akhirnya dapat
digunakan sebagai pengambil keputusan bagi para eksekutif perusahaan.
Hal ini memudahlan para eksekutif karena tidak perlu lagi membaca atau
melakukan analisis dalam waktu yang lama.
5.
Metadata
Metadata memuat informasi yang penting dalam data warehouse dan
bukan merupakan hasil dari kegiatan operasional seperti keempat jenis
diatas. Metadata digunakan dalam banyak fungsi, antara lain :
a)
Sebagai panduan pemetaan dalam proses transformasi dari data
operasional kedalam lingkungan data warehouse.
b)
Sebagai direktori yang dipakai oleh user dalam mencari lokasi data
dalam data warehouse.
c)
Sebagai panduan untuk proses detail data menjadi summary
data
untuk diolah menjadi lightly summarized data
dan kemudian
menjadi highly summarized data.
Menurut Connolly dan Begg (2010, p1206), metadata digunakan untuk
berbagai tujuan, yaitu :
|
22
1.
Proses ekstraksi dan loading.
Metadata digunakan untuk memetakan sumber data ke dalam pandangan
umum dari data dalam warehouse.
2.
Proses manajemen warehouse.
Metadata digunakan untuk mengotomatiskan pembuatan tabel ringkasan.
3.
Sebagai bagian dari proses manajemen query.
Metadata
digunakan untuk menghubungkan suatu query
dengan sumber
data yang tepat.
Menurut Ponniah (2001, p36), metadata dalam data warehouse dibagi
menjadi 3 kategori, yaitu :
a.
Metadata Operasional
Metadata operasional
berisi mengenai informasi tentang sumber data
operasional yang memiliki struktur data yang berbeda, ukuran field
yang
berbeda, dan tipe data yang berbeda.
b.
Metadata Ekstraksi dan Transformasi
Metadata
ekstraksi dan transformasi berisi mengenai data ekstraksi dari
sumber data, penamaan, frekuensi ekstraksi, metode ekstraksi, dan
peraturan untuk ekstraksi.
c.
Metadata pengguna akhir
Metadata
pengguna akhir adalah sebuah peta navigasi dari data
warehouse. Ini memampukan pengguna akhir untuk menemukan informasi
dari data warehouse.
|
![]() 23
Gambar 2.6 Struktur Data Warehouse
(Inmon, 2005, p34)
2.1.16
Aliran Informasi Data Warehouse
Gambar 2.7 Aliran Informasi Data Warehouse
(Connolly dan Begg, 2005, p1162)
|
24
Menurut Connolly dan Begg (2005, p1161
p1165), aliran data
warehouse berfokus pada manajemen lima data flow primer, yaitu :
1.
Inflow
merupakan proses untuk memasukkan data dari sumber data ke
dalam data warehouse. Proses inflow yaitu ekstrak, penghapusan, dan
loading sumber data.
2.
Upflow menambahkan nilai pada data di data warehouse dengan tahap
melalui ringkasan, packaging, dan distribusi data.
Yang dilakukan pada
ringkasan adalah memilih, memproyeksikan, menggabungkan, dan
mengelompokkan data dari relational
menjadi view
yang berguna untuk
pengguna akhir. Hasil dari ringkasaan akan diubah ke dalam format
tertentu untuk mudah didistribusikan kepada pengguna akhir dalam tahap
packaging. Formatnya dapat dalam bentuk spreadsheet, dokumen teks,
diagram, dan animasi. Kemudian data tersebut didistribusikan dalam
kelompoknya yang sesuai untuk meningkatkan ketersediaan dan
pengaksesan data.
3.
Downflow, merupakan pengarsipan dan back-up
data di data
warehouse.
4.
Outflow
membuat data tersedia untuk pengguna akhir sesuai dengan
kebutuhan dari pengguna tersebut.
5.
Metaflow proses yang berhubungan untuk mengatur metadata.
2.1.17
Perbandingan OLTP dan Data Warehouse
Menurut Connolly dan Begg (2010, p1199), secara umum terdapat
perbedaan antara OLTP dan data warehouse. Perbedaan tersebut diantaranya
adalah :
|
![]() 25
Tabel 2.1 Perbedaan OLTP dengan Data Warehouse
(Connolly dan Begg, 2010, p1199)
Sistem OLTP
Sistem Data Warehouse
Menyimpan data terkini
Menyimpan data histori
Menyimpan data detail
Menyimpan detailed, lightly, and
highly summarized data
Tingkat transaksi tinggi
Tingkat transaksi rendah atau sedang
Pola penggunaannya dapat
diprediksi
Pola penggunaannya tidak dapat
diprediksi
Transaction-driven
Analysis-driven
Berorientasi aplikasi
Berorientasi subjek
Melayani
pengguna dalam
jumlah besar
Melayani pengguna dalam jumlah
kecil biasanya manajer
Mendukung pengambilan
keputusan harian
Mendukung pengambilan keputusan
strategis
2.1.18
Pengertian Data Mart
Menurut Connolly dan Begg (2005, p1171), data mart adalah bagian
dari data warehouse
yang mendukung kebutuhan informasi dari departemen
tertentu atau fungsi bisnis dalam perusahaan.
Menurut Turban (2009, p248) data mart
ialah data warehouse
kecil
yang didesain untuk unit atau departemen bisnis strategis. Data mart
mempunyai dua tipe, yaitu:
1.
Dependent data marts ialah data mart
yang dibangun berdasarkan
data warehouse
yang ada, tidak dapat berdiri sendiri dan sangat
tergantung pada data warehouse.
|
![]() 26
2.
Independent data marts
ialah sebuah tempat penyimpanan kecil
yang dirancang khusus untuk sebuah department
atau bisnis atau
lebih sering disebut sebagai mini data warehouse.
2.1.19
Anatomi Data Warehouse
Dalam menentukan bentuk data warehouse
yang akan digunakan oleh
suatu perusahaan, terlebih dahulu harus diketahui kebutuhan yang diperlukan
dalam menjalankan aplikasi yang dirancang. Menurut Deliana et al (2009,
p185) terdapat 3 bentuk data warehouse antara lain :
1.
Data Warehouse Fungsional
Data warehouse fungsional dibuat berdasarkan fungsi yang berada di
dalam perusahaan. Data warehouse dibuat dan dikelompokkan berdasarkan
fungsifungsi yang ada pada perusahaan, seperti fungsi keuangan,
marketing, dan lainlain. Keuntungan membangun data warehouse
fungsional
ini adalah biaya yang diperlukan relative murah dan sistem
mudah dibangun, sedangkan kerugiannya adalah resiko dalam konsistensi
data serta terbatasnya pengumpulan data bagi pengguna.
Gambar 2.8 Data Warehouse Fungsional
(Deliana et al, 2009, p185)
|
![]() 27
2.
Data Warehouse Terpusat (Centralized)
Data warehouse
terpusat ini menyerupai data warehouse
fungsional,
tetapi data pada data warehouse
terpusat terlebih dahulu dikumpulkan
dalam satu tempat terpusat setelah itu data tersebut dipisahkan berdasarkan
fungsifungsi yang dibutuhkan oleh perusahaan. Keuntungan
menggunakan data warehouse
terpusat ini adalah tingkat konsistensi data
yang sangat tinggi karena data yang ada di dalamnya benarbenar terpadu,
sedangkan kerugian menggunakan data warehouse
terpusat ini adalah
memerlukan waktu yang cukup lama dan biaya yang relatif mahal untuk
membangunnya.
Gambar 2.9 Data Warehouse Terpusat
(Deliana et al, 2009, p186)
3.
Data Warehouse Terdistribusi (Distributed)
Distributed data warehouse
menggunakan gateway
yang berfungsi
sebagai jembatan atau penghubung antara source
(lokasi data dari data
warehouse) dengan workstation yang menggunakan sistem yang beraneka
ragam dan berbeda, sehingga memungkinkan pengguna untuk dapat
mengakses sumber data yang berada di luar lokasi perusahaan. Keuntungan
data warehouse
terdistribusi adalah memungkinkan adanya pengaksesan
data dari luar perusahaan, sedangkan kerugian data warehouse terdistribusi
adalah harga serta sistem pembuatan dari data warehouse
ini yang paling
|
![]() 28
mahal serta paling kompleks apabila dibandingkan dengan bentukbentuk
data warehouse lainnya.
Gambar 2.10 Data Warehouse Terdistribusi
(Deliana et al, 2009, p187)
2.1.20
Konsep Pemodelan Data Warehouse
Data warehouse menggunakan teknik pemodelan dimensional. Dengan
teknik ini, data warehouse
dapat dibuat tabel fakta dan dimensi, serta
hubungan antara masing-masing tersebut.
2.1.20.1 Dimensionality Modelling (Model Dimensional)
Menurut Connolly dan Begg (2010, p1227), dimensionality
modeling adalah sebuah teknik logical design
yang mempunyai tujuan
untuk menyediakan data dalam bentuk yang standard intuitif yang
memungkinkan pengaksesan database dengan performance yang tingi.
Menurut Kimball dan Ross (2010, p204), dimensional modeling
merupakan teknik desain logis untuk melakukan strukturisasi data
sehingga data tersebbut dapat membantu pengguna dan memberikan
kinerja query yang cepat.
|
29
2.1.20.2 Fact Table ( Tabel Fakta)
Menurut Kimball dan Ross (2010, p207), Fact table atau tabel fakta
merupakan tabel pusat dengan pengukuran performasi bisnis dalam
bentuk numeric yang memiliki karakteristik berupa sebuah composite key,
yang tiap elemennya berupa foreign key yang didapat dari table dimensi.
Menurut Connolly dan Begg (2010, p1227), fact table
merupakan
model dimensional yang terdiri dari satu tabel dengan sebuah composite
primary key.
2.1.20.3 Dimensional Table (Tabel Dimensi)
Menurut Kimball dan Ross (2010, p399), dimensional table
adalah
sebuah tabel yang memiliki sebuah primary key tunggal dan kolom
dengan atribut deskriptif.
Menurut Connolly dan Begg (2010, p1227), dimensional table
ialah
satu set dari tabel kecil. Setiap dimensional table
memiliki primary key
yang sederhana sesuai dengan salah satu komponen composite key dalam
tabel fakta.
2.1.20.4 Star Schema
Menurut Connolly dan Begg (2010, p1227), Star schema merupakan
dimensional data model
yang memiliki tabel fakta di tengah, dan
dikelilingi oleh tabel dimensi denormalisasi. Star schema
atau star join
mengeksploitasi karakteristik data faktual sehingga fakta yang dihasilkan
oleh peristiwa masa lalu, dan tidak mungkin berubah, terlepas dari
bagaimana mereka dianalis.
|
![]() 30
Gambar 2.11 Star Schema
(Connolly & Begg, 2010, p1227)
2.1.20.5 Snowflake Schema
Menurut Connolly dan Begg (2010, p1229), snowflake schema adalah
variasi bentuk dari skema bintang dimana pada tabel dimensi tidak
mengandung data yang telah di denormalisasikan.
2.1.20.6 Starflake Schema
Menurut Connolly dan Begg (2010, p1230), starflake schema
merupakan struktur hybrid
yang berisi kombinasi antara skema bintang
yang telah di denormalisasikan dan snowflake
yang telah di
normalisasikan. Beberapa dimensi dapat menggunakan bentuk tertentu
untuk memenuhi berbagai kebutuhan query.
|
![]() 31
Gambar 2.12 Starflake Schema
(Kimball & Ross, 2010, p334)
2.1.21
Extract Transform Load (ETL)
Menurut Connolly dan Begg (2010, p1208), ETL merupakan proses
menyiapkan data dari sumber data atau operational source
untuk data
warehouse. Tujuan ETL adalah mengumpulkan, menyaring, mengolah dan
menggabungkan data data yang relevan dari berbagai sumber untuk dismpan
ke dalam data warehouse, dapat digunakan untuk mengintegrasikan data
dengan sistem yang sudah ada sebelumnya. ETL terdiri dari 3 proses, yaitu :
1.
Extraction
Langkah pertama dari proses ETL adalah mengekstrak data dari
satu sumber atau banyak sumber data. Kebanyakan proses data warehouse
menggabungkan data dari sumbersumber yang berbeda. Sumbersumber
data yang ada kemungkinan
memiliki format yang berbedabeda sehingga
perlu dilakukan ekstraksi. Ekstrasi merupakan proses mengubah data ke
dalam suatu format yang berguna untuk proses transformasi.
|
![]() 32
2.
Transformation
Proses mengubah data yang didapat dari proses extraction
untuk
mengekstrak data menjadi bentuk yang diperlukan, sehingga data tersebut
sesuai dan dapat diproses dalam data warehouse. Hal hal yang dilakukan
dalam tahap transformasi :
Hanya memilih kolom tertentu saja
untuk memasukkan ke dalam
data warehouse.
Menterjemahkan nilai berupa kode.
Mengkodekan nilainilai ke dalam bentu bebas (contoh :
memetakan male ke dalam m).
Melakukan perhitungan nilainilai baru (contoh : qty*price).
Menggabungkan data dari berbagai sumber.
Membuat ringkasan dari sekumpulan data.
Menentukan nilai surrogate key.
Mengubah sekumpulan kolom menjadi sekumpulan baris atau
sebaliknya.
Memisahkan kolom menjadi beberapa kolom.
Menggunakan bentuk validasi data baik yang sederhana ataupun
kompleks.
3.
Load
Load adalah fase
atau tahapan dimana data dimasukkan ke dalam
data warehouse. Waktu dalam fase
load ini tergantung pada kebutuhan
perusahaan dalam menganalisis kebutuhan informasinya.
|
![]() 33
2.1.22
Kimball Lifecycle
Gambar 2.13 The Kimball Lifecyle
( Kimball & Ross, 2010, p97)
1.
Program/Project Planning
Tahap pertama adalah berfokus pada mendapatkan program atau
proyek yang akan diluncurkan, termasuk scoping, justification, and
staffing. Sepanjang siklus, program/project management
bertugas untuk
menjaga kegiatan agar tetap berada dijalurnya.
2.
Business Requirements
Business requirements
dikumpulkan untuk menentukan faktor bisnis
yang berdampak pada apa yang user
bisnis lakukan hari ini (atau yang
ingin dilakukan untuk masa depan), daripada menanyakan apa yang
diinginkan pada data warehouse anda. Peluang perusahaan diidentifikasi,
diprioritaskan berdasarkan nilai bisnis dan kelayakannya, kemudian
kebutuhan rinci tersebut dikumpulkan untuk iterasi pengembangan sistem
DW/BI.
|
34
3.
Technology Track
Technology track
terintegrasi dengan teknologi, data stores, dan
metadata yang terkait. Technology track ini dimulai dengan mendesain dan
penginstalan suatu produk.
4.
Data Track
Data track
dimulai dengan mendesain model dimensional untuk
memenuhi kebutuhan bisnis. Model dimensional
dapat diturunkan dalam
database
relasional, biasa disebut sebagai skema bintang atau database
multidimensional yang dikenal sebagai OLAP cubes.
5.
Business Intelligence Track
Mengidentifikasi dan membagun berbagai aplikasi business inteligence,
termasuk laporan, parameterized queries, dashboards, scorecards, analytic
models
dan data mining applications
bersamaan dengan navigasi
antarmuka yang terkait.
6.
Deployment, Maintenance, and Growth
Iterasi deployment
memasuki tahap maintenance, sedangkan growth
kembali ke project planning
untuk iterasi berikutnya dari sistem DW/BI.
Sistem DW/BI merupakan program jangka panjang. Tujuan data
warehouse atau business intelligence adalah untuk mendukung, membantu,
dan mempermudah pihak eksekutif dalam pengambilan keputusan. Target
ini harus tetap ada pada desain, pengembangan, dan penyebaran pada
lifecycle sistem DW/BI.
|
35
2.1.23
Metodologi Perancangan Data Warehouse
Berdasarkan pernyataan Kimball
(2010, p210) ada sembilan tahap
metodologi dalam membangun data warehouse yang dikenal dengan nine-step
methodology, yaitu :
1.
Pemilihan Proses ( Choose the Process)
Proses bisnis merujuk pada subjek masalah atau kebutuhan bisnis
utama dan pemahaman mengenai data yang tersedia pada perusahaan. Data
warehouse yang akan dibangun nantinya harus sesuai dengan anggaran dan
dapat menjawab masalahmasalah bisnis yang penting.
2.
Memilih Grain (Choose the Grain)
Menentukan hal yang sebenarnya dimunculkan oleh tabel fakta. Setelah
menentukan graingrain pada tabel fakta, dimensidimensi untuk setiap
fakta di identifikasi. Pada proses ini juga tingkat granularity dari data akan
ditentukan.
3.
Identifikasi dan penyesuaian dimensi ( Identifying and conforming the
dimension)
Mengidentifikasi dimensi disertai deskripsi detail yang secukupnya.
Ketika tabel dimensi berada pada dua atau lebih data warehouse, maka
tabel dimensi tersebut harus mempunyai dimensi yang sama atau
merupakan subset dari yang lainnya. Jika suatu tabel dimensi digunakan
oleh lebih dari satu data warehouse maka dimensinya harus disesuaikan.
4.
Pemilihan fakta (Choose the Facts)
Memilih fakta yang akan digunakan
dalam tabel fakta berdasarkan
grain
yang telah ditentukan dan proses bisnisnya. Untuk memilih fakta
|
36
perlu mengetahui informasi apa saja yang dibutuhkan oleh pengguna dalam
kaitannya dengan proses bisnis tertentu.
5.
Menentukan data per kalkukasi dari tabel fakta (Store pre-calculation
in the fact table)
Setelah faktafakta dipilih atau ditentukan maka setiap fakta perlu diuji
apakah fakta lain yang merupakan hasil kalkulasi dari faktafakta yang
telah ditentukan. Fakta hasil kalkulasi sebaiknya disimpan di dalam tabel
fakta, karena fakta ini akan dapat meningkatkan performasi dalam
memberikan hasil query. Dengan menyimpan fakta hasil kalkulasi dalam
tabel fakta berarti ada tambahan penggunaan kapasitas dalam basis data.
6.
Melengkapi tabel dimensi (Round out the dimensions tables)
Pada tahap ini, dilakukan penambahan informasi deskriptif yang
berhubungan dengan tabel dimensi yang ada. Disamping itu, untuk
melengkapi atribut tabel dimensi dengan cepat maka diperlukan
identifikasi mengenai bagaimana tabeltabel dimensi saling berhubungan.
7.
Memilih durasi dari basis data (Choose the duration of the database)
Menentukan durasi data yang akan dimasukkan ke dalam data
warehouse
berdasarkan kebutuhan perusahaan. Hal ini perlu dilakukan
supaya data yang akan dianalisis berdasarkan periode waktu tertentu berada
dalam data warehouse.
8.
Menentukan Kebutuhan dalam Melacak Dimensi yang Berubah
Secara Perlahan (Determine the Need to Track Slowly Changing
Dimensions)
Terdapat tiga cara untuk mengubah data di dimensi, yaitu :
1.
Memasukan ulang atribut yang berubah.
2.
Membuat recor baru pada dimensi.
|
37
3.
Membuat atribut alternatif untuk menampung nilai yan baru,
sehingga nilai yang lama dan nilai yang baru dari atribut tersebut
dapat diakses secara bersamaan.
9.
Menentukan Perancangan Fisik (Decide the Physical Design)
Pada tahap ini kita mempertimbangkan rancangan fisik
dari data
warehouse. Tahap ini merupakan tahap penting untuk menentukan
masalah-masalh yang mungkin ada pada perancangan fisik seperti security,
backup
2.2
Teori Khusus
2.2.1
Pengertian Penjualan
Menurut Jerry Paul Donald (2007, p268), berpendapat bahwa penjualan
dihasilkan pada saat barang dialihkan dari penjual ke pembeli. Penjualan dapat
dilakukan secara kredit atau tunai, juga setiap transaksi penjualan harus
didukung dengan dokumen bisnis yang menunjukkan bukti penjualan secara
tertulis
Menurut Sumadji (2006, p587), penjualan merupakan pertukaran
barang atau jasa dengan uang, serta merupakan pendapatan yang diterima dari
pertukaran barang atau jasa dan dicatat untuk satu periode akutansi tertentu.
Sedangkan menurut Mulyadi (2008, p202) menyatakan penjualan
terdiri dari transaksi penjualan barang dan jasa, baik secara kredit maupun
tunai.
Jadi, penjualan ialah proses transaksi penjualan barang dan jasa secara
kredit dan tunai dimana kebutuhan pembeli dan penjualan dipenuhi melalui
pertukaran informasi dan kepentingan.
|
38
2.2.1.1 Fungsi-fungsi yang terkait dalam penjualan
Fungsi-fungsi yang terkait dalam sistem penjualan kredit
menurut Mulyadi (2008, p211) yaitu:
a.
Fungsi penjualan
Fungsi ini bertanggung jawab untuk menerima surat order dari
pembeli, mengedit order dari pelanggan untuk menambahkan
informasi yang belum ada pada surat order tersebut, meminta
otorisasi kredit, menentukan tanggal pengiriman dari gudang mana
yang akan dikirim, dan mengisi surat order penggiriman. Fungsi ini
juga bertanggung jawab untuk membuat back order pada saat
mengetahui tidak tersedianya persediaan untuk memenuhi order
dari pelanggan.
b.
Fungsi kredit
Fungsi ini berada dibawah fungsi keuangan yang dalam
transaksi penjualan kredit, bertanggung jawab untuk meneliti status
kredit pelanggan dan memberikan otorisasi pembelian kredit
kepada pelanggan. Karena hampir semua penjualan dalam
perusahaan manufaktur merupakan penjualan kredit, maka sebelum
order dari pelanggan dipenuhi, harus lebih dahulu diperoleh
otorisasi penjualan kredit dari fungsi kredit.
c.
Fungsi gudang
Fungsi ini bertanggung jawab untuk menyimpan
barang dan
menyiapkan barang yang dipesan oleh pelanggan, serta
menyerahkan barang ke fungsi pengiriman.
d.
Fungsi pengiriman
Fungsi ini bertanggung jawab untuk menyerahkan barang atas
dasar surat order pengiriman yang diterimanya dari fungsi
penjualan. Fungsi ini bertanggung jawab untuk menjamin bahwa
|
39
tidak ada barang yang keluar dari perusahaan tanpa ada otorisasi
dari yang berwenang.
e.
Fungsi penagihan
Fungsi ini bertanggung jawab untuk membuat dan mengirimkan
faktur penjualan terhadap pelanggan, serta menyediakan copy
faktur bagi kepentingan pencatatan transaksi penjualan oleh fungsi
akuntansi.
f.
Fungsi akuntansi
Fungsi ini bertanggung jawab untuk mencatat piutang yang
timbul dari transaksi penjualan kredit dan membuat serta
mengirimkan pernyataan piutang kepada para debitur, serta
membuat laporan penjualan.disamping itu, fungsi ini juga
bertanggung jawab untuk mencatat harga pokok persediaan yang
dijual ke dalam kartu persediaan.
2.2.1.2 Dokumen yang digunakan
Dokumen sangatlah dibutuhkan sebagai alat bukti transaksi
penjualan kredit. Mulyadi (2008, p215) mengungkapkan dokumen yang
digunakan dalam penjualan kredit antara lain:
a.
Surat order pengiriman dan tembusannnya
Surat order merupakan dokumen pokok untuk memproses
penjualan kredit kepada pelanggan. Berbagai tembusan surat order
pengiriman terdiri dari:
-
Surat order pengiriman
-
Tembusan kredit (credit copy)
-
Tembusan gudang (warehouse copy)
-
Arsip pengendalian pengiriman (sales order follow-up copy)
|
40
b.
Faktur dan tembusannya
Faktur penjualan merupakan dokumen yang dipakai
sebagai dasar untuk mencatat timbulnya piutang. Berbagai
tembusannya terdiri dari:
1.
Faktur penjualan (customers copies)
Dokumen ini merupakan lembar pertama yang
dikirim oleh fungsi penagihan kepada pelanggan.
Jumlah lembar faktur penjualan yang dikirim kepada
pelanggan adalah tergantung dari permintaan pelanggan.
2.
Tembusan piutang (account receivable copy)
Dokumen ini merupakan tembusan faktur
penjualan yang dikirimkan oleh fungsi penagihan ke
fungsi penagihan ke fungsi akuntansi sebagai dasar
untuk mencatat piutang.
3.
Tembusan jurnal penjualan (sales journal copy)
Dokumen ini merupakan tembusan yang
dikirimkan oleh fungsi penagihan ke fungsi akuntansi
sebagai dasar mencatat transaksi penjualan dalam jurnal
penjualan.
2.2.2
Pengertian Manufaktur
Menurut jurnal yang dibuat oleh Farida (2008), secara umum
manufaktur adalah suatu aktifitas yang kompleks yang melibatkan berbagai
variasi sumber daya dan aktifitas perancangan produk, pembelian, pemasaran,
mesin dan perkakas, manufacturing, penjualan, perancangan proses, production
control, pengiriman material, support service, dan customer service.
Dalam arti luas manufakur adalah proses merubah bahan baku menjadi
produk. Proses ini meliputi perancangan produk, pemilihan material dan tahap-
tahap proses dimana produk tersebut dibuat.
|
![]() 41
2.2.3
Produk Manufaktur
Produk akhir yang dibuat dalam industri dapat dibagi dalam dua kelas
utama, yaitu: customer goods, dan capital goods.
Customer goods adalah produk-produk yang dibeli langsung oleh
konsumen dan digunakan untuk keperluan pribadi, seperti mobil, komputer,
telvisi.
Capital goods adalah produk-produk yang dibeli langsung oleh
perusahaan untuk menghasilkan barang-barang atau pelayanan, seperti mesin
perkakas,dll.
2.2.4
Kemampuan Manufaktur
Untuk mengukur kemampuan manufaktur dapat dilihat dari:
Kemampuan pemrosesan teknologi (Technological Processing
Capability)
Limitasi fisik produk ( Physical Product Limitations)
Kapasitas produksi (Production Capacity).
2.2.5
Proses Manufaktur
Proses manufaktur dibagi dalam dua jenis operasi utama, yaitu:
1.
Operasi Pemrosesan
Merubah suatu bentuk ke bentuk lain mendekati bentuk akhir
produk yang diinginkan, sehingga memiliki nilai tambah dengan
merubah sifat-sifat, maupun penampilan.
2.
Operasi Perakitan
Menyambungkan atau menyatukan dua atau lebih komponen-
komponen.
|