2010100711SIBab2

BAB 2

LANDASAN TEORI

2.1. Teori-Teori Umum

2.1.1. Pengertian Data

Menurut

O’Brien

(2005,p38)data adalah fakta atau

observasi

mentah

yang

biasanya mengenai transaksi bisnis.

2.1.2. Pengertian Informasi

Menurut McLeod and Schell (2001,p12), informasi merupakan data yang

telah diproses atau data yang memiliki makna.

2.1.3. Pengertian Database

Menurut Connoly dan Begg (2005,p15), database adalah kumpulan data-data

yang saling berhubungan satu sama lain yang digunakan secara bersama-sama dan

dirancang untuk memenuhi kebutuhan informasi perusahaan atau organisasi.

2.1.4. Pemodelan Entity Relationship

Menurut

Connoly

dan

Begg

(2005,p342),

pemodelan

ER adalah pendekatan

dari atas ke bawah untuk merancang

database

yang

dimulai

dengan

mengidentifikasi data yang penting yang dikenal dengan sebutan entitas dan

hubungan

antara

data

harus

diperlihatkan

dalam model

ini.

Konsep

dasar

dari

pemodelan ER antara lain:

Entitas (Entity)

Menurut Connoly dan Begg

(2005,p343), entity

type adalah sekumpulan

objek dengan properti

yang sama, dimana diidentifikasikan oleh perusahaan

karena mempunyai keadaan bebas. Menurut Connoly dan Begg (2005,

p333),

entity

occurence adalah

objek

yang

didefinisikan

secara

unik

dari

entity

type.

Entity

type

digambarkan

dalam bentuk

bujur

sangkar

dengan

diberi nama entitas, yang umumnya adalah kata benda tunggal, dapat dilihat

pada gambar 2.1

Gambar 2.1 Diagram dari Entity Type Branch dan Staff

(Sumber : Connoly dan Begg, 2005, p345)

Hubungan (Relationship)

Menurut Connoly dan Begg (2005, p346),

relationship type

adalah

sekumpulan asosiasi berarti antara entity types.

Setiap relationship type digambarkan dengan garis yang menghubungkan

entity

type,

dan

diberi

nama

hubungannya

seperti

pada

gambar 2.2

Pada

umumnya, hubungannya menggunakan kata kerja atau frase pendek yang

mengandung kata kerja. Jika memungkinkan, nama hubungannya harus

bersifat unik. Secara umum, nama

hubungan hanya mempunyai arti untuk

satu arah saja. Contohnya

pada

gambar dibawah

ini

menyatakan

bahwa

Branch memilliki Staff.

Gambar 2.2 Diagram dari Relationship Type Branch mempunyai Staff

(Sumber : Connoly dan Begg ,2005, p347)

Atribut (Attribute)

Menurut Connoly dan Begg (2005, p350), atribut adalah properti dari

sebuah entitas atau relationship type. Contohnya, Staff memiliki atribut

StaffNo, nama, posisi, dan gaji.

Multiplicity

Menurut

Connoly

dan

Begg

(2005,

p356), multiplicity

adalah

sejumlah

kemunculan

yang

mungkin

ada

dalam sebuah

entitas

yang

berhubungan

dengan kemunculan tunggal dari entitas yang berhubungan dengannya.

Tiga tipe hubungan multiplicity adalah :

•

1:1 (One-to-One)

Contoh dari hubungan ini ádalah :

Gambar 2.3 Multiplicity hubungan satu ke satu dari staff yang mengatur Branch

(Sumber : Connoly dan Begg,2005, p358)

Artinya,

seorang

staff

dapat mengatur nol atau satu cabang dan

masing-masing cabang di atur oleh satu staff.

•

1:* (One-to-Many)

Contoh dari hubungan ini adalah :

Gambar 2.4 Multiplicity hubungan satu ke banyak dari staff yang mengawasi property for

rent

(Sumber : Connoly dan Begg, 2005, p359)

Artinya, seorang staff dapat mengawasi nol atau lebih properti yang

akan disewa dan sebuah properti yang akan disewa diawasi oleh nol

atau satu staff.

•

*:* (Many-to-Many)

Contoh dari hubungan ini adalah :

Gambar 2.5 Multiplicity hubungan banyak ke banyak dari newspaper yang

mengiklankan property for rent

(Sumber : Connoly dan Begg, 2005, p360)

Artinya, satu koran mengiklankan satu atau lebih properti yang akan

disewa dan satu properti yang akan disewa diiklankan oleh nol atau

lebih koran.

2.1.5. Konsep Data warehouse

2.1.5.1 Pengertian Data Warehouse

Menurut Inmon (2005,p29), data warehouse merupakan kumpulan

dari database yang memiliki sifat berorientasi subjek, terintegrasi, yang

dirancang untuk dapat mendukung pengambilan keputusan dalam

organisasi, dimana tiap datanya berhubungan dengan suatu kejadian yang

terjadi pada suatu waktu tertentu.

2.1.5.2 Karakteristik Data Warehouse

Menurut Inmon (2005,p29), sebuah data warehouse

memiliki

karakteristik sebagai berikut :

Subject Oriented

Data warehouse bersifat subject oriented berarti bahwa

data

warehouse

bukan

berorientasikan

pada proses atau fungsi

aplikasi

tertentu,

melainkan

pada subyek-subyek

tertentu

dalam

perusahaan, yang mana biasanya memiliki subyek-subyek yang

unik

untuk

tiap

perusahaannya. Misalnya

untuk

perusahaan

asuransi subyeknya adalah pelanggan, kebijakan, premi, dan

keluhan; dalam pabrik subyeknya adalah produk, pesanan, vendor,

tagihan material, bahan baku; dan sebagainya.

Gambar 2.6 Aspek Subject Oriented dari Data Warehouse

(Sumber : Inmon, 2005, p30)

Integrated

Karakteristik integrasi ini dapat dikatakan merupakan aspek

terpenting dari

data warehouse.

Integrasi

disini dimaksudkan

bahwa

data

dalam data warehouse

memiliki satu

bentuk

tunggal

fisikal yang sama dan konsisten walau berasal dari sumber

yang

berbeda-beda. Termasuk juga konsistensi pada aplikasi yang

mengaksesnya, aturan pengentrian

data, aturan penamaan atribut,

dan karakteristik fisikal data lainnya. Jadi pengkodean pada data

warehouse

dilakukan secara

konsisten

tanpa

terpengaruh pada

metode

maupun

sumber

aplikasinya berjalan seperti

bagaimanapun.

Gambar 2.7 Integrasi Data Warehouse

(Sumber : Inmon, 2005, p31)

Time Variant

Variasi waktu disini diartikan bahwa data di dalam sebuah

data warehouse berhubungan dengan suatu titik atau point dalam

suatu periode waktu tertentu. Misalnya semester, kwartalan, tahun

fiskal, atau periode pembayaran. Sebagai contoh, data yang

menunjukkan penjualan produk yang terlaris per tahun, jumlah

pembelian per kwartal, dan sebagainya.

Tabel 2.1 Perbandingan time variant antara data opersional dan data warehouse

(Inmon, 2005, p32)

Data Operasional

Data Warehouse

Mempunyai time horizon 60 - 90

hari

Data atau record dapat di-update

Key structure dapat termasuk atau

tidak termasuk elemen waktu

Mempunyai time horizon 5 - 10

tahun

Data atau record tidak dapat di-

update

Key structure termasuk elemen

waktu

Nonvolatile (Tidak dapat berubah)

Karakteristik data

warehouse

nonvolatile dapat diartikan

bahwa

ketika

data

sudah

disimpan

dalam

sebuah data

warehouse, data harus tidak boleh berubah atau tidak boleh ada

perubahan didalamnya.

Gambar 2.8 Aspek Non-Volatile dari Data Warehouse

(Sumber : Inmon, 2005, p32)

2.1.5.3 Struktur Data Warehouse

Data warehouse mempunyai struktur yang spesifik dan

mempunyai

perbedaan

dalam tingkatan

ringkasan (summary)

dan

detail

data serta perbedaan dalam tingkatan umur data. Menurut

Inmon(2005,p33) terdapat beberapa level

detail yang berbeda dalam

dalam data warehouse, yaitu :

•

Current detail data (data detail saat ini)

•

Old detail data (data detail historis)

•

Lightly summarized data (data ringkasan level menengah)

•

Highly summarized data (data ringkasan level tinggi)

Current Detail

Highly

Summarized

Lightly Summarized

(Data Mart)

Operational

Transformation

Old Detail

Gambar 2.9 Struktur Data Warehouse

(Sumber : Inmon, 2005, p34)

Current detailed data

Pada bagian ini current detail data disimpan dalam skema

database. Data ini

tidak disimpan secara

langsung, tetapi data

ini

ditambahkan

dalam warehouse

untuk

melengkapi

data

yang

terkumpul. Data ini menjadi berguna saat detil data terkumpul pada

tahap berikutnya.

Old detailed data

Old detailed data merupakan

data detil

dan

ringkas

yang

berguna

untuk

arsip

dan back

up.

Meskipun

ringkasan

data

atau

summary

didapat

dari current detailed data, tetapi masih

memungkinkan untuk menyimpan ringkasan data tersebut secara

langsung jika data berada diluar periode

current detailed data.

Data

disimpan

dalam sebuah

penyimpanan seperti magnetic

tape

atau optical disk.

Lightly summarized data

merupakan

data

ringkasan

atau

summary

dari

current

detailed

data.

Pada

tingkat

ini,

data hasil

ringkasan

masih

belum dapat

digunakan

dalam proses

pengambilan keputusan karena belum bersifat ‘total summary’ dan

menjadi bersifat rinci.

Lightly summarized data biasanya sering digunakan untuk

gambaran dari keadaan yang sedang berlangsung dan sudah

berlangsung.

Highly summarized data

Highly summarized data merupakan hasil proses summary

yang

bersifat

‘totalitas’.

Data pada highly

summarized ini

sangat

mudah diakses. Data pada tingkat inilah yang pada akhirnya

digunakan untuk mendukung pengambilan keputusan terutama

dikalangan eksekutif dalam dunia bisnis.

Hal ini disebabkan karena data pada tingkat ini dianggap

sudah cukup representative dan ringkas. Akan tetapi tetap dapat

merepresentasikan keadaan data secara keseluruhan. Hal ini

tentu

saja sangat memudahkan kalangan pimpinan atau eksekutif karena

tidak perlu lagi membaca dan melakukan analisis data untuk waktu

yang cukup lama.

2.1.5.4 Keuntungan Data Warehouse

Menurut Connolly dan Begg (2005, p1152), keuntungan data

warehouse adalah:

Potensial ROI (Returns on Investment) yang tinggi. Organisasi

harus menjalankan jumlah yang besar dari sumber untuk menjamin

kesuksesan implementasi dari data warehouse

dan biaya yang

sangat

besar bagi solusi technical support yang tersedia.

Penyelidikan dari International Data Corporation (IDC) pada

tahun 1996 menjalankan rata-rata ROI dalam 2 tahun dengan data

warehousing mencapai

401%, diatas 90% perusahaan yang

disurvei mencapai diatas 160% ROI, dan seperempatnya lebih dari

600% ROI.

Competitive Advantage. ROI yang besar bagi perusahaan-

perusahaan diperoleh dari kesuksesan data warehouse

merupakan

fakta bahwa competitive advantage yang besar menyertai teknologi

ini. Competitive advantage diperoleh dengan menyediakan akses

pembuatan keputusan ke data yang dapat mengungkapkan

ketidaksediaan, ketidakpahaman, dan ketidakterbukaan informasi

sebelumnya, sebagai contoh customer, trend, dan permintaan.

Meningkatkan produktivitas

pembuatan

keputusan

perusahaan.

Data warehouse meningkatkan produktivitas pembuatan keputusan

perusahaan

dengan

menciptakan

integrasi database yang

konsisten, subject-oriented, data historikal.

2.1.5.5 Komponen Data Warehouse

Komponen data warehouse terdiri atas:

Operational Data Source

Sumber data untuk data warehouse didapat dari main frame

operasional data, data tiap departemen, data pribadi, dan dari

sistem eksternal seperti internet.

Operational Data Store

Merupakan

tempat

menyimpan

current

data dan

data

operasional dan terintegrasi untuk dianalisa.

Load Manager (Frontend Component)

Melakukan semua operasi yang berhubungan dengan

pengekstrakan dan pemuatan data ke data warehouse.

Warehouse Manager

Warehouse manager berupa:

•

Melakukan analisa data untuk menjaga konsistensi data.

•

Melakukan transformasi dan penggabungan sumber data

dari

penyimpanan

sementara

dalam tabel-tabel

data

warehouse

•

Menciptakan index dan view pada base tables

•

Melakukan denormalisasai (jika diperlukan)

•

Melakukan agregasi (jika diperlukan)

•

Melakukan back-up dan archive / back-up data

Query Manager

Query manager melakukan semua operasi yang

berhubungan

dengan

management user

queries.

Kemampuan

ini

dibangun dengan menggunakan vendor end-user data access tools,

data warehouse monitoring tools, falisilitas basis data, dan custom

build-in program. Kompleksitas queries manager ditentukan oleh

fasilitas yang disediakan oleh end-user access tools dan basis data.

Operasi

yang

dilakukan

komponen

ini

berupa

pengarahan query

pada tabel-tabel yang tepat dan penjadwalan eksekusi query.

Detailed Data

Komponen

ini menyimpan semua data detil dalam skema

basis

data.

Pada

umumnya

beberapa

data

tidak

disimpan

secara

fisik tetapi dapat dilakukan dengan cara agregasi. Secara periodik

data

detil

ditambahkan

ke data

warehouse

untuk

mendukung

agregasi data.

Lightly and Highly Summarized Data

Komponen ini menyimpan semua data yang diringkas oleh

warehouse manager.

Data

perlu

diringkas

dengan

tujuan

untuk

mempercepat

performa query. Rangkuman data turut diperlukan

seiring dengan adanya data yang baru yang masuk ke dalam data

warehouse.

Archive / Back-up Data

Komponen

ini

menyimpan

data detil

dan

ringkasan

data

dengan

tujuan

untuk

menyimpan

dan

back-up data.

Walaupun

ringkasan yang

diperoleh

dari

data

mendetil,

ringkasan perlu

back-up

juga

apabila

data

tersebut disimpan

melampaui

periode

penyimpanan

data

detil.

Data kemudian

digunakan

media

penyimpanan seperti magnetic tape atau optical disc.

Metadata

Komponen

ini

menyimpan

semua

definisi metadata

(informasi

mengenai

data)

yang

digunakan

dalam

proses

dalam

data

warehouse.

Metadata

digunakan

untuk

berbagai

tujuan,

antara lain:

•

Proses

extracting

dan

loading,

metadata

digunakan

untuk

menentukan sumber data dalam warehouse.

•

Proses

manajemen

warehouse,

metadata

digunakan

untuk

menghasilkan tabel ringkasan.

•

Sebagai bagian dari proses manajemen query, metadata

digunakan untuk mengarahkan sebuah query pada sumber

data yang tepat.

10.

End-user Access Tools

Tujuan utama

dari

data warehouse

adalah menyediakan

informasi bagi pengguna untuk pembuatan keputusan yang

strategis dalam berbisnis. Para pengguna berinteraksi dengan data

warehouse menggunakan end-user access tools. Berdasarkan

kegunaan data warehouse, terdapat

lima kategori end-user access

tools, yaitu:

•

Reporting and Query Tools

Reporting tools meliputi production reporting tools dan

report writers.

Production reporting tools digunakan untuk

menghasilkan

laporan operasional secara berkala.

Query

Tools

untuk relasional data warehouse

dirancang

untuk menerima SQL, dan proses query data yang

tersimpan di warehouse.

•

Application Development Tools

Application Development

Tools

menggunakan

graphical

data access tools yang dirancang khusus untuk

lingkungan

client-server. Beberapa aplikasi tersebut diintegrasikan

dengan OLAP tools, dan dapat mengakses semua sistem

basis data utama.

•

Executive Information System (EIS) Tools

EIS sering dikenal sebagai “everyone’s information system”

(sistem informasi

setiap

orang).

Awalnya

dikembangkan

untuk

mendukung

pembuatan

kebutuhan top-level

yang

strategis.

Akan tetapi, kemudian

meluas

untuk mendukung

semua tingkat

manajemen. EIS tools pada awalnya

berhubungan dengan mainframes yang memungkinkan para

pengguna untuk membangun aplikasi pendukung keputusan

yang bersifat grafik untuk menyediakan sebuah

overview

mengenai data perusahaan dan akses pada sumber data

eksternal. Kini, EIS banyak

dilengkapi dengan fasilitas

query dan menyediakan custom-build applications untuk

area bisnis seperti penjualan, pemasaran dan keuangan.

•

Online Analytical Processing (OLAP) Tools

OLAP

tools didasarkan

pada

konsep

basis

data

yang

bersifat multi-dimensional dan memperbolehkan pengguna

untuk menganalisis data dari sudut pandang yang kompleks

dan multi-dimensi. Alat Bantu ini mengasumsikan bahwa

data

diatur dengan

model

multi-dimensi

yang

khusus

(MDDB) atau oleh sebuah relational basis data yang

dirancang untuk memungkinkan query multi dimensi.

•

Data Mining Tools

Data mining adalah proses menemukan korelasi, pola dan

tren yang baru, yaitu dengan melakukan penggalian

sejumlah data menggunakan teknik statistik, matematis,

dan artificial intelligent (AI). Data mining memiliki potensi

untuk menggatikan kemampuan OLAP tools.

2.1.5.6 OLTP (Online Transaction Processing)

Menurut

Connoly dan Begg (2005, p1153), Online Transaction

Processing (OLTP) is the systems that have been designed to handle high

transaction throughput, with transactions typically making small changes

to the organization’s operational data, that is, data that the organization

requires to handle its day-to-day operations ”, yang berarti OLTP adalah

suatu

sistem

yang

telah

dirancang

untuk

menangani

jumlah

hasil

transaksi yang tinggi, dengan transaksi yang pada umumnya membuat

perubahan yang kecil bagi data operasional organisasi. Oleh karena itu,

data organisasi memerlukan penanganan operasinya setiap hari.

Data pada database operasional bersifat volatile, dirancang untuk

membuat perubahan baru dan termutakhir terhadap data didalamnya,

menjaga integrasi data dan melaksanakan transaksi data secepat mungkin.

Pemakai dapat melihat informasi,

mungkin memanipulasi informasi

tersebut pada layar komputer, tetapi pemakai tidak dapat merubah isi data

dari data

yang ada pada database analisis. Sedangkan database analisis

dirancang untuk sejumlah besar data yang bersifat read only serta

menyediakan informasi yang digunakan untuk membuat keputusan. Pada

pemerosesan

database analisis, tidak terdapat pemerosesan data secara

satuan record setiap

kali

terjadi

perubahan

isi record. Perubahan pada

database analisis dilakukan sesuai jadwal yang sudah ditentukan. Karena

organisasi menggunakan banyak aplikasi piranti lunak dan banyak

database,

maka

data

warehouse

digunakan

untuk

mengumpulkan

dan

mengatur data yang diperoleh dari aplikasi-aplikasi bertahun-tahun dalam

suatu tempat.

2.1.5.6.1 Perbandingan antara OLTP dan Data Warehouse

Tabel 2.2 Perbandingan antara OLTP dengan Data Warehouse

(Connoly dan Begg, 2005, p1153)

TABEL

OLTP

DATA WAREHOUSE

Tujuan

Menjalankan operasi

sehari-hari

Mengambil dan menganalisa

informasi

Management database

RDBMS

Metode Pemodelan Data

Normalisasi

Skema Bintang

Akses

SQL

SQL ditambah dengan

kemampuan analisa data

Kegunaan data

Digunakan untuk

menjalankan kegiatan

bisnis harian

Digunakan untuk

menganalisa dan menyiasati

strategi bisnis

2.1.5.7 OLAP (Online Analytical Processing)

Menurut Connoly dan Begg (2005,p1205),

OLAP

adalah

sintesis

dinamis, analisis dan konsolidasi dari sekumpulan besar data

multidimensi. OLAP merupakan proses departmental untuk lingkungan

data mart. OLAP mendeskripsikan sebuah teknologi yang menggunakan

view multi-dimensi dari sekumpulan data untuk menyediakan akses yang

cepat ke informasi strategis untuk analisis lebih lanjut. Aplikasi OLAP

tergantung dengan

data warehouse

dan

system OLTP

untuk merefresh

source level data.

OLAP adalah teknologi yang memperbolehkan para user

untuk

menganalisa

basis

data

yang

besar

untuk

mendapatkan

sistem informasi

yang

lebih

spesifik.

Basis

data

untuk

sistem

OLAP disusun

terstruktur

agar

lebih

efisien

dalam penyimpanan

data

statis.

Karena

penyimpanan

OLAP adalah

multidimensi, biasa disebut cube, yang berlawanan dengan

tabel.

Yang

membuat

OLAP

unik adalah kemampuannya untuk

menyimpan kumpulan data

secara

hirarki. Dimensi-dimensi memberikan

informasi secara kontekstual dalam bentuk bilangan atau perhitungan yang

lebih teliti.

2.1.5.6.1 Perbandingan OLAP dan OLTP

Tabel 2.3 Perbandingan OLAP dan OLTP

(Connoly dan Begg , 2005,p1153 )

OLAP

OLTP

Digunakan untuk mendukung kegiatan

analisis

Digunakan untuk mendukung kegiatan

transaksi sehari-hari

Menggunakan view multi dimensi

Menggunakan view single

Mendukung keputusan untuk masa

depan

Mendukung keputusan per hari

Bergantung pada data yang tesimpan

pada OLTP

Tidak bergantung pada OLAP

Melayani manajerial user

Melayani operasional user

Operasi query-nya lebih rumit, adhoc

dan tidak melibatkan operasi data

update

Operasi query-nya sederhana dan

berulang-ulang

Memakai data yang terangkum dalam

data cube

Memakai data sehari-hari

2.1.5.6.2 Perbandingan OLAP dan Data Warehouse

Tabel 2.4 Perbandingan OLAP dan Data Warehouse

(Connoly dan Begg,2005,p1049)

OLAP

DATA WAREHOUSE

Merupakan end-user access tools dari data

sederhana

Merupakan basis data untuk menyimpan

data syarat dan menyediakan data cube

yang akan digunakan untuk OLAP

Mendukung manajerial user dan analytical

user

Mendukung manajerial user

Bergantung pada data yang tersimpan pada

data warehouse

Tidak bergantung pada OLAP dalam

penyediaan datanya

Menggunakan teknologi data warehouse

dalam penggunaannya

Menyediakan teknologi yang digunakan

untuk melakukan OLAP

2.1.6. Metodologi Perancangan Data Warehouse

Menurut Connolly dan Begg (2005,p1187-1193), metodologi yang

dikemukakan

oleh

Kimball

dalam membangun data

warehouse

ada

tahapan,

yang dikenal dengan Nine-step Methodology. Sembilan tahap tersebut adalah :

Memilih Proses ( choosing the process )

Proses (fungsi) merujuk pada subjek masalah dari data mart tertentu.

Datamart yang akan dibangun harus sesuai anggaran dan dapat menjawab

masalah-masalah yang penting.

Memilih Grain ( choosing the grain )

Memilih grain berarti menentukan hal yang sebenarnya dihadirkan

oleh

tabel

fakta.

Setelah

menentukan grain-grain

tabel

fakta,

dimensi-

dimensi untuk setiap fakta dapat diidentifikasi.

Mengidentifikasi dan Membuat Dimensi yang Sesuai ( Identifying and

Comforming the Dimentions )

Mengidentifikasi dimensi disertai

deskripsi detail yang secukupnya.

Ketika

table

dimensi

berada

pada

dua

atau

lebih data

mart

maka

tabel

dimensi tersebut harus mempunyai dimensi yang sama atau salah satu

merupakan subset dari yang lainnya. Jika suatu tabel dimensi digunakan

oleh lebih dari satu data mart, maka dimensinya harus disesuaikan.

Memilih Fakta ( Choosing the Facts )

Memilih fakta yang akan digunakan dalam data mart.

Semua

fakta

harus ditampilkan pada tingkat yang diterapkan oleh grain dan fakta juga

harus numerik dan aditif.

Menyimpan pre- kalkulasi salam tabel Fakta ( Storing pre-calculation in

the Fact Table )

Ketika

fakta

telah

dipilih,

maka

setiap fakta tersebut harus diuji

apakah

ada

fakta

yang

dapat

menggunakan pre-kalkulasi, setelah itu

lakukan penyimpanan pada tabel fakta.

Melengkapi Tabel Dimensi ( Rounding Out the Dimension Table )

Menambahkan sebanyak mungkin deskripsi teks pada tabel dimensi.

Deskripsi tersebut harus intuitif dan dapat dimengerti oleh user.

Memilih Durasi Dari Database ( Choosing the Duration of the Database )

Menentukan batas waktu dari umur data yang diambil dan akan

dipindahkan

dalam tabel

fakta. Misalnya,

data

perusahaan

dua

tahun

lalu atau lebih diambil dan dimasukkan ke dalam tabel fakta.

Melacak Perubahan Dari Dimensi Secara Perlahan ( Tracking Slowly

Changing Dimensions )

Perubahan dimensi yang lambat menjadi sebuah masalah ada tiga tipe

dasar dari perubahan dimensi yang lambat, yakni :

Perubahan atribut dimensi yang ditulis ulang (overwrite).

Perubahan atribut dimensi yang mengakibatkan pembuatan suatu

record dimensi baru.

Perubahan atribut dimensi yang mengakibatkan sebuah atribut

alternative dibuat, sehingga kedua atribut tersebut yakni atribut

yang lama dan yang baru dapat diakses secara bersamaan dalam

sebuah dimensi yang sama.

Memutuskan Prioritas dan cara Query ( Deciding the Query Priorities and

the Query Modes)

Mempertimbangkan pengaruh dari perancangan fisikal yang akan

mempengaruhi persepsi user terhadap

datamart.

Selain

itu,

perancangan

fisikal

ini

akan

mempengaruhi

masalah

administrasi, backup,

kinerja

pengideksan dan keamanan.

2.1.7. Konsep Pemodelan Data Warehouse

Menurut Connoly dan Begg (2005, p1187), merancang

data warehouse

merupakan suatu pekerjaan yang sangat kompleks. Untuk

memulai sesuatu

proyek

data warehouse mula-mula perlu dilakukan pengumpulan analisis

kebutuhan pengguna, yang bisa dilakukan dengan cara melakukan wawancara

terhadap anggota yang sesuai, contohnya pengguna dibidang pemasaran,

keuangan, penjualan, operasional, dan manajemen untuk mengidentifikasi satu set

kebutuhan yang terprioritaskan bagi perusahaan yang harus dipenuhi oleh data

warehouse. Hasil wawancara menyediakan informasi yang penting bagi top-down

view

(kebutuhan pengguna ) dan bottom-up view

(dimana sumber data tersedia)

dari

data warehouse.

Dengan

dua

pandangan

diatas

proses

merancang data

warehouse sudah dapat dimulai.

Salah

satu

komponen

basis

data

dalam data

warehouse

dideskripsikan

dengan

menggunakan

permodelan

dimensionalitas (dimensionality

modelling),

yaitu suatu teknik desain secara logis yang bertujuan untuk menyajikan data

dalam suatu

bentuk

standar

dan

intuitif

yang

memungkinkan

akses

dengan

performansi tinggi. Konsep permodelan dimensionalitas menggunakan konsep

dari permodelan

entity-relationship (ER) dengan

beberapa

pembatasan penting.

Setiap model dimensionalitas terdiri dari satu tabel dengan satu composite

primary key (PK) yang dikenal sebagai tabel fakta (fact tabel), serta satu lagi tabel

yang lebih kecil yang dikenal sebagai tabel dimensi (dimension tabel).

Setiap

tabel

dimensi

memiliki

satu primary key

yang

berkorespondensi

dengan satu komponen dari composite key dalam tabel fakta. Dengan kata lain,

primary key dari tabel

fakta terdiri dari dua atau lebih foreign key. Karakteristik

yang

memiliki bentuk

seperti bintang

ini dikenal sebagai star schema atau star

join atau skema bintang.

2.1.7.1 Skema Bintang (Star Schema)

Menurut Connolly (2005, p1183), skema

bintang

adalah

struktur

logikal

yang

mempunyai

sebuah

tabel fakta

yang

berisi

data

fakta

tengah dan dikelilingi oleh tabel-tabel dimensi yang berisi data referensi

atau keterangan yang biasanya dapat denormalisasi.

Gambar 2.10 Star Schema

(Sumber : Connolly, 2005, p1184)

2.1.7.1.1 Tabel Facta (Fact Table)

Menurut Connolly dan Begg (2005, p1183), “Every

dimensional model (DM) is composed of one table with a

composite primary key, called the fact table”, yang berarti tabel

fakta

adalah

suatu

tabel

pada

Dimensional Model

(DM)

yang

isinya

composite

primary

key (PK).

Jadi

pada

tabel

fakta

merupakan beberapa foreign key.

2.1.7.1.2 Tabel Dimensi (Dimenstion Table)

Menurut Connolly dan Begg (2005, p1183), “Dimensional

table is a set of smaller tables called dimension tables”,

yang

berarti tabel dimensi adalah sekumpulan tabel-tabel yang lebih

kecil

dari

tabel

fakta

pada

dimensional

model

(DM).

Setiap

tabel dimensi mempunyai non-composite Primary Key.

2.1.7.1.3 Surrogate key

Menurut

http 1, A surrogate key is an artificially produced

value, most often a system-managed, incrementing counter

whose

values

can

range

from

where

represents

table's

maximum number

rows.

SQL

Server,

create

surrogate

key

assigning

identity

property

column

that

has

number

data

type.

natural

key is

a naturally

occurring descriptor of the data and one of a table's attributes

that has no duplicate values. When use a natural key as a table's

primary key, each of the table's rows is uniquely identified.

Artinya, sebuah nilai yang dihasilkan secara buatan, sistem

yang paling sering dikelola, penambahan nilai-nilai yang dapat

berkisar dari 1 hingga n, dimana n merupakan jumlah angka

maksimum dari baris yang ada pada tabel. Dalam SQL Server,

membuat surrogate key dengan menetapkan identitas pada

kolom

yang memiliki

sejumlah

tipe

data.

Kunci

yang

secara

alami

menjadi

deskripsi

dari data dan

salah

satu

atribut dari

tabel tidak bernilai ganda. Ketika

menggunakan kunci tersebut

sebagai sebuah primary key dari tabel, masing-masing baris

pada tabel secara unik teridentifikasi.

2.1.7.2 Keuntungan Skema Bintang

Skema

bintang

memiliki

keuntungan yang

tidak didapat

oleh

skema

relasional biasa. Keuntungan skema bintang, antara lain:

•

Respon data yang lebih cepat dihasilkan dari perancangan

database.

•

Kemudahan dalam

mengembangkan atau

memodifikasi data

yang

terus berubah.

•

End user dapat menyesuaikan cara berpikir dan menggunakan

data, konsep ini dikenal juga dengan istilah pararel dalam

perancangan database.

•

Menyederhanakan pemahaman dan penelusuran metadata bagi

pemakai dan pengembang.

2.1.8

Arsitektur Data Warehouse

2.1.8.1 Centralized Data Warehouse

Centralized data warehouse ini

merupakan database fisikal

tunggal

yang memuat semua data untuk area fungsional yang khusus, departemen,

divisi,

atau

perusahaan.

Data warehouse ini

digunakan

ketika

terdapat

kebutuhan

akan

data informasional

dan

terdapat

banyak

end-user

yang

sudah terhubung ke komputer pusat atau jaringan.

Bentuknya

menyerupai functional

data

warehouse,

akan tetapi

sumber datanya

lebih dahulu dikumpulkan atau diintegrasikan pada suatu

tempat

terpusat, baru

kemudian

data tersebut

dibagi

berdasarkan

fungsi-

fungsi yang dibutuhkan oleh perusahaan. Bentuk data warehouse terpusat

ini sering digunakan oleh perusahaan-perusahaan yang belum mempunyai

jaringan eksternal.

Keuntungan bentuk centralized data warehouse ini adalah data

benar-benar

terpadu

karena

konsistensi

yang

tinggi. Namun

demikian

membutuhkan waktu yang lama dan biaya yang mahal dalam membentuk

data warehouse seperti ini.

Gambar 2.11 Centralized Data Warehouse

2.1.9 ETL (Extract,Transform,Loading)

Menurut Silvers(2008,p150) ETL (Extract, Transform, Load) adalah

proses-proses dalam data warehouse yang meliputi:

•

Mengekstrak data dari sumber-sumber eksternal.

•

Mentransformasikan data ke bentuk yang sesuai dengan keperluan bisnis.

•

Memasukkan data ke target akhir, yaitu data warehouse.

ETL

merupakan

proses

yang

sangat penting,

dengan

ETL

data

dapat

dimasukkan

dalam data

warehouse.

ETL

juga

dapat

digunakan

untuk

mengintegrasikan data dengan sistem yang sudah ada sebelumnya.

Tujuan ETL adalah mengumpulkan, menyaring, mengolah, dan

menggabungkan data yang relevan dari berbagai sumber untuk disimpan ke dalam

data warehouse. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi

kriteria data warehouse seperti data historis, terpadu, terangkum, statis, dan

memiliki struktur yang dirancang untuk keperluan proses analisis.

Extract

Langkah

pertama

pada

proses

ETL adalah

mengekstrak

data dari

sumber-sumber data. Kebanyakan proyek data warehouse

menggabungkan data dari sumber-sumber yang berbeda. Pada hakekatnya,

proses ekstraksi adalah proses penguraian, pembersihan dari data yang

diekstrak untuk mendapatkan struktur atau pola data yang diharapkan.

Transform

Tahapan transfomasi

menggunakan serangkaian aturan atau fungsi

untuk mengekstrak data dari sumber dan selanjutnya akan dimasukkan ke

dalam data warehouse. Berikut adalah hal- hal yang dapat dilakukan

dalam tahap transformasi :

Hanya

memilih

kolom

tertentu

saja

untuk

dimasukkan

ke dalam

data warehouse.

Menterjemahkan

nilai-nilai

yang berupa kode

(contohnya

apabila

database sumber menyimpan nilai 1

untuk laki-

laki dan

nilai 2

untuk

perempuan, tetapi data

warehouse

yang telah

ada

menyimpan M untuk laki-laki dan F untuk perempuan, ini disebut

dengan

automated

data cleansing,

tidak ada pembersihan secara

manual yang ditunjukkan selama proses ETL.

Mengkodekan nilai-nilai ke dalam bentuk bebas (contohnya

memetakan “Male”, “1” dan “Mr” ke dalam M).

Melakukan perhitungan nilai-nilai baru (contohnya sale_amount =

qty * unit_price).

Menggabungkan data secara bersama-sama dari berbagai sumber.

Membuat

ringkasan

dari

sekumpulan baris

data

(contohnya total

penjualan untuk setiap toko atau setiap bagian).

Fase load merupakan tahapan yang berfungsi untuk memasukkan

data ke dalam target akhir, yang biasanya ke dalam suatu data warehouse.

Jangka waktu proses ini tergantung pada kebutuhan organisasi.

Beberapa

data warehouse dapat setiap minggu menulis keseluruhan informasi yang

ada secara kumulatif, data diubah, sementara

data

warehouse

yang

lain

(atau

bagian

lain

dari

data

warehouse

yang

sama)

dapat

menambahkan

data baru dalam suatu bentuk historikal, contohnya setiap jam. Waktu dan

jangkauan untuk mengganti atau menambah data tergantung dari

perancangan data

warehouse

pada

waktu

menganalisis

keperluan

informasi.

Gambar 2.12 Extract, Transform, Load (ETL)

(Sumber : Silvers, 2008, p152)

2.1.10 Metadata

Menurut

Paulraj

Ponniah(2001,p36),

metadata

dalam

sebuah

datawarehouse di bagi ke dalam

3 kategori utama :

•

Operational Metadata

Data

untuk data warehouse berasal dari beberapa sistem operasional

dari

perusahaan.

Sumber

sistem ini

mengandung

struktur

data

yang

berbeda. Elemen data yang dipilih untuk data warehouse

mempunyai

bermacam-macam field lengths

dan

tipe

data.

Dalam memilih

data dari

sumber

sistem untuk

data

warehouse,

record

harus

dipisahkan,

menggabungkan bagian-bagian records dari sumber file yang berbeda dan

membuat kesepakatan dengan skema

pengkodingan

ganda

dan field

lengths. Ketika informasi dikirim kepada end user, harus dapat

menghubungkan kembali ke kumpulan sumber data yang asli. Operasional

metadata mengandung semua informasi mengenai operasional sumber

data.

•

Extraction and Transformation Metadata

Extraction dan Transformation Metadata mengandung data mengenai

ekstraksi data dari sumber sistem, yakni ekstraksi frekuensi, ekstraksi

metode dan aturan-aturan bisnis

untuk ekstraksi data. Juga, kategori dari

metadata ini mengandung informasi tentang semua transformasi data yang

mengambil tempat dalam data staging area.

•

End-User Metadata

End-User

Metadata

merupakan

peta

navigasi

dari

data

warehouse.

Hal ini memungkinkan end-user

untuk menemukan informasi dari data

warehouse. End-user

metadata mengijinkan end-user untuk

menggunakan terminologi bisnis milik mereka sendiri dan mencari

informasi dalam cara itu dimana mereka secara normal berpikir mengenai

bisnis.

2.1.11 Fact Finding

Menurut Connolly dan Begg (2005, p317- 321), fact finding adalah proses

formal yang menggunakan teknik-teknik seperti wawancara dan kuesioner untuk

mengumpulkan fakta-fakta mengenai sistem, persyaratan dan preferensi. Metode yang

digunakan fact finding adalah :

Wawancara

Wawancara adalah yang paling sering digunakan, dan biasanya

paling berguna, teknik pencarian fakta.

Kita

dapat

wawancara

untuk

mengumpulkan informasi dari individu melalui tatap muka. Ada beberapa

tujuan dapat menggunakan wawancara, seperti mencari tahu fakta,

memverifikasi fakta, mengklarifikasi fakta, menghasilkan antusiasme,

mendapatkan pengguna akhir yang terlibat, mengidentifikasi kebutuhan,

dan mengumpulkan ide -

ide dan pendapat. Akan tetapi, dengan

menggunakan teknik wawancara membutuhkan keterampilan komunikasi

yang baik untuk berurusan secara efektif dengan orang -

orang yang

memiliki

nilai

yang berbeda, prioritas, opini,

motivasi, dan kepribadian.

seperti fakta lain teknik wawancara tidak selalu merupakan metode terbaik

untuk semua situasi.

Terdapat

dua

macam

tipe interview:

tidak terstruktur dan

terstruktur.

Wawancara tidak

terstruktur

dilakukan

hanya

dengan

tujuan

umum dalam pikiran dan dengan sedikit, jika ada, pertanyaan - pertanyaan

spesifik. Pewawancara menghitung pada orang yang diwawancara untuk

menyediakan kerangka kerja dan arah untuk wawancara. Wawancara jenis

ini sering kehilangan

fokus, karena alasan ini, sering kali tidak berfungsi

dengan baik untuk analisis dan desain database.

Wawancara terstruktur, pewawancara memiliki serangkaian

pertanyaan khusus untuk meminta diwawancarai. tergantung pada respon

orang yang diwawancara, pewawancara akan langsung menambah

pertanyaan-pertanyaan untuk mendapatkan klarifikasi atau ekspansi.

Untuk

memastikan

kesuksesan wawancara

meliputi memilih

individu yang sesuai untuk wawancara, mempersiapkan secara ekstensif

untuk wawancara, dan melakukan wawancara yang efisien dan efektif.

Tabel 2.5 Keuntungan dan Kelemahan Menggunakan Wawancara sebagai Teknik Fact

Finding (Connolly dan Begg, 2005, p318)

Mengamati perusahaan beroperasi

Pengamatan adalah salah satu yang paling efektif teknik pencarian

fakta untuk memahami

sebuah sistem. Dengan teknik ini, mungkin baik

untuk berpartisipasi , atau menonton, orang yang melakukan kegiatan

untuk belajar tentang sistem. Teknik ini terutama bermanfaat bila validitas

data yang dikumpulkan melalui metode lain yang terkait atau ketika

kompleksitas aspek-aspek

tertentu dari sistem mencegah penjelasan

yang

jelas oleh pengguna akhir, seperti dengan fakta lain teknik, pengamatan

yang sukses membutuhkan persiapan. Untuk memastikan bahwa

pengamatan berhasil, sangat penting untuk mengetahui sebanyak mungkin

tentang individu dan kegiatan yang harus diperhatikan mungkin.

Tabel 2.6 Keuntungan dan Kelemahan Menggunakan Observasi sebagai Teknik Fact

Finding

(Sumber : Connolly, 2005, p319)

2.2. Teori-teori khusus

2.2.1. Sistem Penjualan

Menurut Anita S. Hollander et al. (2000, p230), penjualan adalah kumpulan

kejadian yang secara kolektif melayani untuk menarik pelanggan, membantu

pelanggan

untuk

memilih

barang

dan

layanan,

mengantar

barang

dan

layanan

yang diminta, dan mengumpulkan pembayaran untuk barang dan layanan.

2.2.2. Sistem Pembelian

Menurut

Mulyadi

(2001,

p301),

sistem pembelian

digunakan

dalam

perusahaan untuk pengadaan barang yang diperlukan oleh perusahaan. Fungsi

pembelian pada sistem pembelian bertanggung jawab untuk memperoleh

informasi mengenai harga barang, menentukan pemasok yang dipilih dalam

pengadaan barang, dan

mengeluarkan

order

pembelian

kepada

pemasok

yang

dipilih.

2.2.3. Sistem Pemasaran

Menurut Hendro, & Widhianto, C.W. (2006, p419), Pemasaran adalah

proses kegiatan dalam perusahaan dan

manajerial dimana

individu, kelompok atau

perusahaan mendapatkan apa yang mereka butuhkan atau harapkan melalui

penciptaan,

penawaran

dan

pertukaran

segala

sesuatu

yang

bernilai

dengan

orang

lain atau kelompok yang lain.