ABSTRAK
Perkembangan
teknologi informasi yang mengalami kemajuan pesat pada masa ini memberi
peran besar dalam perubahan yang mendasar khususnya dalam struktur,
operasi, dan manajemen pada sebuah organisasi. Pengolahan database,terdapat
beberapa tabel pada database yang ada tidak
digunakan dan kesulitan dalam membuat laporan yang mudah dipahami
sehingga mempengaruhi analisis data dalam mengambil suatu keputusan.
Data warehouse
menjadikan data perusahaan yang tersebar menjadi terintegrasi dan
ringkas sehingga membantu pimpinan/manager dalam menganalisis
data yang ada untuk pengambilan keputusan yang bersifat strategis secara cepat dan
tepat. Pembangunan data warehouse ini menggunakan pemodelan data
skema snowflake dan perancangan OLAP (On-Line Analytical Processing)
untuk pengolahan dan analisis datanya dengan menggunakan teknik Drill Down/Drill
Up.
Data warehouse ini diharapkan membantu pimpinan/manager dalam menganalisis
data dalam jumlah besar sehingga memudahkan dalam mengambil suatu keputusan
PENDAHULUAN
Decision Support System merupakan suatu sistem yang berfungsi sebagai
penunjang keputusan. Dengan adanya DSS, pekerjaan dari para pengambil keputusan
akan lebih terbantu secara signifikan. Makalah yang kami susun berikut ini menjelaskan suatu
database yang biasa digunakan sebagai pengambil keputusan yaitu data warehouse.
Dikarenakan banyak organisasi atau perusahaan kurang dapat menggunakan database
operasional dalam mendukung secara langsung pengambilan keputusan.Penyusun sadar dalam penulisan makalah ini terdapat
banyak kekurangan, oleh karena itu, kami menerima saran dan kritik yang
membangun agar dikemudian hari kami dapat menyusun suatu makalah dengan lebih
baik lagi.
I. Definisi Data Warehouse
I.1. Pengertian Data, Informasi dan Database
Menurut Steven Alter, data merupakan fakta,gambar atau
suara yang mungkin atau tidak berhubungan atau berguna bagi tugas tertentu.
Menurut McLeod, data terdiri dari fakta-fakta dan angka
yang secara relatif tidak berarti bagi pemakai. Sedangkan informasi adalah data
yang sudah diproses atau data yang memiliki arti.
Disini kita dapat melihat bahwa data merupakan suatu
bentuk keterangan-keterangan yang belum diolah atau dimanipulasi sehingga belum
begitu berarti bagi sebagian pemakai. Sedangkan informasi merupakan data yang
sudah di olah sehingga memiliki arti.
Menurut James A. O’Brien Database adalah suatu koleksi
terintegrasi dimana secara logika berhubungan dengan record dari file.
Menurut Fatansyah, Database adalah kumpulan data yang
saling berhubungan yang disimpan secara bersama sedemikian rupa dan tanpa
pengulangan(redudansi) yang tidak perlu, untuk memenuhi berbagai kebutuhan.
Jadi Database adalah tempat penyimpanan data yang saling
berhubungan secara logika, sehingga bisa digunakan untuk mendapatkan suatu
informasi yang diperlukan oleh suatu organisasi atau perusahaan.
Sedangkan data yang diperoleh suatu organisasi atau perusahaan
umumnya didapat dari kegiatan operasional sehari-hari atau hasil dari
transaksi.
Dari perkembangan model
database, muncullah apa yang disebut dengan data warehouse.
Menurut W.H. Inmon dan Richard D.H., data warehouse
adalah koleksi data yang mempunyai sifat berorientasi
subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam
mendukung proses pengambilan keputusan management.
Menurut Vidette Poe, data warehouse merupakan
database yang bersifat analisis dan read only yang digunakan sebagai
fondasi dari sistem penunjang keputusan.
Jadi, data warehouse merupakan metode dalam
perancangan database, yang menunjang DSS(Decission Support System) dan EIS
(Executive Information System). Secara fisik data warehouse adalah
database, tapi perancangan data warehouse dan database sangat berbeda. Dalam
perancangan database tradisional menggunakan normalisasi, sedangkan pada data
warehouse normalisasi bukanlah cara yang terbaik.
Dari definisi-definisi yang dijelaskan tadi, dapat
disimpulkan data warehouse adalah database yang saling bereaksi yang
dapat digunakan untuk query dan analisisis, bersifat orientasi subjek,
terintegrasi, time-variant,tidak berubah yang digunakan untuk membantu para
pengambil keputusan.
I.3. Istilah-istilah yang berhubungan dengan data warehouse
- Data Mart
Adalah suatu bagian pada data warehouse yang mendukung
pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada
suatu perusahaan.
- On-Line Analytical Processing(OLAP)
Merupakan suatu pemrosesan database yang menggunakan
tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan,
analisis, query dari data yang berukuran besar.
- On-Line Transaction Processing(OLTP)
Merupakan suatu pemrosesan yang menyimpan data mengenai
kegiatan operasional transaksi sehari-hari.
- Dimension Table
Tabel yang berisikan kategori dengan ringkasan data
detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang
berupa perbulan, perkwartal dan pertahun).
- Fact Table
Merupakan tabel yang umumnya mengandung angka dan data
history dimana key (kunci) yang dihasilkan sangat unik, karena key
tersebut terdiri dari foreign key(kunci asing) yang merupakan primary
key (kunci utama) dari beberapa dimension table yang berhubungan.
- DSS
Merupkan sistem
yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem
ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
I.4. Karakteristik Data Warehouse
1. Berorientas
Subyek
Data warehousing
berorientasi
subject artinya data warehousing didesain untuk menganalisa data
berdasarkan subyek-subyek tertentu dalam organisasi, bukan pada proses
atau fungsi aplikasi tertentu. Data warehousing diorganisasikan
disekitar subjek-subjek utama dari perusahaan (konsumen, produk dan
penjualan) dan tidak diorganisasikan pada area-area aplikasi utama
(pelayanan konsumen, pengontrolan stok
dan penjualan produk). Hal ini
dikarenakan kebutuhan dari data warehousing untuk menyimpan
data-data yang bersifat sebagai penunjang suatu keputusan, daripada
aplikasi yang berorientasi data. Jadi dengan kata lain, data yang
disimpan adalah berorientasi kepada subyek bukan terhadap proses.
Secara garis besar perbedaan antara data operasional dan data
warehousing yaitu :
2. Terintegrasi
Data warehousing
dapat
menyimpan data-data yang berasal dari sumbersumber yang terpisah kedalam suatu format
yang konsisten dan saling terintegrasi satu dengan lainnya.
Dengan demikian data tidak bisa dipecahpecah karena data yang ada merupakan
suatu kesatuan yang menunjang keseluruhan konsep data
warehousing itu sendiri. Syarat integrasi sumber data
dapat dipenuhi dengan berbagai cara seperti konsisten dalam penamaan
variable,konsisten dalam ukuran variable,konsisten dalam struktur
pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan
operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh
developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi
tersebut ada variable yang memiliki maksud yang sama tetapi nama dan
format nya berbeda. Variable tersebut harus dikonversi menjadi nama
yang sama dan format yang disepakati bersama. Dengan demikian tidak
ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya.
Barulah data tersebut bisa dikategorikan sebagai data yang
terintegrasi karena kekonsistenannya.
3. Rentang Waktu
Seluruh data pada data
warehousing dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk
melihat interval waktu yang digunakan dalam mengukur keakuratan suatu
data warehousing, dapat digunakan
berbagai cara antara lain :
• Cara yang paling sederhana
adalah menyajikan data warehousing pada rentang waktu tertentu, misalnya
antara 5 sampai 10 tahun ke depan.
• Cara yang kedua, dengan
menggunakan variasi/perbedaan waktu yang disajikan dalam data warehousing
baik implicit maupun explicit secara explicit dengan
unsur waktu dalam hari, minggu, bulan dsb.
Secara implicit misalnya pada
saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga
bulan. Unsur waktu akan tetap ada secara implisit didalam data
tersebut.
• Cara yang ketiga,variasi waktu
yang disajikan data warehousing melalui serangkaian snapshot yang
panjang. Snapshot merupakan tampilan dari sebagian data
tertentu sesuai keinginan pemakai dari keseluruhan data yang
ada bersifat read-only.
4. Non-Volatile
Karakteristik keempat dari data
warehousing adalah non-volatile, maksudnya data pada data
warehousing tidak di-update secara real time tetapi di refresh dari
sistem
operasional secara reguler. Data yang baru selalu ditambahkan sebagai
suplemen bagi basisdata itu sendiri dari pada sebagai sebuah perubahan.
Basisdata tersebut secara kontinyu menyerap data baru ini, kemudian
secara
incremental disatukan dengan data sebelumnya.
Berbeda dengan basisdata
operasional yang dapat melakukan update, insert dan delete terhadap data
yang mengubah isi dari basisdata sedangkan pada data warehousing
hanya ada dua kegiatan memanipulasi data yaitu loading data
(mengambil data) dan akses data (mengakses data warehousing seperti melakukan
query atau menampilan laporan yang dibutuhkan, tidak ada
kegiatan dating data).
5. Ringkas
Datawarehousing menyediakan
ringkasan-ringkasan data operasional yang sederhana dan mudah dipahami
oleh pihak manajemen jika diperlukan.
6. Tidak
ternormalisasi
Data dalam sebuah data
warehousing biasanya tidak dinormaslisasi sehingga basisdatanya sangat
redudansi.
7. Data dari
berbagai sumber
Data yang diolah diperoleh dari
berbagai sumber baik sumber internal maupun sumber eksternal.
8. Memiliki
Metadata
Metadata menjadi bagian data
warehousing karena metadata mempunyai dampak yang besar pada bagaimana
data warehousing berfungsi. Metadata menguraikan struktur dan
arti data, sehingga mendukung penggunaan efektik atau tidak
efektifnya data. Metadata menyimpan kunci agar pengguna merasa nyaman dan akrab
memanfaatkan teknologi.
Manfaat
Data warehousing diperlukan bagi
para pengambil keputusan manajemen dari suatu organisasi/perusahaan.
Dengan adanya data warehouse, akan mempermudah pembuatan
aplikasi-aplikasi DSS dan EIS karena memang kegunaan dari data warehousing
adalah khusus untuk membuat suatu basisdata yang dapat digunakan
untuk mendukung proses analisa bagi para pengambil keputusan.
II.KEGUNAAN DATA WAREHOUSE
II.1 Tugas-tugas Data warehouse
Tugas-tugas yang dilakukan data
warehouse
1. Pembuatan laporan,
Pembuatan laporan merupakan salah satu kegunaan data warehousing yang paling umum
dilakukan. Dengan menggunakan query sederhana didapatkan
laporan perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
2. On-Line Analytical
Processing (OLAP), Dengan adanya data warehouse, semua informasi baik detail
maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP
mendayagunakan konsep data multi dimensi dan memungkinkan
para pemakai menganalisa data sampai mendetail, tanpa mengetikkan
satupun perintah SQL. Hal ini dimungkinkan karena pada konsep
multi dimensi, maka data yang berupa fakta yang sama bisa dilihat
dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada
sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah
kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah
kebalikannya.
3. Proses informasi eksekutif,
data warehousing dapat membuat ringkasan informasi yang penting dengan
tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan
data. Dengan menggunakan data warehousing segala laporan telah
diringkas dan dapat pula mengetahui segala rinciannya secara lengkap,
sehingga mempermudah proses pengambilan keputusan. Informasi
dan data pada laporan data warehousing menjadi target informatif bagi pengguna.
II.2 Keuntungan
Data warehousing merupakan
pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen
(yang biasanya tersebar pada beberapa basisdata OLTP) dimigrasikan
untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang
didapatkan dengan menggunakan data warehousing tersebut di bawah ini
(Ramelho).
• Data diorganisir dengan baik
untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
• Perbedaan diantara struktur
data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
• Aturan untuk transformasi data
diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data
dipindahkan dari basisdata OLTP ke data warehouse.
• Masalah keamanan dan kinerja bisa dipecahkan tanpa
perlu mengubah sistem produksi. Membangun data warehousing tentu saja
memberikan keuntungan lebih bagi
suatu perusahaan, karena data
warehousing dapat memberikan keuntungan strategis pada perusahaan
tersebut melebihi pesaing-pesaing mereka. Keuntungan tersebut diperoleh
dari beberapa sumber (Sean Nolan,Tom Huguelet):
• Kemampuan untuk mengakses data
yang besar
• Kemampuan untuk memiliki data
yang konsistent
• Kemampuan kinerja analisa yang
cepat
• Mengetahui adanya hasil yang
berulang-ulang
• Menemukan adanya celah pada business
knowledge atau business process.
• Mengurangi biaya administrasi
• Memberi wewenang pada semua
anggota dari perusaahan dengan menyediakan kepada mereka
informasi yang dibutuhkan agar kinerja bisa lebih efektif membangun Data Warehouse
III.MEMBANGUN DATA WAREHOUSE
III.1. Menentukan Bentuk Data Warehouse
Data warehouse memiliki berbagai macam bentuk yang sering digunakan. Jadi sebelum membangun
suatu data warehouse kita harus memutuskan bentuk data warehouse seperti apa
yang dibutuhkan oleh aplikasi yang kita rancang.
III.2. Anatomi Data Warehouse
Penerapan awal dari arsitektur data warehouse dibuat berdasarkan konsep bahwa data warehouse mengambil data dari berbagai sumber dan memindahkannya ke dalam pusat
pengumpulan data yang besar. Konsep ini sebenarnya lebih cenderung kepada
sebuah lingkungan mainframe yang terpusat.
Keunggulan teknologi Client
Server memungkinkan data warehouse diterapkan dalam berbagai macam cara untuk
menampung kebutuhan pemakai sistem secara lebih proposional. Dalam suatu kasus,
misalkan saja pemakai tertentu perlu menggabungkan data dari sebuah sistem
pengumpulan data yang statis dengan data dari sistem operasional yang dinamis
hanya dengan sebuah query saja.
Berikut ini adalah tiga jenis
dasar sistem Data Warehouse :
1. Functional Data Warehouse (Data Warehouse Fungsional)
Kata
operasional disini merupakan database yang diperoleh dari kegiatan sehari-hari.
Data warehouse dibuat lebih dari satu dan dikelompokkan berdasar fungsi-fungsi
yang ada di dalam perusahaan seperti fungsi keuangan(financial),marketing,personalia
dan lain-lain.
Keuntungan dari bentuk data warehouse seperti ini adalah,
sistem mudah dibangun dengan biaya relatif murah sedangkan kerugiannya adalah
resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan
data bagi pengguna.
Bentuk ini
terlihat seperti bentuk data warehouse fungsional, namun terlebih dahulu sumber
data dikumpulkan dalam satu tempat terpusat, kemudian data disebar ke dalam
fungsinya masing-masing, sesuai kebutuhan persuhaan. Data warehouse terpusat
ini, biasa digunakan oleh perusahaan yang belum memiliki jaringan eksternal.
Keuntungan dari bentuk ini adalah data benar-benar
terpadu karena konsistensinya yang tinggi sedang kerugiannya adalah biaya yang
mahal serta memerlukan waktu yang cukup lama untuk
membangunnya.
3. Distributed Data Warehouse (Data Warehouse terdistribusi)
Pada data
warehouse terdistribusi ini, digunakan gateway yang berfungsi sebagai jembatan
penghubung antara data warehouse dengan workstation yang menggunakan sistem
beraneka ragam. Dengan sistem terdistribusi seperti ini memungkinkan perusahaan
dapat mengakses sumber data yang berada diluar lokasi perusahaan(eksternal). Keuntungannya
adalah data tetap konsisten karena sebelum data digunakan data terlebih dahulu
di sesuaikan atau mengalami proses sinkronisasi. Sedangkan kerugiannya adalah
lebih kompleks untuk diterapkan karena sistem operasi dikelola secara terpisah
juga biaya nya yang paling mahal dibandingkan dengan dua bentuk data warehouse
lainnya.
III.3 Metodologi Perancangan Database untuk Data Warehouse
Menurut
Kimball ada sembilan tahap metodologi dalam perancangan database untuk data
warehouse, yaitu :
Langkah 1 : Pemilihan proses
Langkah 2 : Pemilihan sumber
Langkah 3 : Mengidentifikasi dimensi
Langkah 4 : Pemilihan fakta
Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta
Langkah 6 : Melengkapi tabel dimensi
Langkah 7 : Pemilihan durasi database
Langkah 8 : Menelusuri perubahan dimensi yang perlahan
Langkah 9 : Menentukan prioritas dan mode query
Dengan
langkah-langkah itu, seharusnya kita bisa membangun sebuah data warehouse
yang baik.
VI.Kesimpulan
Data warehouse merupakan suatu cara/metode dari suatu database yang berorientasi kepada subjek, non-volatile, time-variance dan terintegrasi yang digunakan untuk mempermudah para pengambil keputusan dalam memecahkan masalah. Keberadaan data warehouse sangat penting sebagai tools dari DSS, karena data warehouse memang digunakan untuk itu. Dengan adanya data warehouse, diharapkan suatu perusahaan dapat lebih unggul dari kompetitornya dan lebih jeli lagi dalam melihat peluang pasar.
V. DAFTAR PUSTAKA
1. Definisi Data Warehousehttp://www.google.co.id/url?sa=t&rct=j&q=data%20warehouse&source=web&cd=5&cad=rja&ved=0CDoQFjAE&url=http%3A%2F%2Fzakki.dosen.narotama.ac.id%2Ffiles%2F2012%2F02%2FDefinisi-Data-Warehouse.doc&ei=gayGUKjkAYLJrAer74GIDg&usg=AFQjCNGO91hKU1gt5NZ_z_5VgpNIHNYLmQ
2. Konsep Data Ware Housing
http://www.google.co.id/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CB8QFjAA&url=http%3A%2F%2Ffairuzelsaid.files.wordpress.com%2F2009%2F10%2Fdata-mining-bab-02.pdf&ei=GMmGUNn-N5CyrAeu1oGQBw&usg=AFQjCNHO8asPPAXOBzVK7mpDS9angi_xGA
Tidak ada komentar:
Posting Komentar