Minggu, 08 September 2013

DATA WAREHOUSE

    PENGENALAN DATA WAREHOUSE (Pertemuan 1)


NIM      : 10410100104


Sejarah Data warehouse

Awal mula data warehouse berangkat dari tahun 80 an, dimana peneliti IBM Barry Devlin and Paul Murphy mengembangkan "business data warehouse". Pada dasarnya bertujuan untuk menyediakan model arsitektur untuk perubahan data dari sistem operasional menuju sistem DSS. Beberapa hal penting berkisar sejarah data warehouse adalah :

1960s - General Mills dan Dartmouth College, mengembangkan istilah dimensions and facts.
1970s - ACNielsen dan IRI menyediakan imensional data marts untuk penjualan retail
1983s - Teradatamemperkenalkan sistem database yang khusus untuk DSS
1988s - Barry Devlin dan Paul Murphy mempublikasikan artikel An architecture for a business and information systems in yang memperkenalkan istilah "business data warehouse".
1990s - Red Brick Systems memperkenalkan Red Brick Warehouse, sistem manajemen database khusus untuk data warehousing.
1991s - Bill Inmon mempublikasikan buku Building the Data Warehouse.
1995s - The Data Warehousing Institute, organisasi profit yang mempromosikan data warehouse didirikan 1996 - Ralph Kimball mempublikasikan buku The Data Warehouse Toolkit.
2000s - Daniel Linstedt mempublikasikan the Data Vault, yang memungkinkan audit data warehose.

Seiring dengan semakin meningkatnya kompetisi bisnis, tiap organisasi harus dapat melakukan tindakan bisnis yang tepat. Di masa yang lampau keputusan bisnis didasarkan pada intuisi pihak manajemen. Saat ini dibutuhkan informasi yang menunjang, tepat, cepat dan efisien dalam pengambilan keputusan. Informasi yang dibutuhkan berupa informasi yang telah tersumarisasi (summarized), dan terspesialisasi (spesialized) hasil dari analisa data operasional organisasi.
Informasi yang dibutuhkan dapat hadir dalam bentuk laporan khusus, dan forecasting (peramalan) berdasarkan trend. Informasi dihasilkan oleh Business Intelligence atau sistem informasi eksekutif (Executive Support System) yang mendapatkan data dari data warehouse.

Kenapa Membangun Data Warehouse?

DW yang dikombinasikan dengan BI (Business Intelligence) dapat digunakan untuk mendapatkan informasi :

-          Lebih memahami apa yang terjadi pada bisnis
-          Menentukan trend historis
-          Prediksi kesempatan di masa datang
-          Mengukur performance










Manfaat Data Warehouse

Berdasarkan pada penjelasan-penjelasan tersebut di atas, dapat disebutkan bahwa penggunaan data warehouse akan memberikan berbagai manfaat, diantaranya :

·         Walaupun mahal dalam pembuatannya, namun untuk kebutuhan pelaporan dan analisis dapat lebih menghemat biaya dan waktu.
·         Dikarenakan terlebih dahulu mengisi data ke data warehouse, ketidak konsistenan yang ada dapat diketahui dan diatasi sehingga akan mempermudah pelaporan dan analisis.
·         Data yang ada di dalam data warehouse dapat digunakan untuk sistem pendukung keputusan.
·         Data yang ada di dalam data warehouse akan tetap ada walaupun data di sistem operasional telah berubah atau dihapus
·         Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
·         Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
·   Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.

·         Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.


Nilai Data Warehouse

Data warehouse digunakan untuk sistem BI (Business Intelligence) yang memiliki nilai untuk :

1.      Tracking and trending key performance indicators
2.      Measuring business performance
3.      Reporting and understanding financial results
4.      Understanding customers and their behavior
5.      Identifying high-value customers
6.      Better selection or development of new products
7.      Understanding which products should be scaled back or eliminated
8.      Understanding business competitors

Data warehouse pertama kali diperkenalkan oleh W.H.Inmon, sehingga W.H.Inmon sering disebut Bapak Data Warehouse. Definisi data warehouse sebagai berikut:
Ø  Menurut W.H. Inmon dan Richard D.H., data warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap dari kumpulan data dalam mendukung proses pengambilan keputusan manajemen.
Ø  Menurut Vidette Poe, data warehouse merupakan database yang bersifat analisis dan read only yang digunakan sebagai fondasi dari sistem penunjang keputusan.
Ø  Menurut Paul Lane, data warehouse merupakan database relasional yang didesain lebih kepada query dan analisis daripada proses transaksi, biasanya mengandung history data dari proses transaksi dan bisa juga data dari sumber lainnya.

Nah…dari ketiga definisi tersebut, dapat saya peroleh kesimpulan bahwa data warehouse adalah sebuah “database” yang berukuran besar yang menyimpan data dari berbagai sumber yang kemudian diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. Hal ini bertujuan untuk menghasilkan informasi yang akurat dari waktu ke waktu, berguna untuk pengambilan keputusan, analisis penjualan, analisis pasar, dan sebagainya.



Ø  Karakteristik Data Warehouse

1. Subject Oriented (Berorientasi subject)

Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan(customers,products dan sales) dan tidak  diorganisasikan pada area-area aplikasi utama(customer invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data.
Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses. Secara garis besar perbedaan antara data operasional dan data warehouse yaitu :



2. Integrated (Terintegrasi)

Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.

3. Time-variant (Rentang Waktu)

Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse, kita dapat menggunakan cara antara lain :
Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.

4. Non-Volatile

Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu  ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

Berbeda dengan database operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data).


v Berikut ini adalah istilah-istilah yang akan kita sering jumpai dalam membahas tentang data warehouse:

1.  OLAP (Online Analytical Processing)
OLAP adalah suatu pemrosesan data warehouse yang menggunakan fact table dan dimension table untuk dapat menampilkan berbagai bentuk laporan, analisis, dan query.

2. OLTP (Online Transaction Processing)
OLTP adalah suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi dalam perusahaan sehari-hari.

3. Fact Table
Fact table (tabel fakta) adalah tabel yang umumnya mengandung sesuatu yang dapat diukur (measure), seperti harga, jumlah barang, dan sebagainya. Fact table juga merupakan kumpulan foreign key dari primary key yang terdapat pada masing-masing dimension table. Fact table juga mengandung data yang historis.

4. Dimension Table
Dimension table (tabel dimensi) adalah tabel yang berisi data detail yang menjelaskan foreign key yang terdapat pada fact table. Atribut-atribut yang terdapat pada dimension table dibuat secara berjenjang (hirarki) untuk memudahkan proses query.

§  Pemanfaatan data warehouse menggunakan data mining, OLAP (online Analytical processing), DSS Namun, metode untuk mendapatkan, dan menganalisa data berupa proses extract, transform dan load data, serta manajemen data dictionary masih termasuk pokok bahasan utama sebagai komponen sistem data warehouse. Definisi lanjutan dari data warehousing termasuk business intelligence tools, tools untuk extract, transform dan load data ke repository, dan tools untuk manajemen metadata.



Ø SUMBER REFERENSI :

[1] Inmon, W.H. (2002). Building the Data Warehouse third edition. Toronto : John Wiley & Sons.
[2] Imhoff, Claudia., Galemmmo, Nicholas. and Geiger, Jonathan G. (2003). Mastering Data Warehouse Design Relational and Dimensional Techniques. Indianapolis : Wiley Publishing
[3] Power, Daniel. (2005). Data-driven DSS: What do I need to know about Data Warehousing/OLAP? [Online]. Tersedia: http://dssresources.com/faq/index.php?action=artikel&cat=5&id=47&artlang=en [17 Oktober 2009]
[4] http://chrezsoft.blogspot.com/2012/10/pengenalan-data-warehouse.html
[5] http://erick1719.wordpress.com/2010/08/21/pengertian-data-warehouse/
[6] http://risyana.wordpress.com/2009/11/17/pengantar-data-warehouse/


Tidak ada komentar:

Posting Komentar