Pengertian Data Warehouse
Data warehouse adalah kumpulan data yang berorientasi subjek, terintegrasi, berubah berdasarkan waktu yang dapat digunakan untuk membuat keputusan tergantung dari kebutuhan pengguna.
Konsep dasar dari data warehouse adalah membersihkan, menyaring, mengubah, meringkas, dan mengumpulkan data, dan kemudian meletakkannya ke dalam sebuah struktur agar mudah diakses dan dianalisis oleh pengguna.
Karakteristik Data Warehouse
Karakteristik data warehouse adalah sebagai berikut :
- Subject-oriented
Data warehouse diorganisir sesuai dengan permasalahan atau subjek utama dalam perusahaan, seperti pelanggan, produk, penjualan. Data warehouse tidak hanya berfokus pada proses transaksi dan operasi sehari-hari, tetapi juga berfokus pada pemodelan dan analisis data untuk pembuatan keputusan.
- Integrated
Data warehouse biasanya dibangun dengan menggabungkan banyak data dari sumber yang berbeda, sebagai contoh relational database, flat files, dan online transaction records. Teknik pembersihan dan penggabungan data dipakai untuk menjamin kekonsistenan data dalam hal penamaan, struktur penulisan, atribut, dan lain-lain.
- Time-variant
Data disimpan untuk memberikan informasi dari data yang ada selama beberapa tahun terakhir (misalnya lima sampai sepuluh tahun).
- Nonvolatile
Data warehouse adalah tempat penyimpanan data yang terpisah secara fisik dari data yang ditemukan di aplikasi dalam lingkungan operasional, sehingga data yang terdapat pada data warehousetidak dapat diubah.
Komponen Utama Data Warehouse
Data Warehouse memiliki tiga komponen utama yaitu :
- Data staging area, dalam tahap ini data diolah dari sumbernya. Prosesnya terdiri dari extract, transform, load (ETL).
– Extract, adalah proses pengambilan data yang diperlukan dari sumber data warehouse dan selanjutnya dimasukkan pada staging.
– Transform, proses yang dilakukan untuk menstandardisasikan data pada satu format yang konsisten.
– Load, yaitu proses memindahkan data ke data warehouse.
- Data presentation area, dalam tahap ini data diorganisasikan, disimpan sehingga ketersediaan data dapat terjamin apabila dibutuhkan. Selain itu pada tahap ini dapat dilakukan penulisan laporan untuk kebutuhan analisis.
- Data access tools, dalam tahap ini antarmuka disediakan sehingga dapat melakukan query data.
Pemodelan Data Warehouse
Pemodelan data warehouse dapat dilakukan dengan teknik, yaitu pemodelan Entity Relationship, pemodelan dimensional, dan pemodelan data vault.
Pemodelan dengan Entity Relationshiphanya dapat digunakan untuk menggambarkan hubungan antar data.
Pemodelan dimensional merupakan teknik pemodelan data warehouse yang sering digunakan karena tabel dan relasi dapat mengoptimalkan performansi dalam pengambilan keputusan dalam database relasional. Ada beberapa model skema dimensional, antara lain star schema dan snowflake schema.
Pemodelan data vault merupakan pemodelan yang cocok untuk pemodelan enterprise data warehouse karena data vault bersifat historical.
1. Star Schema
Paradigma pemodelan yang paling umum adalah star schema, yang terdiri dari tabel pusat yang besar (fact table) yang berisi bagian terpenting dari data, dan sekumpulan tabel pembantu (dimension table) yang mana satu untuk setiap dimensi. Grafik dari star schemamenyerupai bintang besar. Tabel dimensi ditampilkan dalam pola lingkaran sekitar pusat fact table.
2. Snowflake Schema
Snowflake schema merupakan pengembangan dari star schema. Perbedaannya terletak pada normalisasi data dan jumlah tabel. Pada snowflake schema tabel dimensi dinormalisasi secara sebagian atau keseluruhan untuk mengurangi nilai duplikat pada tabel.
3. Data Vault Modeling
Data vault modeling adalah pemodelan yang menjelaskan keseluruhan data secara rinci dan menyimpan sejarah perubahan data melalui sekumpulan tabel normal dengan hubungan yang unik yang mendukung satu atau lebih fungsi area bisnis. Ini adalah pendekatan yang meliputi bentuk normal 3 (3NF) dan star schema. Desainnya fleksibel, konsisten dan mudah beradaptasi dengan kebutuhan perusahaan. Data vault adalah model data yang cocok khususnya untuk memenuhi kebutuhan data warehouse perusahaan saat ini.
Sumber :
– Pembangunan Aplikasi Pelaporan dengan Menggunakan Data Vault Modeling pada Data Warehouse AdventureWorks, Humasak Tommy Argo Simanjuntak,S.T.,M.ISD.1, Hendry Martua Simanjuntak2, Elisa Yosephine Simanjuntak3 , Margaretha Suryanti Sirait4
– Ballard Chuck, Dirk Herreman, Don Schau, Rhonda Bell, Eunsaeng Kim, Aan Valencic. Data Modeling Techniques for Data Warehousing, February 1998.
– Han Jiawei dan Micheline Kamber. 2006. Data Mining: Concepts and Techniques, Second Edition. United States of America.
– Linstedt Dan, “Data Vault Basics”, http://danlinstedt.com/about/data-vault-basics/ diakses tanggal 24 November 2011
Komentar
Posting Komentar