Data Multi Dimensi & Model Pengembangan Data Warehouse
Nama Mata Kuliah : Data Warehouse
Nama Dosen : I Putu Agus Eka Pratama
Prodi : Teknologi Informasi
Fakultas : Teknik
Universitas Udayana
Data Multi Dimensi
Terdapat perbedaan mendasar antara data yang tersimpan pada database biasa dengan data yang tersimpan pada Data Warehouse. Hal ini disebabkan karena data – data pada Data Warehouse selain bertujuan untuk historis, juga digunakan untuk analisa. Solusinya bagaimana? Data harus dilihat dari dimensi yang berbeda-beda
Gambar 1. Gambaran Data Multi Dimensi
Apa itu data multi dimensi?
Data multi dimensi (Multi Dimensional Data atau MDD) merupakan model data fisik (Physical data Model) yang strukturnya dapat dilihat dari berbagai sudut pandang (dimensi), dengan tiga buah bagian (Record atau baris, Field atau kolom, dan layer), dengan objek – objek data multi dimensi di dalamnya, yang atributnya dibedakan menjadi atribut dimensi dan atribut pengukuran. Data multi dimensi, jika direpresentasikan ke dalam bentuk koordinat, maka dapat ditunjukkan ke dalam tiga buah sumbu : X, Y, dan Z seperti yang terlihat pada gambar 1.
Sebagai contoh dimensi yang digunakan untuk melihat data member pada perpustakaan adalah dimensi peminjaman, dimensi pengembalian, dan dimensi denda. Ketiga dimensi ini akan membentuk tabel peminjaman, tabel pengembalian, dan tabel denda yang ketiga tabel tersebut terdapat field yang berisikan nama member dari perpustakaan tersebut. Dari ketiga dimensi inilah dapat digunakan untuk melihat daftar member perpustakaan. Data multi dimensi tidak dapat lepas dari kebutuhan untuk mempermudah analisa data.
OLTP dan OLAP
Di artikel sebelumnya telah dijelaskan mengenai OLTP dan OLAP. Singkatnya OLTP (On Line Transactional Data) merupakan data yang bersifat transaksional dan OLAP (On Line Analytical Data) merupakan data yang terbentuk dari OLTP dan bersifat historis. Terdapat beberapa perbedaan mengenai data OLTP dan data OLAP. Berikut merupakan perbedaan dari OLTP dan OLAP
Tabel 1. Perbedaan OLTP dan OLAP
|
OLTP |
OLAP |
|
Tidak ada data historis, hanya ada data transaksional |
Berasal dari data transaksi (OLTP) dengan mengutamakan historis data |
|
Data hanya dilihat terstruktur dalam 2 dimensi (baris, kolom) |
Data perlu dilihat dari 3 atau lebih dimensi, untuk kemudahan analisa data. |
Tabel 1 menjelaskan perbedaan OLTP dan OLAP. Slicing data atau pemotongan data berlapis – lapis, diasumsikan untuk mengambil data yang relevan untuk kebutuhan analisa.
Model Pengembangan Data Warehouse
1. Top Down
Pada pemodelan jenis ini dikarenakan tidak melibatkan User Feedback, maka aliran data sangat sederhana. Yaitu berawal dari sumber – sumber data (Data Sources), lalu diteruskan ke Data Warehouse, terakhir diteruskan (dipecah) ke dalam beberapa buah Data Mart. Model ini fokus kepada kemampuan untuk menjadikan pengguna dapat memperoleh data sesuai kebutuhan melalui Data Mart (yang dialirkan dari Data Warehouse), tanpa melakukan pengubahan apapun pada Data Warehouse itu sendiri. Penambahan data pada Data Mart, hanya dapat dilakukan melalui Data Warehouse, dengan mengikuti aliran Extraction, Transformation, Transportation (ETT). Jika terdapat user feedback, User Feedback pada Data Mart menjadi tolok ukur di dalam pengembangan berkelanjutan pada Data Mart dan Data Warehouse itu sendiri. User Feedback mempengaruhi Data Mart dan secara otomatis akan mempengaruhi Data Warehouse itu sendiri. Terdapat aliran bolak – balik dari User Feedback (pengguna) ke Data Mart dan dari Data Mart ke Data Warehouse. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali
2. Bottom Up
Model ini merupakan kebalikan dari top down. Sesuai dengan namanya, pengembangan dimulai dari bawah, di mana dua buah Data Mart atau lebih dibentuk dari data yang berasal dari berbagai sumber data (Data Sources). Terdapat 2 tahap dalam pengembangan bottom up. Berikut merupakan penjelasan dari 2 tahap pengembangan bottom up.
· Tahap 1 : ETT (Extraction, Transformation, Transportation) padai sumber – sumber data ke masing – masing Data Mart. Setiap Data Mart mengintegrasikan data – data dari berbagai sumber tersebut.
· Tahap 2 : data dialirkan dari masing – masing Data Mart ke Data Warehouse, dengan kembali menggunakan proses ETT (Extraction, Transformation, Transportation) → data dari setiap Data Mart kembali diintegrasikan di dalam Data Warehouse → dilakukan juga penghilangan Redudancy pada data – data dari sejumlah Data Mart tersebut.
Jika terdapat user feedback, User Feedback diarahkan melalui tatap muka Data Warehouse, yang berefek terhadap Data Mart – Data Mart yang membentuk Data Warehouse. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali
3. Paralel Tanpa User Feedback
Model pengembangan paralel merupakan modifikasi dari model top down, namun Data Mart tidak sepenuhnya bergantung kepada Data Warehouse (dalam hal sumber data yang diperoleh). Berikut merupakan langkah-langkah dalam pengembangan paralel.
· Langkah 1 : bangun Data Warehouse dari berbagai sumber data → Di dalam Data Warehouse terdapat Data Model yang menjadi acuan bagi model data untuk Data Mart – Data Mart yang dibentuk kemudian → Data Model ikut mempengaruhi Data Mart.
· Langkah 2 : Data Mart yang terbentuk, ikut berperan di dalam membangun Data Warehouse melalui integrasi di level data.
Jika terdapat user feedback, user feedback dialirkan melalui tatap muka ke Data Mart. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali
Referensi
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017




Komentar
Posting Komentar