Data Multi Dimensi & Model Pengembangan Data Warehouse

 

Nama Mata Kuliah      : Data Warehouse

Nama Dosen               : I Putu Agus Eka Pratama

Prodi                           : Teknologi Informasi

Fakultas                      : Teknik

Universitas Udayana

 

Data Multi Dimensi

Terdapat perbedaan mendasar antara data yang tersimpan pada database biasa dengan data yang tersimpan pada Data Warehouse. Hal ini disebabkan karena data – data pada Data Warehouse selain bertujuan untuk historis, juga digunakan untuk analisa. Solusinya bagaimana? Data harus dilihat dari dimensi yang berbeda-beda

 



Gambar 1. Gambaran Data Multi Dimensi

 

Apa itu data multi dimensi?

Data multi dimensi (Multi Dimensional Data atau MDD) merupakan model data fisik (Physical data Model) yang strukturnya dapat dilihat dari berbagai sudut pandang (dimensi), dengan tiga buah bagian (Record atau baris, Field atau kolom, dan layer), dengan objek – objek data multi dimensi di dalamnya, yang atributnya dibedakan menjadi atribut dimensi dan atribut pengukuran. Data multi dimensi, jika direpresentasikan ke dalam bentuk koordinat, maka dapat ditunjukkan ke dalam tiga buah sumbu : X, Y, dan Z seperti yang terlihat pada gambar 1.

 

Sebagai contoh dimensi yang digunakan untuk melihat data member pada perpustakaan adalah dimensi peminjaman, dimensi pengembalian, dan dimensi denda. Ketiga dimensi ini akan membentuk tabel peminjaman, tabel pengembalian, dan tabel denda yang ketiga tabel tersebut terdapat field yang berisikan nama member dari perpustakaan tersebut. Dari ketiga dimensi inilah dapat digunakan untuk melihat daftar member perpustakaan. Data multi dimensi tidak dapat lepas dari kebutuhan untuk mempermudah analisa data.

 

 

OLTP dan OLAP

Di artikel sebelumnya telah dijelaskan mengenai OLTP dan OLAP. Singkatnya OLTP (On Line Transactional Data) merupakan data yang bersifat transaksional dan OLAP (On Line Analytical Data) merupakan data yang terbentuk dari OLTP dan bersifat historis. Terdapat beberapa perbedaan mengenai data OLTP dan data OLAP. Berikut merupakan perbedaan dari OLTP dan OLAP

 

Tabel 1. Perbedaan OLTP dan OLAP

OLTP

OLAP

Tidak ada data historis, hanya ada data transaksional

Berasal dari data transaksi (OLTP) dengan mengutamakan historis data

Data hanya dilihat terstruktur dalam 2 dimensi (baris, kolom)

Data perlu dilihat dari 3 atau lebih dimensi, untuk kemudahan analisa data.

 

Tabel 1 menjelaskan perbedaan OLTP dan OLAP. Slicing data atau pemotongan data berlapis – lapis, diasumsikan untuk mengambil data yang relevan untuk kebutuhan analisa.

 

Model Pengembangan Data Warehouse

 

1.                       Top Down



Pada pemodelan jenis ini dikarenakan tidak melibatkan User Feedback, maka aliran data sangat sederhana. Yaitu berawal dari sumber – sumber data (Data Sources), lalu diteruskan ke Data Warehouse, terakhir diteruskan (dipecah) ke dalam beberapa buah Data Mart. Model ini fokus kepada kemampuan untuk menjadikan pengguna dapat memperoleh data sesuai kebutuhan melalui Data Mart (yang dialirkan dari Data Warehouse), tanpa melakukan pengubahan apapun pada Data Warehouse itu sendiri. Penambahan data pada Data Mart, hanya dapat dilakukan melalui Data Warehouse, dengan mengikuti aliran Extraction, Transformation, Transportation (ETT). Jika terdapat user feedback, User Feedback pada Data Mart menjadi tolok ukur di dalam pengembangan berkelanjutan pada Data Mart dan Data Warehouse itu sendiri. User Feedback mempengaruhi Data Mart dan secara otomatis akan mempengaruhi Data Warehouse itu sendiri. Terdapat aliran bolak – balik dari User Feedback (pengguna) ke Data Mart dan dari Data Mart ke Data Warehouse. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali

 

2.                       Bottom Up



Model ini merupakan kebalikan dari top down. Sesuai dengan namanya, pengembangan dimulai dari bawah, di mana dua buah Data Mart atau lebih dibentuk dari data yang berasal dari berbagai sumber data (Data Sources). Terdapat 2 tahap dalam pengembangan bottom up. Berikut merupakan penjelasan dari 2 tahap pengembangan bottom up.

·                         Tahap 1 : ETT (Extraction, Transformation, Transportation) padai sumber – sumber data ke masing – masing Data Mart. Setiap Data Mart mengintegrasikan data – data dari berbagai sumber tersebut.

·                         Tahap 2 : data dialirkan dari masing – masing Data Mart ke Data Warehouse, dengan kembali menggunakan proses ETT (Extraction, Transformation, Transportation) → data dari setiap Data Mart kembali diintegrasikan di dalam Data Warehouse → dilakukan juga penghilangan Redudancy pada data – data dari sejumlah Data Mart tersebut.

Jika terdapat user feedback, User Feedback diarahkan melalui tatap muka Data Warehouse, yang berefek terhadap Data Mart – Data Mart yang membentuk Data Warehouse. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali

 

3.                       Paralel Tanpa User Feedback



Model pengembangan paralel merupakan modifikasi dari model top down, namun Data Mart tidak sepenuhnya bergantung kepada Data Warehouse (dalam hal sumber data yang diperoleh). Berikut merupakan langkah-langkah dalam pengembangan paralel.

·                         Langkah 1 : bangun Data Warehouse dari berbagai sumber data → Di dalam Data Warehouse terdapat Data Model yang menjadi acuan bagi model data untuk Data Mart – Data Mart yang dibentuk kemudian → Data Model ikut mempengaruhi Data Mart.

·                         Langkah 2 : Data Mart yang terbentuk, ikut berperan di dalam membangun Data Warehouse melalui integrasi di level data.

Jika terdapat user feedback, user feedback dialirkan melalui tatap muka ke Data Mart. User Feedback bersifat opsional, boleh ada atau tidak ada sama sekali

 

Referensi 

I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017

 

Komentar