Pengenalan Data Warehouse 2
Nama Mata Kuliah : Data Warehouse
Nama Dosen : I Putu Agus Eka Pratama
Prodi : Teknologi Informasi
Fakultas : Teknik
Universitas Udayana
1. Data Warehouse Menurut Para Ahli
Terdapat 2 ahli yang mengungkapkan tentang data warehouse. Berikut ahli-ahli yang mengemukakan pendapatnya tentang data warehouse.
· Menurut Bill Immon, data warehouse memiliki 6 sifat utama. Yaitu Subject Oriented (berorientasi pada subyek atau data), Integrated (terintegrasi pada data apapun), Process Oriented (berorientasi pada proses), Time Variant (memiliki varian waktu proses yang beragam), Accessible (dapat diakses dengan mudah), dan Non Volatile (data yang disimpan bersifat tetap).
· Menurut Ralph Kimball, data warehouse mengumpulkan data dari sumber-sumber transaksional (OLTP atau On Line Transactional Processing. Artinya adalah data bersifat transaksional dan diproses secara transaksional) untuk kebutuhan query dan analisa data. Data analisa dapat disebut sebagai OLAP (On Line Analytical Processing). Proses OLAP akan menggunakan query dan analisa yang memperhatikan historis data.
Sebagai contoh mengenai OLTP dan OLAP. Sebuah database biasa, setiap entri data pada tabel di dalam Database akan dilakukan penumpukan data (timpa) apabila terjadi edit/update Pada Data Warehouse, entry data ke n apabila dilakukan pengeditan/perubahan, akan disimpan sebagai entry ke n+1 dengan disertai catatan waktu, proses, dan subyeknya. Pada dasarnya di database biasa, proses edit/update akan menghilangkan data lama dan mengganti dengan data baru. Sedangkan di data warehouse, proses edit/update akan menambahkan data baru di bawahnya disertai catatan bahwa data baru yang dimaksud adalah data perubahan dari ID sekian.
2. Arsitektur Data Warehousse
Gambar 1. Arsitektur Dasar Data Warehouse
Arsitektur dasar dari data warehouse diperkenalkan oleh Oracle. Oracle membagi arsitektur dasar data warehouse menjadi 3 bagian. Berikut merupakan penjelasan dari ketiga arsitektur dasar tersebut
a. Data Source.
Data source atau sumber data berasal dari transaksional sistem, file, berkas, dokumen yang didigitalkan, flat file, dll. Data source akan disimpan di suatu tempat bernama summary data.
b. Warehouse
Warehouse (gudang data) akan memuat tiga jenis data, yaitu metadata, summary data, dan raw data. Di warehouse akan memproses data yang bersifat OLTP menjadi OLAP
c. User
User nanti akan mengolah data yang ada di warehouse. Terdapat 3 jenis user, yaitu Analyst (menganalisa data), Mining (memperoleh knowledge dari data sesuai pola), dan Reporting (menyampaikan laporan berdasarkan hasil analisa dan mining).
Secara sederhana, arsitektur data warehouse akan terlihat seperti pada gambar 1. Tetapi bilaman ada suatu kondisi yang memungkinkan, arsitektur data warehouse akan berubah. Berikut merupakan 2 perubahan arsitektur data warehouse bedasarkan kondisi yang ada.
a. Staging Area Architecture
Gambar 2. Konsep Staging Area Architecture
Konsep dasar dari Staging Area Architecture adalah menambahkan Staging Area untuk menampung data – data dari sumber data transaksional, sebelum diteruskan ke warehouse. Di staging area, data akan dirapikan, dibersihkan, dan disesuaikan dengan kebutuhan. Konsep ini juga diperkenalkan oleh Oracle.
b. Staging Area + Data Mart Architecture
Gambar 3. Konsep Staging Area + Data Mart Architecture
Konsep dasar dari Staging Area + Data Mart Architecture adalah penambahan Data Mart untuk dikombinasikan dengan Staging Area. Data mart adalah bagian kecil dari Data Warehouse untuk tujuan khusus. Contoh data mart adalah data yang ada hubungannya dengan marketing akan digunakan sebagai analisa oleh marketing analysis.
Arsitektur ini juga diperkenalkan oleh Oracle dan merupakan arsitektur yang paling banyak digunakan. Beberapa alasannya adalah sebagai berikut.
· Kemampuan untuk memilah data sesuai kebutuhan. Jadi konsumsi CPU dan RAM pada user tidak berat,
· Kemampuan kostumisasi sesuai kebutuhan. Jadi konsumsi memori (HDD atau SSD) pada user tidak besar.
Singkatnya alur arsitektur ini adalah data source akan dipilah dan dikumpulkan menjadi 1 ke dalam staging area. Lalu dikumpulkan ke dalam warehouse. Data pada warehouse akan diklasifikasi kembali sesuai dengan kebutuhan dari user. Misalnya ada klasifikasi data marketing, inventory, dan sales yang akan digunakan oleh ketiga user (analyst, marketing, report) di masing-masing bidang. Maka dari itu kenapa arsitektur ini terbilang paling banyak yang digunakan.
3. Sumber Data Pada Data Warehouse
Sumber data pada Data Warehouse dibedakan menjadi 2. Berikut merupakan sumber data pada Data Warehouse.
a. Sumber Internal
Sumber data internal merupakan sumber data yang berasal dari data sistem transaksional, file scan, dokumen office, file teks, flat file, dan lain lain yang berada di lingkup jaringan internal (intranet) perusahaan.
b. Sumber Eksternal
Sumber data eksternal merupakan sumber data yang berasal dari komputer/server yang terhubung melalui jaringan publik (internet) untuk kemudian digudangkan ke dalam sistem Data Warehouse di jaringan lokal (intranet) perusahaan. Pada beberapa kasus, sumber data eksternal dikombinasikan dengan teknologi cloud computing.
Sumber Referensi Dan Gambar
https://www.dosenpendidikan.co.id/data-warehouse-adalah/
I Putu Agus Eka Pratama. Handbook Data Warehouse. Penerbit Informatika. Bandung. 2017
Komentar
Posting Komentar