Dokumen tersebut membahas tentang pemodelan data untuk data warehouse, dimulai dengan penjelasan skema bintang dan skema salju sebagai model tabel utama untuk data warehouse, diikuti contoh penerapannya untuk menjawab pertanyaan analisis multi-dimensi mengenai penjualan dan laba per bulan, produk, tipe pelanggan, dan lokasi. Selanjutnya dibahas proses ekstraksi, transformasi, dan muat data ke dalam tabel-tabel fakta dan dimensi data warehouse.
Data Multi Dimensi:
Pengertian Data Multidimensi
Fitur Multidimensi Cube
Online Analitycal Processing (OLAP)
Karakteristik OLAP
Pemodelan Data Multidimensi
Dokumen tersebut membahas tentang pengertian basis data, tujuan basis data, komponen sistem basis data, dan bahasa-bahasa yang digunakan dalam basis data. Basis data adalah kumpulan data yang tersusun secara terorganisir untuk memudahkan pengambilan dan manipulasi data.
Dokumen tersebut membahas konsep dasar sistem basis data meliputi pengertian database, sistem database, komponen dasar sistem database, jenis data dalam database dan hubungannya, keuntungan dan kerugian pemakaian sistem database, istilah-istilah yang dipergunakan dalam sistem basis data, serta aplikasi sistem basis data dalam lifecycle pengembangan sistem.
Pemodelaan Data Multi Dimensi:
Model Pemprosesan Data dari Cube
Multidimensional online analitycal processing (MOLAP)
Relational online analitycal processing (ROLAP)
Hibrid online analitycal processing (HOLAP)
power point ini mengenai distribusi frekuensi dan aplikasinya pada data penelitian, dimana terdapat defenisi nya, kelebihan dan kekurangannya, hal-hal yang harus diperhatikan dalam membuat distribusi frekuensi, istilah-istilahnya, cara penyusunannya,dan beberapa catatan mengenai distribusi frekuensi,macam-macamnya serta grafiknya dan ada juga model-model populasi
Dokumen tersebut membahas tentang manajemen sumber daya informasi, yang mencakup konsep IRM, komponen dasar penerapan IRM, model IRM yang efektif, dan manfaat penggunaan IRM. Dokumen juga membahas tentang pengelolaan sistem informasi dan cara mengurangi dampak negatif sistem informasi.
Dokumen tersebut membahas pendekatan sistem dalam pemecahan masalah. Pendekatan sistem terdiri dari tiga tahap yaitu upaya persiapan, pendefinisian masalah, dan pemecahan masalah. Langkah-langkah pendekatan sistem memberikan kerangka untuk mengelompokkan berbagai keputusan yang dapat dibuat dalam pemecahan masalah tunggal.
Dokumen tersebut membahas tentang ukuran pemusatan data dan distribusi frekuensi. Secara singkat, dibahas mengenai mean, median, modus sebagai ukuran pemusatan data dan cara menghitung nilai-nilai tersebut baik untuk data tunggal maupun berkelompok.
Menampilkan Perilaku Etis Dan Tanggung Jawab SosialNinnasi Muttaqiin
油
Dokumen tersebut membahas tentang etika dan tanggung jawab sosial perusahaan. Secara garis besar, dokumen tersebut menjelaskan bahwa etika bisnis mencakup standar perilaku yang diterima masyarakat sebagai benar atau salah, serta tanggung jawab sosial perusahaan yang meliputi tanggung jawab terhadap pelanggan, investor, karyawan, dan lingkungan hidup. Dokumen tersebut juga memberikan contoh perusahaan-perusaha
Proses ETL (ekstraksi, transformasi, dan pengumpulan data) merupakan proses penting dalam membangun gudang data. Proses ini melibatkan ekstraksi data dari berbagai sumber, transformasi data untuk meningkatkan kualitas dan konsistensi, serta pengumpulan data ke dalam gudang data. Tantangan utama dalam ETL adalah heterogenitas sumber data dan memperbaiki kualitas data selama proses transformasi.
赫掘鰻-舘鐚-珂鴛晦晦掘鰻鰻鴛粥晦-2.0鐚-永艶姻恢艶糸温温稼-悪温姻温一岳艶姻-糸温稼-永艶姻庄鉛温一顎稼霞温.沿糸韓Hasanuddin Ali
油
Studi Alvara kali ini bertujuan untuk
mendapatkan gambaran yang utuh tentang ketiga
generasi yang saat ini ada di Indonesia. Benang
merah ini sangat penting karena studi terkait hal
ini masih minim di Indonesia. Sebagai Negara
dengan jumlah penduduk 276 juta jiwa, dan
dihuni oleh mayoritas generasi muda, tentunya
studi ini diharapkan bisa memberikan informasi yang akurat dan utuh bagaimana potret antar
generasi di Indonesia saat ini. Agar siapapun yang
berkepentingan bisa memiliki peta jalan yang
terang, agar tidak salah dalam mengambil langkah
dalam mengambil kebijakan, khususnya terkait
generasi muda Indonesia, apalagi Gen Z
merupakan rising star unik yang mulai berkiprah
dan mulai mewarnai diberbagai bidang.
Dokumen tersebut membahas tentang pengantar konsep dasar basis data. Ia menjelaskan tentang perbedaan pengelolaan data tradisional dengan basis data, komponen-komponen sistem basis data, serta istilah-istilah dasar seperti entitas, atribut, record, file, dan berbagai jenis kunci dalam basis data.
Algoritma C4.5 adalah algoritma klasifikasi data mining yang merupakan pengembangan dari algoritma ID3. C4.5 mampu menangani atribut kosong dengan mengisi nilai berdasarkan nilai dominan, dan memilih atribut akar berdasarkan nilai gain tertinggi yang dihitung menggunakan rumus entropy. Studi kasus mendemonstrasikan pembentukan pohon keputusan C4.5 untuk klasifikasi data.
power point komunikasi antar pribadi dan organisasi komunikasi bisnisputri indriati
油
Dokumen tersebut membahas tentang komunikasi antarpribadi, yang mencakup pengertian, tujuan, gaya kepemimpinan, kebutuhan manusia, dan mendengarkan sebagai keahlian pribadi. Topik-topik utama yang dibahas meliputi proses komunikasi antarpribadi, teori X dan Y tentang motivasi karyawan, empat gaya kepemimpinan, dan pentingnya mendengarkan secara efektif dalam komunikasi.
Pemanfaatan Teknologi Informasi Sistem Pengambilan Keputusan Pada PT. Garuda ...Jenifer Andalangi
油
1. Tugas skripsi membahas pemanfaatan teknologi informasi sistem pengambilan keputusan pada PT Garuda Indonesia.
2. Sistem Informasi Manajemen sangat dibutuhkan untuk mendukung pengambilan keputusan manajer dalam menyelesaikan masalah organisasi.
3. Teknologi informasi memungkinkan manajer membuat keputusan bijak dengan mempertimbangkan alternatif solusi dan dampaknya.
Dokumen tersebut membahas tentang ukuran pemusatan data, yaitu mean, median, dan modus. Mean adalah rata-rata aritmatika dari sekelompok data, median adalah nilai tengah data yang telah diurutkan, dan modus adalah nilai yang paling sering muncul dari data. Dokumen ini menjelaskan rumus dan contoh perhitungan ketiga ukuran pemusatan data tersebut.
Model data warehouse yang digunakan adalah skema bintang (star schema) dengan satu tabel fakta penjualan dan empat tabel dimensi untuk waktu, produk, pelanggan, dan lokasi. Tabel-tabel tersebut digunakan untuk menganalisis penjualan dan laba berdasarkan dimensi waktu, produk, tipe pelanggan, dan lokasi pengiriman."
power point ini mengenai distribusi frekuensi dan aplikasinya pada data penelitian, dimana terdapat defenisi nya, kelebihan dan kekurangannya, hal-hal yang harus diperhatikan dalam membuat distribusi frekuensi, istilah-istilahnya, cara penyusunannya,dan beberapa catatan mengenai distribusi frekuensi,macam-macamnya serta grafiknya dan ada juga model-model populasi
Dokumen tersebut membahas tentang manajemen sumber daya informasi, yang mencakup konsep IRM, komponen dasar penerapan IRM, model IRM yang efektif, dan manfaat penggunaan IRM. Dokumen juga membahas tentang pengelolaan sistem informasi dan cara mengurangi dampak negatif sistem informasi.
Dokumen tersebut membahas pendekatan sistem dalam pemecahan masalah. Pendekatan sistem terdiri dari tiga tahap yaitu upaya persiapan, pendefinisian masalah, dan pemecahan masalah. Langkah-langkah pendekatan sistem memberikan kerangka untuk mengelompokkan berbagai keputusan yang dapat dibuat dalam pemecahan masalah tunggal.
Dokumen tersebut membahas tentang ukuran pemusatan data dan distribusi frekuensi. Secara singkat, dibahas mengenai mean, median, modus sebagai ukuran pemusatan data dan cara menghitung nilai-nilai tersebut baik untuk data tunggal maupun berkelompok.
Menampilkan Perilaku Etis Dan Tanggung Jawab SosialNinnasi Muttaqiin
油
Dokumen tersebut membahas tentang etika dan tanggung jawab sosial perusahaan. Secara garis besar, dokumen tersebut menjelaskan bahwa etika bisnis mencakup standar perilaku yang diterima masyarakat sebagai benar atau salah, serta tanggung jawab sosial perusahaan yang meliputi tanggung jawab terhadap pelanggan, investor, karyawan, dan lingkungan hidup. Dokumen tersebut juga memberikan contoh perusahaan-perusaha
Proses ETL (ekstraksi, transformasi, dan pengumpulan data) merupakan proses penting dalam membangun gudang data. Proses ini melibatkan ekstraksi data dari berbagai sumber, transformasi data untuk meningkatkan kualitas dan konsistensi, serta pengumpulan data ke dalam gudang data. Tantangan utama dalam ETL adalah heterogenitas sumber data dan memperbaiki kualitas data selama proses transformasi.
赫掘鰻-舘鐚-珂鴛晦晦掘鰻鰻鴛粥晦-2.0鐚-永艶姻恢艶糸温温稼-悪温姻温一岳艶姻-糸温稼-永艶姻庄鉛温一顎稼霞温.沿糸韓Hasanuddin Ali
油
Studi Alvara kali ini bertujuan untuk
mendapatkan gambaran yang utuh tentang ketiga
generasi yang saat ini ada di Indonesia. Benang
merah ini sangat penting karena studi terkait hal
ini masih minim di Indonesia. Sebagai Negara
dengan jumlah penduduk 276 juta jiwa, dan
dihuni oleh mayoritas generasi muda, tentunya
studi ini diharapkan bisa memberikan informasi yang akurat dan utuh bagaimana potret antar
generasi di Indonesia saat ini. Agar siapapun yang
berkepentingan bisa memiliki peta jalan yang
terang, agar tidak salah dalam mengambil langkah
dalam mengambil kebijakan, khususnya terkait
generasi muda Indonesia, apalagi Gen Z
merupakan rising star unik yang mulai berkiprah
dan mulai mewarnai diberbagai bidang.
Dokumen tersebut membahas tentang pengantar konsep dasar basis data. Ia menjelaskan tentang perbedaan pengelolaan data tradisional dengan basis data, komponen-komponen sistem basis data, serta istilah-istilah dasar seperti entitas, atribut, record, file, dan berbagai jenis kunci dalam basis data.
Algoritma C4.5 adalah algoritma klasifikasi data mining yang merupakan pengembangan dari algoritma ID3. C4.5 mampu menangani atribut kosong dengan mengisi nilai berdasarkan nilai dominan, dan memilih atribut akar berdasarkan nilai gain tertinggi yang dihitung menggunakan rumus entropy. Studi kasus mendemonstrasikan pembentukan pohon keputusan C4.5 untuk klasifikasi data.
power point komunikasi antar pribadi dan organisasi komunikasi bisnisputri indriati
油
Dokumen tersebut membahas tentang komunikasi antarpribadi, yang mencakup pengertian, tujuan, gaya kepemimpinan, kebutuhan manusia, dan mendengarkan sebagai keahlian pribadi. Topik-topik utama yang dibahas meliputi proses komunikasi antarpribadi, teori X dan Y tentang motivasi karyawan, empat gaya kepemimpinan, dan pentingnya mendengarkan secara efektif dalam komunikasi.
Pemanfaatan Teknologi Informasi Sistem Pengambilan Keputusan Pada PT. Garuda ...Jenifer Andalangi
油
1. Tugas skripsi membahas pemanfaatan teknologi informasi sistem pengambilan keputusan pada PT Garuda Indonesia.
2. Sistem Informasi Manajemen sangat dibutuhkan untuk mendukung pengambilan keputusan manajer dalam menyelesaikan masalah organisasi.
3. Teknologi informasi memungkinkan manajer membuat keputusan bijak dengan mempertimbangkan alternatif solusi dan dampaknya.
Dokumen tersebut membahas tentang ukuran pemusatan data, yaitu mean, median, dan modus. Mean adalah rata-rata aritmatika dari sekelompok data, median adalah nilai tengah data yang telah diurutkan, dan modus adalah nilai yang paling sering muncul dari data. Dokumen ini menjelaskan rumus dan contoh perhitungan ketiga ukuran pemusatan data tersebut.
Model data warehouse yang digunakan adalah skema bintang (star schema) dengan satu tabel fakta penjualan dan empat tabel dimensi untuk waktu, produk, pelanggan, dan lokasi. Tabel-tabel tersebut digunakan untuk menganalisis penjualan dan laba berdasarkan dimensi waktu, produk, tipe pelanggan, dan lokasi pengiriman."
Dokumen ini membahas desain data warehouse yang didasarkan pada model multidimensi dengan menggunakan tabel fakta dan tabel dimensi. Ada beberapa pendekatan dalam membuat data warehouse seperti star schema, snowflake schema, dan fact constellation. Star schema dijelaskan sebagai skema yang memiliki satu tabel fakta di tengah dan beberapa tabel dimensi yang berhubungan langsung dengannya seperti bentuk bintang.
Data warehouse akan dibangun untuk toko buku universitas yang memiliki cabang di lima kampus untuk mendukung proses bisnis pengadaan dan penjualan buku pelajaran kepada mahasiswa berdasarkan jadwal mata kuliah yang diajarkan. Data dari berbagai sumber seperti departemen akademik dan penerbit akan digabungkan untuk memfasilitasi proses bisnis.
Dokumen tersebut membahas tentang Data Warehouse dan OLAP sebagai elemen penting dalam mendukung pengambilan keputusan. Data Warehouse digunakan untuk menyimpan dan mengintegrasikan data dari berbagai sumber agar dapat dilakukan analisis cepat untuk pengambilan keputusan bisnis, sedangkan OLAP berfungsi untuk mengubah data menjadi struktur multidimensi yang memudahkan analisis.
Dokumen tersebut membahas tentang Data Warehouse dan OLAP yang merupakan elemen penting dalam mendukung pengambilan keputusan. Data Warehouse digunakan untuk menyimpan dan mengintegrasikan data dari berbagai sumber agar mudah diakses dan dianalisis guna pengambilan keputusan bisnis, sedangkan OLAP berfungsi untuk mengubah data menjadi struktur multidimensi yang memudahkan analisis.
Dokumen ini membahas tentang skema dimensional untuk data warehouse, termasuk star schema, snowflake schema, dan starflake schema. Star schema terdiri dari satu tabel fakta dan beberapa tabel dimensi. Snowflake schema memperluas star schema dengan menormalisasi tabel dimensi menjadi hirarki. Starflake schema merupakan gabungan dari skema bintang dan skema salju.
Dokumen tersebut merangkum konsep-konsep penting dalam data warehouse seperti data mart, arsitektur data mart, karakteristik data mart, keuntungan dan kerugian menggunakan data mart, OLTP, proses ETL, OLAP, tabel dimensi, fact table, DSS, star schema, dan snowflake schema.
Skema snowflake merupakan variasi dari skema bintang dimana tabel dimensi dibagi menjadi tabel-tabel yang lebih kecil dan ternormalisasi. Skema ini memberikan fleksibilitas dan mudah dirawat, namun membuat query menjadi lebih sulit karena melibatkan lebih banyak tabel. Skema snowflake dan skema bintang sama-sama merupakan model data dimensional untuk data warehouse, tetapi skema bintang lebih sederhana dan efisien untuk query.
Dokumen tersebut membahas konsep dasar sistem manajemen basis data, termasuk hierarki data, struktur basis data, teknik pemodelan data seperti diagram relasi entitas dan diagram kelas, serta peranan penting administrator basis data.
Dokumen tersebut membahas tentang desain data warehouse yang didasarkan pada model multidimensional dengan menggunakan tabel fakta dan tabel dimensi. Ada beberapa pendekatan dalam membuat data warehouse yaitu star schema, snowflake schema, dan fact constellation. Snowflake schema merupakan perluasan dari star schema dimana tabel dimensi dapat dihubungkan ke tabel dimensi lain.
Sistem manajemen basis data mengorganisasikan data perusahaan dalam jumlah besar untuk mendukung transaksi sehari-hari. Data diorganisasikan ke dalam tabel yang saling berhubungan untuk mengurangi pengulangan data dan meningkatkan konsistensi. Personel kunci termasuk administrator basis data yang bertanggung jawab atas sumber daya basis data.
Topik 11 Employee Engagement dan Analitik SentimenSeta Wicaksana
油
Di era digital, keterlibatan karyawan (Employee Engagement) menjadi faktor kunci dalam menentukan produktivitas, inovasi, dan retensi tenaga kerja dalam suatu organisasi. Karyawan yang terlibat secara emosional dengan pekerjaannya cenderung lebih produktif, loyal, dan memiliki kontribusi lebih besar terhadap keberhasilan bisnis.
Namun, tantangan utama yang dihadapi organisasi adalah bagaimana mengukur engagement karyawan secara objektif dan real-time. Pendekatan tradisional seperti survei tahunan sering kali tidak memberikan gambaran yang akurat tentang perasaan dan pengalaman kerja karyawan sehari-hari.
HR Analytics telah membawa perubahan besar dengan menghadirkan Analitik Sentimen (Sentiment Analysis) yang memungkinkan organisasi untuk menganalisis data keterlibatan karyawan secara lebih mendalam, berbasis data, dan real-time. Dengan memanfaatkan teknologi seperti Artificial Intelligence (AI), Machine Learning (ML), dan Natural Language Processing (NLP), organisasi kini dapat:
Mengukur tingkat kepuasan dan emosi karyawan berdasarkan data komunikasi digital dan feedback.
Memprediksi kemungkinan disengagement dan turnover karyawan menggunakan predictive analytics.
Menyesuaikan strategi keterlibatan karyawan dengan program yang lebih personal dan berbasis data.
Dengan pendekatan berbasis HR Analytics dan Analitik Sentimen, perusahaan dapat mengoptimalkan pengalaman kerja karyawan, meningkatkan retensi tenaga kerja, serta membangun lingkungan kerja yang lebih sehat dan produktif.
4. TABEL RELATIONAL
Tabel Relasional dibangun oleh baris dan kolom
Terdapat dua sudut pandang, yaitu:
Baris sebagai sumbu x dan kolom sebagi sumbu y,
tapi sebenarnya tabel relasional tersebut hanya
mempunyai satu dimensi.
5. Karakteristik:
Setiap record atau baris merepresentasikan data buku
yang berbeda-beda.
Satu baris dengan baris lainnya diidentifikasikan
dengan sebuah key yaitu primary key.
Sedangkan bagian kolom seperti, judul, jenis buku,
pengarang menyimpan fakta yang sama atau sejenis,
dimana setiap fakta tersebut merujuk pada primary
key yaitu Kode Buku.
Hal inilah yang menunjukkan bahwa tabel relasional
hanya mempunyai satu dimensi.
6. DATA MULTIDIMENSI
Data multidimensi adalah ketika kita
dapat melihat sebuah data dari berbagai
sudut pandang atau dimensi.
Sebagai contoh, penjualan buku dapat
dilihat dari segi Buku, waktu, lokasi
penjualan / toko dan sebagainya.
Jika digambarkan , maka akan
terdapat tiga koordinat yaitu sumbu x
mewakili buku, sumbu y mewakili dimensi
waktu dan sumbu z untuk dimensi lokasi.
Hal inilah yang menjadi perbedaan
mendasar antara tabel relasional dan
data multidimensi.
7. PEMODELAN DATA
MULTIDIMENSI
What is Dimensional Modeling ? ..
Menggunakan dua konsep yaitu tabel fakta (fact
table) dan tabel dimensi (dimensional table)
Berbeda dengan konsep normalisasi normal
form)
8. TABEL FAKTA ?
Tabel Fakta berisi measurement atau metric dari
proses bisnis dan foreign key dari tabel dimensi.
Tabel fakta merupakan tabel utama dari cube.
Karakteristik dari tabel fakta :
kumpulan key dimensi dari tabel
ada measure(yang ingin diukur)
data akan selalu berubah
Misal :
Jika anda mempunyai bisnis penjualan sepeda
motor maka measurement dari bisnis anda
adalah jumlah penjualan motor atau rata-rata
penjualan sepeda motor merk x.
9. TABEL DIMENSI?
Tabel Dimensi berisi atribut dari measurement yang
disimpan pada tabel fakta.
Tabel dimensi merupakan hierarki, kategori dan logic
yang dapat digunakan untuk menganalisa
measurement dari sudut pandang tertentu.
Tabel dimensi bersifat statis(tidak berubah).
15. Sebagai contoh Automaker Sales, terdapat tiga tipe entity, yaitu:
1. Measurement atau metric
2. Business dimension
3. Atribut untuk masing-masing business dimension
26. TIGA KOMPONEN UTAMA
ARSITEKTUR DW
Populasi Warehouse
Downloading vs Volume Data
Administrasi Warehouse
Perawatan Metadata
Mesin Pendukung Keputusan
Query dan Pelaporan
27. HAL YANG PERLU DIPERHATIKAN
DALAM ARSITEKTUR DW
Cost Effective
Adaptable
Easily Implemented
28. HAL YANG PERLU
DIPERTIMBANGKAN DALAM
MEMILIH MEDIA & METODE
PENYIMPANAN
Data load times
Synchronization Recovery Summarization levels
Method of data implementation
Security Data distribution
Data access and query speed
Ease of maintenance
29. AKSES INFORMASI
Komponen kunci:
Memberikan akses pada orang yang tepat untuk
informasi yang tepat pada waktu yang tepat.
Memudahkan pengambilan informasi secara
cepat dan mudah.
30. TUJUAN UTAMA ARSITEKTUR
DW
Mendefinisikan suatu struktur yang membantu
customer membuat implementasi data warehouse
yang efektif, yaitu implementasi yang memberikan
kemudahan akses data pada pengguna dan aplikasi.
Arsitektur mengidentifikasi dan mendefinisikan
komponen-komponen, antar muka, dan protokol-
protokol.
31. MASALAH AKSES DATA/
INFORMASI
Data yang banyak dan tersebar.
Kebutuhan sistem analisis yang cepat dan mudah
dalam mengakses data.
Mempertahankan investasi organisasi terhadap
sistem informasi yang telah ada.
32. PERMASALAHAN CUSTOMER YANG
DISELESAIKAN DENGAN ARSITEKTUR
DW
No single view of data
Different user tools
Lack of consistency
Lack of useful historical capability
Conflict between application type
Problems in administering data
Proliferation of complex extract application
33. KONFIGURASI DATA
Single copy configuration
Reconciled data configuration
Derived data configuration
Hybrid data configuration
34. KOMPONEN-KOMPONEN
KUNCI ARSITEKTURAL DW
Model data yang mendefinisikan isi warehouse.
Desain database warehouse, apakah hirarsikal,
relasional, atau multidimensional.
Utilitas untuk data scrubbing, copy management,
data transport, data replication, cross platform
communication.
Optimasi warehouse server untuk pelaporan dan
pemrosesan query yang cepat.
DSS untuk pelaporan dan analisis.
35. BAGIAN DARI MODEL
ARSITEKTURAL DW
Operational database/external database layer
(Lapisan database Operational)
Information access layer (Lapisan Akses Informasi)
Data access layer (Lapisan Akses Data)
Data directory (metadata) layer
Process management layer
Application messaging layer
Data warehouse layer
Data staging layer
36. PILIHAN PEMINDAHAN KE
DATA
WAREHOUSING
1. Rehosting mainframe applications
2. Two tier architecture using mainframe as a
server
3. Three tier data warehouse architecture
4. Four tier data warehouse architecture
37. DEFINISI ISTILAH DI
PENDUKUNG KEPUTUSAN
Facts
variabel-variabel atau pengukuran yang biasanya
disimpan dalam bentuk numerik yang
merupakan fokus dari investigasi pendukung
keputusan.
Metrics
Analisis pengukuran yang dikalkulasi dari fakta
secara langsung.
Dimensions
Pengelompokkan secara logika dari atribut-
atribut yang memiliki relasi kunci terkecil yang
39. DUA TIPE TABEL UTAMA
YANG ADA DALAM DATA
WAREHOUSE
Fact Tables
Dimensions Tables
40. CONCEPTUAL MODELING OF
DATA WAREHOUSES
Modeling data warehouses: dimensions &
Measures:
Star schema: A fact table in the middle
connected to a set of dimension tables.
Snowflake schema: A refinement of star schema
where some dimensional hierarchy is
normalized into a set of smaller dimension
tables, forming a shape similar to snowflake.
Fact constellations: Multiple fact tables share
dimension tables, viewed as a collection of
stars, therefore called galaxy schema or fact
constellation.
41. Skema Star
KOMPONEN MODEL TABLE
1) Sebuah fact table yang besar dan tersentralisasi.
2) Satu tabel untuk setiap dimensi.
3) Setiap fact points untuk satu tuple dalam setiap
dimensinya dan memiliki atribut tambahan.
4) Mudah dimengerti dan mengurangi jumlah dari
physical joins.
5) Mudah untuk mendefinisikan hirarkinya.
42. SKEMA STAR (BINTANG)
Skema tabel yang sering digunakan adalah skema
bintang (star schema), yang digunakan pada OLAP.
Skema tabel ini membentuk struktur informasi
multidimensi yang kompatibel dengan kebutuhan bisnis.
48. KARAKTERISTIK STAR SCHEMA
Pusat dari star (skema bintang) adalah fact table
(berisi indikator indikator kinerja pokok).
Tabel di sekeliling fact table adalah dimension
table.
Setiap tabel dimensi berelasi langsung dengan fact
table berdasarkan primary key-nya. Primary key
pada tabel dimensi akan menjadi key pada fact
table.
Relasi antara fact table dengan dimensi-
dimensinya adalah 1-N (one to many).
Skema bintang diimplementasikan menggunakan
teknologi relational database.
50. SKEMA SNOWFLAKE
1) Merupakan variant dari model skema star.
2) Sebuah fact tables yang besar dan tersentralisasi
serta satu atau lebih tabel untuk setiap dimensi.
3) Tabel dimensi dinormalisasi dengan cara men-
split data pada tabel dimensi ke dalam tabel
tambahan.
4) Mudah untuk maintenance dan menghemat
storage.
51. SNOWFLAKE SCHEMA
Model snowflake merupakan perluasan dari star
dimana ia juga mempunyai satu atau lebih
dimensi. Hanya saja pada snowflake, tabel yang
berelasi pada fact table hanya tabel dimensi
utama, sedangkan tabel yanhg lain dihubungkan
pada table dimensi utama.
Model snowflake ini hamper sama seperti Teknik
normalisasi.
52. KEUNTUNGAN & KERUGIAN
SNOWFLAKE
Keuntungan menggunakan model Snowflake:
Pemakain space yang lebih sedikit
Update dan maintenance yang lebih mudah
Kerugian menggunakan model ini yaitu:
Model lebih komplek dan rumit
Proses query lebih lambat
Performance yang kurang bagus
53. CONTOH 1: SKEMA SNOWFLAKE )
p
r
o
d
T
i
m
e
date, custno, prodno, cityname, ...
f
a
c
t
c
u
s
t
r
e
g
i
o
n
c
i
t
y
54. CONTOH 2: SKEMA SNOWFLAKE )
Fact Table Time Dimension
Store Dimension
Store Key
Product Key
Period Key
Units
Price
Period Key
Year
Quarter
Month
Store Key
Store Name
City Key
City Dimension
City Key
City
State
Region
Product Key
Product Desc
Product Dimension
56. SKEMA FACT CONSTELLATION
1) Beberapa fact tables berbagi tabel dimensi.
2) Ditampilkan sebagai koleksi dari kumpulan skema
bintang yang sering disebut sebagai skema galaxy.
3) Dibutuhkan oleh aplikasi yang canggih.
Promotion
Hotels
Booking
Checkout
Travel Agents Room Type
Customer
57. Sales Fact Table
Store Key
Product Key
Period Key
Units
Price
Shipping Fact Table
Product Dimension
Product Key
Product Desc
Shipper Key
Store Key
Product Key
Period Key
Units
Price
Store Dimension
Store Key
Store Name
City
State
Region
CONTOH SKEMA FACT CONSTELLATION
58. DATA CUBE
A data cube, such as sales, allows data to be
modeled and viewed in multiple dimensions.
Suppose ALLELETRONICS create a sales data
warehouse with respect to dimensions:
Time
Item
Location
63. PERSIAPAN
Untuk membuat data model untuk data warehouse
sebaiknya harus diketahui:
Spesifikasi kebutuhan informasi
Data yang tersedia (sumber data) sudah harus tersedia
64. CONTOH
Untuk menjawab :
Berapa besar penjualan dan laba per bulan, per
produk, per tipe pelanggan/pembeli (grosir,
pabrikan, industri rumah, atau exportir), jenis
industri (dari pelanggan/pembeli), dan kemana
barang pesanan dikirim (propinsi atau nama
negara).
Output
Output tersebut biasa disebut analisa multi-
dimensi (multi-dimensional analysis). Besaran
(measure) yang ditanyakan (dianalisa) adalah
penjualan dan laba.
Batasan (dimension) dari besaran tersebut adalah
bulan (period), produk, tipe pelanggan, jenis
67. DATA 3 DIMENSION
3 dimensi dibuat umum (common dimension), dapat
dimanfaatkan untuk analisa lain (mendatang):
1) Waktu: untuk memenuhi spesifikasi perbulan, yang
akan dihubungkan dengan data tanggal pesan. Table
ini akan diisi semua bulan dan sekian tahun (harus
diputuskan berapa tahun, karena tabel ini kecil
volumenya, misalnya diisi untuk 50 tahun pada awal
implementasi data warehouse).
2) Jenis industry: untuk memenuhi spesifikasi jenis
industri, yang akan dihubungkan dengan data industri
pelanggan.
3) Lokasi: untuk memenuhi spesifikasi propinsi/ negara
pemakai, yang akan dihubungkan dengan bagian data
alamat kirim, dengan kata lain didalam proses
memasukkan data dari sumber kedalam warehouse
harus mencari dan menentukan propinsi atau negara
didalam/ dari data alamat kirim.
68. OUTPUT
1) Penjualan diakumulasikan per bulan (monthly
aggregated), juga per dimensi yang lain sesuai
spesifikasi: produk, tipe pelanggan, jenis
industry, dan lokasi kirim. Pajak penjualan dan
Ongkos kirim tidak diperhitungkan.
2) Data hasi perhitungan laba ikut disimpan (pre
calculated), agar query cepat. Formula yang
diberikan oleh user adalah: Laba penjualan =
(Harga satuan (Harga bahan baku + Ongkos
69. 311
312
313
314
315
316
321
322
323
Food Manufacturing
Beverage and Tobacco Product Manufacturing
Textile Mills
Textile Product Mills
Apparel Manufacturing
Leather and Allied Product Manufacturing
Wood Product Manufacturing
Paper Manufacturing
Printing and Related Support Activities
ISI TABEL
Manufacturing
72. Berikut Contoh Isi Tabel Tabel Datawarehouse Dari Model Diatas.
Semua Tabel Dimensi Diisi Data Pada Awal Data Warehouse
Diimplementasikan (Pre-loaded). Sedangkan Untuk Tabel Fakta
(Penjualan; Datanya Berasal Dari Sumber).
Table-table Data
Warehouse
75. Extract
Scrub
Transform
Load
Index
Aggregation
Design
Mapping
Replication
Data Set Distribution
Access & Analysis
Resource Scheduling & Distribution
System Monitoring
Meta Data
Extract//Transform/Load RDBMS Utilities
MOLAP/ROLAP
Replication/Distribution Tools
CASE
EIS
Job Schedulers
DB Design Data Mining
Data Visualization
Metadata Browsers
Database & System Monitors
Repositories
Design/Transform/Extract/Aggregate/Monitor/Manage Suites / Environments
DATA WAREHOUSE TOOLS