Pengantar Data Warehouse:
• Pengertian Data, Informasi dan Database
• Proses Data mining
• Data minning & Business Intelegent
• Manfaat Data minning
• Aplikasi Data Mining
Dokumen tersebut membahas tentang pengantar data mining, mengapa diperlukan data mining, apa itu data mining, jenis data yang dapat dimining, fungsi dan klasifikasi sistem data mining, algoritma populer data mining, permasalahan dalam data mining.
Dokumen tersebut membahas tentang pengantar data mining, mengapa diperlukan data mining, apa itu data mining, jenis data yang dapat dimining, fungsi dan klasifikasi sistem data mining, algoritma populer data mining, permasalahan dalam data mining.
Data mining melibatkan ekstraksi pola dan informasi penting dari basis data besar untuk menemukan pengetahuan tersembunyi. Hal ini dilakukan dengan memanfaatkan teknik-teknik dari berbagai disiplin ilmu seperti statistik, pembelajaran mesin, pengenalan pola dan algoritma untuk menganalisis data besar yang kompleks dari berbagai sumber. Contoh aplikasi data mining adalah memprediksi perilaku pelanggan bank untuk mengidentifikasi pelanggan pot
Pengantar Big Data dan Data Mining.pptxRudiCelebes2
Ìý
Dokumen tersebut membahas tentang Data Science dan Data Mining. Materi kuliah mencakup konsep Data Science, Data Analytics, proses preprocessing data, teknik-teknik mining seperti asosiasi, klasifikasi dan clustering, serta aplikasi Data Mining di berbagai bidang."
Dokumen tersebut membahas tentang pengantar konsep data mining mulai dari sejarah, definisi, jenis operasi, dan jenis data yang dapat dimining. Dibahas pula perkembangan konsep database, big data, dan data warehouse sebagai sumber data untuk proses data mining."
Dokumen tersebut membahas tentang pengantar data analitik yang mencakup konsep data besar (big data), sumber data, karakteristik volume, kecepatan, keragaman dan ketepatan data besar, ekosistem data besar, jenis-jenis analisis data besar beserta contoh penerapannya, serta profesi terkait data analitik.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
Dokumen tersebut membahas tentang sistem manajemen pendukung keputusan yang mencakup konsep data warehouse, data mart, OLAP, dan data mining. Data warehouse digunakan untuk menyimpan dan mengintegrasikan data historis dari berbagai sumber untuk analisis manajemen. Data mart merupakan subset dari data warehouse yang difokuskan pada kebutuhan departemen tertentu. OLAP digunakan untuk manipulasi dan analisis data multidimensi besar-besaran. Sedangkan data mining digunakan
Pengantar Big Data dan Data Mining.pptxRudiCelebes2
Ìý
Dokumen tersebut membahas tentang Data Science dan Data Mining. Materi kuliah mencakup konsep Data Science, Data Analytics, proses preprocessing data, teknik-teknik mining seperti asosiasi, klasifikasi dan clustering, serta aplikasi Data Mining di berbagai bidang."
Dokumen tersebut membahas tentang pengantar konsep data mining mulai dari sejarah, definisi, jenis operasi, dan jenis data yang dapat dimining. Dibahas pula perkembangan konsep database, big data, dan data warehouse sebagai sumber data untuk proses data mining."
Dokumen tersebut membahas tentang pengantar data analitik yang mencakup konsep data besar (big data), sumber data, karakteristik volume, kecepatan, keragaman dan ketepatan data besar, ekosistem data besar, jenis-jenis analisis data besar beserta contoh penerapannya, serta profesi terkait data analitik.
Dokumen tersebut membahas arsitektur dan model data mining. Terdapat penjelasan mengenai komponen-komponen arsitektur data mining seperti data cleaning, data integration, data mining engine, dan graphical user interface. Juga dibahas model-model data mining seperti prediction methods dan description methods beserta contoh-contohnya seperti klasifikasi, regresi, dan clustering.
Dokumen tersebut membahas tentang sistem manajemen pendukung keputusan yang mencakup konsep data warehouse, data mart, OLAP, dan data mining. Data warehouse digunakan untuk menyimpan dan mengintegrasikan data historis dari berbagai sumber untuk analisis manajemen. Data mart merupakan subset dari data warehouse yang difokuskan pada kebutuhan departemen tertentu. OLAP digunakan untuk manipulasi dan analisis data multidimensi besar-besaran. Sedangkan data mining digunakan
2. Problem ledakan data
Tool koleksi data otomatis dan perkembangan teknologi
database menyebabkan banyak sekali data yang bisa
dikumpulkan didalam database, data warehouse, dan alat
penyimpanan informasi lainnya, untuk dianalisis
Kita punya banyak data tapi tidak tahu pengetahuan
yang tersimpan di dalamnya!
3. Solusi: Penggudangan data dan penambangan data (Data
warehousing and data mining)
Data warehousing dan on-line analytical processing
(OLAP)
Penyaringan pengetahuan yang menarik (kaidah, keberaturan,
pola, kendala) dari data dalam database yang besar
4. Evolusi atau Perkembangan Teknologi
Database
1960an Koleksi data, pembuatan data, IMS dan network
DBMS
1970an Model data relasional dan implementasi DBMS
relasional
1980an RDBMS, model data lanjut (extended- relational, OO,
deduktif, dsb.) DBMS berorientasi aplikasi(spasial, saintifik,
teknik, dsb.)
1990an - 2000an Data mining dan data warehousing,
database multimedia, teknologi Web
5. Perolehan pengetahuan dari data
“Ekstraksi informasi atau pola yang menarik (tidak
sepele, implisit, tak diketahui sebelumnya, mungkin
bermanfaat) dari data didalam database yang besar"
Penyelidikan: analisa data semi-otomatis atas
sekumpulan data yang besar
DATA MINING
6. DATA MINING
Istilah yang agak baku:
Data mining
Biasanya DM adalah salah satu proses KDD
Knowledge discovery in databases (KDD)
Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing
Istilah yang jarang digunakan:
Ekstraksi pengetahuan, analisa data/pola
Publisitas terbaru:
Kecerdasan bisnis (business intelligence), manajemen pengetahuan
(knowledge management)
7. Ketersediaan data dalam jumlah yang sangat besar:
Tool koleksi data otomatis dan perkembangan teknologi database
menyebabkan banyak sekali data yang bisa dikumpulkan di dalam
database, data warehouse, dan alat peyimpanan informasi lainnya
Pemeriksaan data manual adalah membosankan dan terkadang tidak
masuk akal
MENGAPA DATA MINING?
8. Database
Marketing
Data
Warehousing
KDD &
Data Mining
Meningkatkan pengetahuan agar bisa
membuat keputusan berdasarkan:
Misal, pengaruh pada marketing
Peran dan pengaruh DM yang
bertumbuh pesat dan masih bertumbuh!
Tetapi DM tidaklah sekedar marketing...
marketing
MANFAAT DATA MINING?
9. Analisis database dan dukungan keputusan:
Analisis dan manajemen pasar
Target pasar, manajemen relasi customer (CRM), analisis
keranjang belanja, penjualan silang, segmentasi pasar
Analisis dan manajemen resiko
Peramalan, tindakan mempertahankan customer,
peningkatan asuransi, kontrol kualitas, analisis kompetitif
Potensi Aplikasi
10. • Dari mana data berasal?
Transaksi kartu kredit, loyalty cards, kupon discount, keluhan customer,
kajian lifestyle publik
• Target Pasar
Mendapatkan kelompok model customer yang berbagi karakteristik
yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb.
Menentukan pola pembelian customer berdasarkan waktu
• Analisis lintas pasar
Asosiasi/korelasi antara penjualan produk & taksiran berdasarkan asosiasi
demikian
Analisis dan Manajemen Pasar
11. • Profil customer
Tipe customer apa membeli produk apa (pengelompokan atau
klasifikasi)
• Analisa kebutuhan customer
Mengenali produk terbaik untuk customer berbeda
Meramalkan faktor apa yang akan memikat customer baru
• Penyediaan rangkuman informasi
Rangkuman laporan multidimensi
Rangkuman informasi statistik (kecenderungan data terpusat dan variasi)
Analisis dan Manajemen Pasar
12. • Perencanaan keuangan dan evaluasi aset
–Analisis dan peramalan cash flow
–Analisis ganti rugi yang mungkin untuk
mengevaluasi aset
–Analisis cross-sectional dan time series (financial- ratio,
analisa trend, dsb.)
• Perencanaan sumberdaya
Merangkum dan membandingkan sumberdaya dan pengeluaran
Analisis dan Manajemen Resiko Perusahaan
13. Analisis dan Manajemen Resiko Perusahaan
• Kompetisi
– Memantau pesaing dan arah pasar
– Mengelompokkan customer kedalam kelas dan prosedur
harga berbasis kelas
– Menetapkan strategi harga dalam suatu pasar dengan
kompetitif tinggi
14. Anda seorang petugas asuransi dan anda harus
mendefinisikan suatu pembayaran bulanan yang
pantas untuk seorang pemuda berusia 18 tahun
yang membeli sebuah Ferrari … apa yang anda
akan lakukan?
CONTOH CASE DATA MINING?
15. CONTOH CASE DATA MINING?
• Kaji seluruh data customer dan data kompensasi pembayaran
sebelumnya
• Kaji peluang penyebab kecelakaan paling banyak berdasarkan
dugaan…
– Jenis Kelamin pengendara (pria/wanita) dan usia
– Model dan usia mobil, tempat tinggal
– dsb.
• Jika peluang kecelakaan lebih besar dari rata-rata, aturlah
pembayaran bulanan yang sesuai!
18. 1. Skalabilitas, penyimpanan dari data biasanya memakan kapasitas yang besar, singkatnya
semakin banyak data yang disimpan maka akan semakin besar juga kapasitas yang
diperlukan.
2. Ketidaktersedianya data atau akses terhadap data yang sulit, anggap saja kalian mau
mencari suatu data rahasia yang hanya dipegang oleh agen-agen CIA atau bahkan MI6
seperti yang ada di film James Bond, tentu sulit bukan?
3. Kualitas data yang kurang baik, apabila kalian disuruh untuk melakukan "Mining" terhadap
suatu hal dan harus disediakan dalam bentuk video 4K HD atau 720p, namun sayangnya
data yang kalian dapat merupakan video yang kualitas nya seperti gambar pada perang
dunia ke 2.
4. Biaya yang mahal sampai ke perawatannya, bayangkan kalian disuruh mencari data dan
harus menyimpannya tetapi data tersebut memiliki ukuran sampai 100 Terabyte! Tentu nya
dibutuhkan Hard disk yang kapasitas penyimpanan nya sangat besar.5. Data yang heterogen
& kompleks, contoh kumpulan hal web yg terdiri atas teks yg semi terstruktur dan banyak
terdapat link.
MASALAH UMUM DATA MINING?
20. Peningkatan potensi
untuk mendukung
keputusan bisnis End User
Business
Analyst
Data
Analyst
DBA
Pembuatan
keputusan
Penyajian Data
Teknik Visualisasi
Data Mining
Penemuan informasi
Eksplorasi data
Analisa statistik, query, dan pelaporan
Data Warehouses / Data Marts
OLAP, MDA
Sumber data
Kertas, Files, Penyedia informasi, Sistem database, OLTP
PROSES DATA MINING - DSS
21. Data
• Data customer
• Simpanan data
• Data grafis
• Data geografis
Informasi
• X tinggal di Z
• S berumur Y tahun
• X dan S pindah
• W punya uang di Z
Keputusan
• Promosikan produk A di Z.
• Kirim iklan ke keluarga dengan
profil P
• Jual silang layanan B ke klien
C
Pengetahuan
• Sebanyak Y produk A
digunakan
di Z
• Customer dari kelas Y
menggunakan
x% dari C selama periode D
VALUE CHAIN