際際滷

際際滷Share a Scribd company logo
Data Mining
Week 1: Pengantar Data Mining
MATERI PERKULIAHANMATERI PERKULIAHAN
 INTRODUCTION
 DATA WAREHOUSE
 DATA PREPROCESSING
 FUNGSI MINOR
 FUNGSI DESKRIPSI
 FUNGSI ESTIMASI
 FUNGSI PREDIKSI
 FUNGSI MAYOR
 FUNGSI KLASIFIKASI
 FUNGSI PENGELOMPOKAN
 FUNGSI ASOSIASI
 PENERAPAN DATA MINING DALAM
MATLAB
 INTRODUCTION
 DATA WAREHOUSE
 DATA PREPROCESSING
 FUNGSI MINOR
 FUNGSI DESKRIPSI
 FUNGSI ESTIMASI
 FUNGSI PREDIKSI
 FUNGSI MAYOR
 FUNGSI KLASIFIKASI
 FUNGSI PENGELOMPOKAN
 FUNGSI ASOSIASI
 PENERAPAN DATA MINING DALAM
MATLAB
Pengantar Data Mining
 Mengapa ada data mining?
 Apa itu data mining?
 Data apa saja yang diproses dalam data mining?
 Fungsi data mining
 Model & fungsi dari data mining
 10 algoritma data mining yang paling umum
 Aplikasi data mining
Mengapa Data Mining:
Banjir Data
 Twitter: 8000an tweet per detik  600 juta tweet
per hari.
 Facebook: 30 milyar item (link, status, note, foto dst)
per bulan. 500 juta user menghabiskan 700 milyar
menit per bulan di situs FB.
 Indomaret: 4500an gerai, asumsikan 3 transaksi per
menit = 12 juta transaksi per hari se Indonesia.
 Kartu kredit visa: berlaku di 200 negara. 10 ribu
transaksi per detik  850 juta transaksi per hari.
Mengapa Datamining?
We are drowning in INFORMATION,
but starving in KNOWLEDGE. 
- John Naisbitt -
We are drowning in INFORMATION,
but starving in KNOWLEDGE. 
- John Naisbitt -
Mengapa data mining?
 Digitalisasi, kemajuan sistem informasi 
data, data, data (Tera  Peta)
 Web  berita, blog, twitter, forum, flickr, fb,
youtube
 Streaming data  twitter, sensor (satelit)
DATA
MINING
DATA
MINING
Evolusi DB
 60-an: koleksi data (file system primitif)
 70-80: MIS (Sistem Informasi Management)
 80-sekarang: OO, Spatial, Multimedia
 90-sekarang: Web based (XML, web mining),
Datawarehouse, OLAP, Text Database, Text + Data
mining
 05-sekarang: Stream data management and mining,
Cloud, Web
Apa Data Mining?
 Data mining (pencarian pengetahuan dari
data)
 Mengekstrak secara otomatis pola atau
pengetahuan yang menarik (tidak sederhana,
tersembunyi, tidak diketahui sebelumnya,
berpotensi berguna) dari data dalam jumlah
sangat besar.
Apa Datamining? (lanj)
 Nama alternatif: Knowledge discovery
(mining) in databases (KDD), knowledge
extraction, data/pattern analysis, data
archeology, data dredging, information
harvesting, business intelligence dsb
 Keuntungan bagi organisasi yang menerapkan
data mining?
Keuntungan Datamining
 Perusahaan fokus ke informasi yg berharga di
datawarehouse/databasenya.
 Meramalkan masa depan  perusahaan
dapat mempersiapkan diri
Contoh:
Midwest grocery chain menggunakan DM untuk
menganalisisi pola pembelian: saat pria membeli roti di
hari Kamis dan Sabtu, mereka juga membeli minuman.
Analisis lebih lanjut: pembeli ini belanja di hari kamis
dan sabtu, tapi di hari kamis jumlah item lebih sedikit.
Kesimpulan yang diambil: pembeli membeli minuman
untuk dihabiskan saat weekend.
Tindak lanjut: menjual minuman dengan harga full di
hari Kamis dan Sabtu. Mendekatkan posisi roti dan
minuman.
Lanjutan..
CONTOH KASUS :
Jika Anda mempunyai kartu kredit, sudah pasti Anda
bakal sering menerima surat berisi brosur penawaran
barang atau jasa. Jika Bank pemberi kartu kredit Anda
mempunyai 1.000.000 nasabah, dan mengirimkan
sebuah (hanya satu) penawaran dengan biaya
pengiriman sebesar Rp. 1.000 per buah maka biaya yang
dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut
mengirimkan penawaran sekali sebulan yang berarti 12x
dalam setahun maka anggaran yang dikeluarkan per
tahunnya adalah Rp. 12 Milyar!! Dari dana Rp. 12 Milyar
yang dikeluarkan, berapa persenkah konsumen yang
benar-benar membeli? Mungkin hanya 10 %-nya saja.
Secara harfiah, berarti 90% dari dana tersebut terbuang
sia-sia.
Lanjutan..
 Dari contoh kasus di atas merupakan salah satu
persoalan yang dapat diatasi oleh data mining dari
sekian banyak potensi permasalahan yang ada. Data
mining dapat menambang data transaksi belanja kartu
kredit untuk melihat manakah pembeli-pembeli yang
memang potensial untuk membeli produk tertentu.
Mungkin tidak sampai presisi 10%, tapi bayangkan jika
kita dapat menyaring 20% saja, tentunya 80% dana
dapat digunakan untuk hal lainnya.
28 September 2005 Arsitektur dan Model Data Mining 14
 Proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data dengan tujuan untuk dapat memprediksi
kelas dari suatu objek yang labelnya tidak diketahui
 Contoh : Mendeteksi Penipuan
 Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit.
 Pendekatan :
 Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut account
holder
 Kapan cutomer melakukan pembelian, Dengan cara apa customer
membayar, sebarapa sering customer membayar secara tepat waktu, dll
 Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi yang
curang atau yang baik. Ini sebagai atribut klass ( the class attribute.)
 Pelajari model untuk class transaksi
 Gunakan model ini untuk mendetekdi kecurangan dengan meneliti transaksi
kartu kredit pada account.
Contoh
Contoh Aplikasi
Bank me-mining transaksi customer untuk
mengidentifikasi customer yang kemungkinan
besar tertarik terhadap produk baru.
Setelah teknik ini digunakan, terjadi
peningkatan 20 kali lipat penurunan biaya
dibandingkan dengan cara biasa.
Contoh Aplikasi
Perusahaan transportasi memining data
customer untuk mengelompokkan
customer yang memiliki nilai tinggi yang
perlu diprioritaskan.
Proses Datamining
Pembersihan Data
Data Integration
Databases
Data
Warehouse
Task-relevant Data
Selection
Data Mining
Pattern Evaluation
Diambil dari www.cs.uiuc.edu/~hanj
Data Mining dan Business Intelligence
Semakin mendukung
pengambilan keputusan
End User
Business
Analyst
Data
Analyst
DBA
Pengambil
an
Keputusan
Presentasi Data
Teknik Visualiasi
Data Mining
Penemuan Informasi
Eksplorasi Data
Statistical Summary, Querying, and Reporting
Data Preprocessing/Integrasi, Data Warehouses
Sumber Data
Database, Web, Paper, Files, Web, eksperimen
Diambil dari www.cs.uiuc.edu/~hanj
Data Mining: Multi Disiplin Ilmu
Data Mining
Teknologi DB Statistik
Machine
Learning
Pattern
Recognition
Algoritma
Ilmu Lain
Visualisasi
Mengapa tidak analisis data biasa?
 Jumlah data yang sangat besar
 Algoritma harus scalable untuk menangani data yang
sangat besar (tera)
 Dimensi yang sangat besar: ribuan field
 Data Kompleks
 Aliran data dan sensor
 Data terstruktur, graph, social network, multi-linked data
 Database dari berbagai sumber, database lama
 Spasial (peta), multimedia, text, web
 Software Simulator
Data Mining dari berbagai sudut pandang
 Data
 Relational, data warehouse, web, transactional, stream, OO, spacial, text,
multimedia
 Pengetahuan yang akan ditambang
 Karakterisitik, diskriminasi, asosiasi, klasifikasi, clustering, trend, outlier
 Teknik
 Database, OLAP, machine learning, statistik, visualiasi
 Penerapan
 Retail, telekomunikasi, banking, analisis kejahatan, bio-data mining, saham,
text mining, web mining
Model dalam Data Mining
 Verification Model
 Model ini menggunakan (hypothesis) dari
pengguna, dan melakukan test terhadap perkiraan
yang diambil sebelumnya dengan menggunakan
data-data yang ada.
 Model verifikasi menggunakan pendekatan top
down dengan mengambil hipotesa dari user dan
memeriksa validitasnya dengan data sehingga bisa
dibuktikan kebenaran hipotesa tersebut.
Model dalam Data Mining
 Discovery Model
 Sistem secara langsung menemukan informasi-
informasi penting yang tersembunyi dalam suatu data
yang besar. Data-data yang ada kemudian dipilah-
pilah untuk menemukan suatu pola, trend yang ada,
dan keadaan umum pada saat itu tanpa adanya
campur tangan dan tuntutan dari pengguna.
 Model knowledge discovery menggunakan
pendekatan bottom up untuk mendapatkan informasi
yang sebelumnya tidak diketahui. Model ini terbagi
menjadi dua directed knowledge discovery dan
undirected knowledge discovery.
Model dalam Data Mining
 Discovery Model
 Pada directed knowledge discovery, data mining akan
mencoba mencari penjelasan nilai target field
tertentu (seperti pengahasilan, respons, usia, dan
lain-lain) terhadap field-field yang lain.
 Pada undirected knowledge discovery tidak ada target
field karena komputer akan mecari pola yang ada
pada data. Jadi undirected knowledge discovery
digunakan untuk mengenali hubungan/relasi yang ada
pada data sedangkan directed discovery akan
menjelaskan hubungan/relasi tersebut.
Fungsi dalam Data Mining
 Fungsi atau sub kegiatan yang ada dalam data
mining dalam rangka menemukan, menggali,
atau menambang pengetahuan, mengacu pada
Larose (2005), terdapat enam fungsi dalam data
mining, yaitu:
 Fungsi deskripsi (description)
 Fungsi estimasi (estimation)
 Fungsi prediksi (prediction)
 Fungsi klasifikasi (classification)
 Fungsi pengelompokan (classification),
 Fungsi asosiasi (association).
Fungsi dalam Data Mining
 Mengacu pada Berry dan Browne (2006),
keenam fungsi data mining tersebut dapat
dipilah menjadi:
 Fungsi minor atau fungsi tambahan, yang meliputi
ketiga fungsi pertama, yaitu deskripsi, estimasi,
dan prediksi
 Fungsi mayor atau fungsi utama, yang meliputi
ketiga fuingsi berikutnya, yaitu klasifikasi,
pengelompokkan, dan asosiasi.
Data Mining: Data apa saja?
 Database Tradisional
 Relational database, data warehouse, transactional database
 Advanced Database
 Data streams dan data sensor
 Time-series data, temporal data, sequence data (incl. bio-sequences)
 Structure data, graphs, social networks and multi-linked data
 Object-relational databases
 Heterogeneous databases dan legacy databases
 Spatial data dan spatiotemporal data
 Multimedia database
 Text databases
 World-Wide Web
Top-10 Algorithm di ICDM06
 #1: C4.5 (61 votes)
 #2: K-Means (60 votes)
 #3: SVM (58 votes)
 #4: Apriori (52 votes)
 #5: EM (48 votes)
 #6: PageRank (46 votes)
 #7: AdaBoost (45 votes)
 #7: kNN (45 votes)
 #7: Naive Bayes (45 votes)
 #10: CART (34 votes)
Aplikasi Data Mining
Pemasaran/ Penyewaan
 Identifikasi pola pembayaran pelanggan
 Menemukan asosiasi diantara karakteristik demografik pelanggan
 Analisis keranjang pemasaran
Perbankan
 Mendeteksi pola penyalahgunaan kartu kredit
 Identifikasi pelanggan yang loyal
 Mendeteksi kartu kredit yang dihabiskan oleh kelompok pelanggan
Asuransi & Pelayanan Kesehatan
 Analisis dari klaim
 Memprediksi pelanggan yang akan membeli polis baru
 Identifikasi pola perilaku pelanggan yang berbahaya
Aplikasi Data Mining
 Analisa Perusahaan dan Manajemen Resiko
 Perencanaan Keuangan dan Evaluasi Aset
 Perencanaan Sumber Daya (Resource Planning)
 Persaingan (competition)  Competitive Intelligence
 Telekomunication
 menerapkan data mining untuk melihat dari
jutaan transaksi yang masuk, transaksi mana saja
yang masih harus ditangani secara manual
(dilayani oleh orang).

More Related Content

What's hot (20)

makalah basis data
makalah basis datamakalah basis data
makalah basis data
Tjoetnyak Izzatie
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)
tafrikan
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
DinaNisrinaRosandi
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
I Gede Iwan Sudipa
Sistem informasi dalam organisasi
Sistem informasi dalam organisasiSistem informasi dalam organisasi
Sistem informasi dalam organisasi
yy rahmat
Metodologi Penelitian
Metodologi PenelitianMetodologi Penelitian
Metodologi Penelitian
Nurul Faqih Isro'i
8. Blockchain.ppt
8. Blockchain.ppt8. Blockchain.ppt
8. Blockchain.ppt
reisa dyasvaro zulanda putri
Transmisi asynchronous dan synchronous
Transmisi asynchronous dan synchronousTransmisi asynchronous dan synchronous
Transmisi asynchronous dan synchronous
ridhaprilia
Data mining 1 pengantar
Data mining 1   pengantarData mining 1   pengantar
Data mining 1 pengantar
IrwansyahSaputra1
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
Pertemuan 2.1 perkembangan teknis
Pertemuan 2.1 perkembangan teknisPertemuan 2.1 perkembangan teknis
Pertemuan 2.1 perkembangan teknis
Buhori Muslim
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzy
Zaenal Khayat
15.algoritma kriptografi modern (bagian 4)
15.algoritma kriptografi modern (bagian 4)15.algoritma kriptografi modern (bagian 4)
15.algoritma kriptografi modern (bagian 4)
Universitas Bina Darma Palembang
Presentasi Data warehouse
Presentasi Data warehousePresentasi Data warehouse
Presentasi Data warehouse
Nety Herawati
metode-pengujian-whitebox
metode-pengujian-whiteboxmetode-pengujian-whitebox
metode-pengujian-whitebox
Iwan Kurniarasa
32 metodologi penelitian pada ilmu komputer
32   metodologi penelitian pada ilmu komputer32   metodologi penelitian pada ilmu komputer
32 metodologi penelitian pada ilmu komputer
Muhammad Andrianto
Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03
KuliahKita
Kecerdasan bisnis
Kecerdasan bisnisKecerdasan bisnis
Kecerdasan bisnis
HehePangibulan2
Sistem Basis Data(PPT)
Sistem Basis Data(PPT)Sistem Basis Data(PPT)
Sistem Basis Data(PPT)
tafrikan
Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043Ppt big data dina nisrina rosandi 6018210043
Ppt big data dina nisrina rosandi 6018210043
DinaNisrinaRosandi
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
Permasalahan terstruktur, semi terstruktur dan tidak terstruktur dan penerapa...
I Gede Iwan Sudipa
Sistem informasi dalam organisasi
Sistem informasi dalam organisasiSistem informasi dalam organisasi
Sistem informasi dalam organisasi
yy rahmat
Transmisi asynchronous dan synchronous
Transmisi asynchronous dan synchronousTransmisi asynchronous dan synchronous
Transmisi asynchronous dan synchronous
ridhaprilia
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
Pertemuan 2.1 perkembangan teknis
Pertemuan 2.1 perkembangan teknisPertemuan 2.1 perkembangan teknis
Pertemuan 2.1 perkembangan teknis
Buhori Muslim
Contoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzyContoh peyelesaian logika fuzzy
Contoh peyelesaian logika fuzzy
Zaenal Khayat
Presentasi Data warehouse
Presentasi Data warehousePresentasi Data warehouse
Presentasi Data warehouse
Nety Herawati
metode-pengujian-whitebox
metode-pengujian-whiteboxmetode-pengujian-whitebox
metode-pengujian-whitebox
Iwan Kurniarasa
32 metodologi penelitian pada ilmu komputer
32   metodologi penelitian pada ilmu komputer32   metodologi penelitian pada ilmu komputer
32 metodologi penelitian pada ilmu komputer
Muhammad Andrianto
Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03Matematika Diskrit - 11 kompleksitas algoritma - 03
Matematika Diskrit - 11 kompleksitas algoritma - 03
KuliahKita

Viewers also liked (9)

Fungsi fungsi data mining
Fungsi fungsi data miningFungsi fungsi data mining
Fungsi fungsi data mining
Djair Mesos
32296 23 algoritma tf idf32296 23 algoritma tf idf
32296 23 algoritma tf idf
Universitas Bina Darma Palembang
Text Mining Using JBoss Rules
Text Mining Using JBoss RulesText Mining Using JBoss Rules
Text Mining Using JBoss Rules
Mark Maslyn
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
26813 9 arsitektur data mining
26813 9 arsitektur data mining26813 9 arsitektur data mining
26813 9 arsitektur data mining
Universitas Bina Darma Palembang
Text mining by examples, By Hadi Mohammadzadeh
Text mining by examples, By Hadi MohammadzadehText mining by examples, By Hadi Mohammadzadeh
Text mining by examples, By Hadi Mohammadzadeh
Hadi Mohammadzadeh
basis data lanjut modul
 basis data lanjut modul basis data lanjut modul
basis data lanjut modul
Denny Safardan
Text mining
Text miningText mining
Text mining
ike kurniati
Machine Learning and Data Mining: 19 Mining Text And Web Data
Machine Learning and Data Mining: 19 Mining Text And Web DataMachine Learning and Data Mining: 19 Mining Text And Web Data
Machine Learning and Data Mining: 19 Mining Text And Web Data
Pier Luca Lanzi
Fungsi fungsi data mining
Fungsi fungsi data miningFungsi fungsi data mining
Fungsi fungsi data mining
Djair Mesos
32296 23 algoritma tf idf32296 23 algoritma tf idf
32296 23 algoritma tf idf
Universitas Bina Darma Palembang
Text Mining Using JBoss Rules
Text Mining Using JBoss RulesText Mining Using JBoss Rules
Text Mining Using JBoss Rules
Mark Maslyn
Text mining by examples, By Hadi Mohammadzadeh
Text mining by examples, By Hadi MohammadzadehText mining by examples, By Hadi Mohammadzadeh
Text mining by examples, By Hadi Mohammadzadeh
Hadi Mohammadzadeh
basis data lanjut modul
 basis data lanjut modul basis data lanjut modul
basis data lanjut modul
Denny Safardan
Machine Learning and Data Mining: 19 Mining Text And Web Data
Machine Learning and Data Mining: 19 Mining Text And Web DataMachine Learning and Data Mining: 19 Mining Text And Web Data
Machine Learning and Data Mining: 19 Mining Text And Web Data
Pier Luca Lanzi

Similar to Data mining week 1 - pengantar data mining (20)

DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
Pengantar dan Konsep dalam Data Mining.ppt
Pengantar dan Konsep dalam Data Mining.pptPengantar dan Konsep dalam Data Mining.ppt
Pengantar dan Konsep dalam Data Mining.ppt
joeldoel04
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
Ocha8
data mining untuk algoritma knn dengan studi kasus
data mining untuk algoritma knn dengan studi kasusdata mining untuk algoritma knn dengan studi kasus
data mining untuk algoritma knn dengan studi kasus
MuhammadYunus507217
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
SalimSlw
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
YeshaAgusAriwanta
際際滷 Knowladge Discovery in Database System
際際滷 Knowladge Discovery in Database System際際滷 Knowladge Discovery in Database System
際際滷 Knowladge Discovery in Database System
yusrafadilah1
Pengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.pptPengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.ppt
joeldoel04
pertemuan 1(ELA)rev.ppt
pertemuan 1(ELA)rev.pptpertemuan 1(ELA)rev.ppt
pertemuan 1(ELA)rev.ppt
FIRDIANSYAHADIA
Pertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DWPertemuan 1 Pengantar DW
Pertemuan 1 Pengantar DW
Endang Retnoningsih
Data Mining Intro Universitas Muhammadiyah Jakarta
Data Mining Intro Universitas Muhammadiyah JakartaData Mining Intro Universitas Muhammadiyah Jakarta
Data Mining Intro Universitas Muhammadiyah Jakarta
Nurul Amri
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
Alvian yudha Prawira
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
SuraClips
data-mining- for business intelligent.ppt
data-mining- for business intelligent.pptdata-mining- for business intelligent.ppt
data-mining- for business intelligent.ppt
widyaginting1
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
RidwanTI
Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......
mochammadagri
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.pptChapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
ssusera1b95b
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri946883
Pertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data miningPertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data mining
MatlubulKhairi
Business Intelligence - Overview
Business Intelligence - Overview Business Intelligence - Overview
Business Intelligence - Overview
Beni Krisbiantoro
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
Pengantar dan Konsep dalam Data Mining.ppt
Pengantar dan Konsep dalam Data Mining.pptPengantar dan Konsep dalam Data Mining.ppt
Pengantar dan Konsep dalam Data Mining.ppt
joeldoel04
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
Ocha8
data mining untuk algoritma knn dengan studi kasus
data mining untuk algoritma knn dengan studi kasusdata mining untuk algoritma knn dengan studi kasus
data mining untuk algoritma knn dengan studi kasus
MuhammadYunus507217
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
SalimSlw
Pengantar_Data_Mining.ppt
Pengantar_Data_Mining.pptPengantar_Data_Mining.ppt
Pengantar_Data_Mining.ppt
YeshaAgusAriwanta
際際滷 Knowladge Discovery in Database System
際際滷 Knowladge Discovery in Database System際際滷 Knowladge Discovery in Database System
際際滷 Knowladge Discovery in Database System
yusrafadilah1
Pengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.pptPengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.ppt
joeldoel04
pertemuan 1(ELA)rev.ppt
pertemuan 1(ELA)rev.pptpertemuan 1(ELA)rev.ppt
pertemuan 1(ELA)rev.ppt
FIRDIANSYAHADIA
Data Mining Intro Universitas Muhammadiyah Jakarta
Data Mining Intro Universitas Muhammadiyah JakartaData Mining Intro Universitas Muhammadiyah Jakarta
Data Mining Intro Universitas Muhammadiyah Jakarta
Nurul Amri
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptxHerwanto_Kuliah_Umum_Big_Data_Analysis.pptx
Herwanto_Kuliah_Umum_Big_Data_Analysis.pptx
SuraClips
data-mining- for business intelligent.ppt
data-mining- for business intelligent.pptdata-mining- for business intelligent.ppt
data-mining- for business intelligent.ppt
widyaginting1
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptxKuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
Kuliah_Umum_Big_Data_Analysis_TEKNIK INFORMATIKA.pptx
RidwanTI
Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......
mochammadagri
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.pptChapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
Chapter Ke 11 Kecerdasan Bisnis DW Kelas.ppt
ssusera1b95b
PMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdfPMK 1 PENGANTAR DATA ANALITIK.pdf
PMK 1 PENGANTAR DATA ANALITIK.pdf
Andri946883
Pertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data miningPertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data mining
MatlubulKhairi
Business Intelligence - Overview
Business Intelligence - Overview Business Intelligence - Overview
Business Intelligence - Overview
Beni Krisbiantoro

Data mining week 1 - pengantar data mining

  • 1. Data Mining Week 1: Pengantar Data Mining
  • 2. MATERI PERKULIAHANMATERI PERKULIAHAN INTRODUCTION DATA WAREHOUSE DATA PREPROCESSING FUNGSI MINOR FUNGSI DESKRIPSI FUNGSI ESTIMASI FUNGSI PREDIKSI FUNGSI MAYOR FUNGSI KLASIFIKASI FUNGSI PENGELOMPOKAN FUNGSI ASOSIASI PENERAPAN DATA MINING DALAM MATLAB INTRODUCTION DATA WAREHOUSE DATA PREPROCESSING FUNGSI MINOR FUNGSI DESKRIPSI FUNGSI ESTIMASI FUNGSI PREDIKSI FUNGSI MAYOR FUNGSI KLASIFIKASI FUNGSI PENGELOMPOKAN FUNGSI ASOSIASI PENERAPAN DATA MINING DALAM MATLAB
  • 3. Pengantar Data Mining Mengapa ada data mining? Apa itu data mining? Data apa saja yang diproses dalam data mining? Fungsi data mining Model & fungsi dari data mining 10 algoritma data mining yang paling umum Aplikasi data mining
  • 4. Mengapa Data Mining: Banjir Data Twitter: 8000an tweet per detik 600 juta tweet per hari. Facebook: 30 milyar item (link, status, note, foto dst) per bulan. 500 juta user menghabiskan 700 milyar menit per bulan di situs FB. Indomaret: 4500an gerai, asumsikan 3 transaksi per menit = 12 juta transaksi per hari se Indonesia. Kartu kredit visa: berlaku di 200 negara. 10 ribu transaksi per detik 850 juta transaksi per hari.
  • 5. Mengapa Datamining? We are drowning in INFORMATION, but starving in KNOWLEDGE. - John Naisbitt - We are drowning in INFORMATION, but starving in KNOWLEDGE. - John Naisbitt -
  • 6. Mengapa data mining? Digitalisasi, kemajuan sistem informasi data, data, data (Tera Peta) Web berita, blog, twitter, forum, flickr, fb, youtube Streaming data twitter, sensor (satelit) DATA MINING DATA MINING
  • 7. Evolusi DB 60-an: koleksi data (file system primitif) 70-80: MIS (Sistem Informasi Management) 80-sekarang: OO, Spatial, Multimedia 90-sekarang: Web based (XML, web mining), Datawarehouse, OLAP, Text Database, Text + Data mining 05-sekarang: Stream data management and mining, Cloud, Web
  • 8. Apa Data Mining? Data mining (pencarian pengetahuan dari data) Mengekstrak secara otomatis pola atau pengetahuan yang menarik (tidak sederhana, tersembunyi, tidak diketahui sebelumnya, berpotensi berguna) dari data dalam jumlah sangat besar.
  • 9. Apa Datamining? (lanj) Nama alternatif: Knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, business intelligence dsb Keuntungan bagi organisasi yang menerapkan data mining?
  • 10. Keuntungan Datamining Perusahaan fokus ke informasi yg berharga di datawarehouse/databasenya. Meramalkan masa depan perusahaan dapat mempersiapkan diri
  • 11. Contoh: Midwest grocery chain menggunakan DM untuk menganalisisi pola pembelian: saat pria membeli roti di hari Kamis dan Sabtu, mereka juga membeli minuman. Analisis lebih lanjut: pembeli ini belanja di hari kamis dan sabtu, tapi di hari kamis jumlah item lebih sedikit. Kesimpulan yang diambil: pembeli membeli minuman untuk dihabiskan saat weekend. Tindak lanjut: menjual minuman dengan harga full di hari Kamis dan Sabtu. Mendekatkan posisi roti dan minuman.
  • 12. Lanjutan.. CONTOH KASUS : Jika Anda mempunyai kartu kredit, sudah pasti Anda bakal sering menerima surat berisi brosur penawaran barang atau jasa. Jika Bank pemberi kartu kredit Anda mempunyai 1.000.000 nasabah, dan mengirimkan sebuah (hanya satu) penawaran dengan biaya pengiriman sebesar Rp. 1.000 per buah maka biaya yang dihabiskan adalah Rp. 1 Milyar!! Jika Bank tersebut mengirimkan penawaran sekali sebulan yang berarti 12x dalam setahun maka anggaran yang dikeluarkan per tahunnya adalah Rp. 12 Milyar!! Dari dana Rp. 12 Milyar yang dikeluarkan, berapa persenkah konsumen yang benar-benar membeli? Mungkin hanya 10 %-nya saja. Secara harfiah, berarti 90% dari dana tersebut terbuang sia-sia.
  • 13. Lanjutan.. Dari contoh kasus di atas merupakan salah satu persoalan yang dapat diatasi oleh data mining dari sekian banyak potensi permasalahan yang ada. Data mining dapat menambang data transaksi belanja kartu kredit untuk melihat manakah pembeli-pembeli yang memang potensial untuk membeli produk tertentu. Mungkin tidak sampai presisi 10%, tapi bayangkan jika kita dapat menyaring 20% saja, tentunya 80% dana dapat digunakan untuk hal lainnya.
  • 14. 28 September 2005 Arsitektur dan Model Data Mining 14 Proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data dengan tujuan untuk dapat memprediksi kelas dari suatu objek yang labelnya tidak diketahui Contoh : Mendeteksi Penipuan Tujuan : Memprediksi kasus kecurangan transaksi kartu kredit. Pendekatan : Menggunakan transaksi kartu kredit dan informasi dilihat dari atribut account holder Kapan cutomer melakukan pembelian, Dengan cara apa customer membayar, sebarapa sering customer membayar secara tepat waktu, dll Beri nama/tanda transaksi yang telah dilaksanakan sebagai transaksi yang curang atau yang baik. Ini sebagai atribut klass ( the class attribute.) Pelajari model untuk class transaksi Gunakan model ini untuk mendetekdi kecurangan dengan meneliti transaksi kartu kredit pada account. Contoh
  • 15. Contoh Aplikasi Bank me-mining transaksi customer untuk mengidentifikasi customer yang kemungkinan besar tertarik terhadap produk baru. Setelah teknik ini digunakan, terjadi peningkatan 20 kali lipat penurunan biaya dibandingkan dengan cara biasa.
  • 16. Contoh Aplikasi Perusahaan transportasi memining data customer untuk mengelompokkan customer yang memiliki nilai tinggi yang perlu diprioritaskan.
  • 17. Proses Datamining Pembersihan Data Data Integration Databases Data Warehouse Task-relevant Data Selection Data Mining Pattern Evaluation Diambil dari www.cs.uiuc.edu/~hanj
  • 18. Data Mining dan Business Intelligence Semakin mendukung pengambilan keputusan End User Business Analyst Data Analyst DBA Pengambil an Keputusan Presentasi Data Teknik Visualiasi Data Mining Penemuan Informasi Eksplorasi Data Statistical Summary, Querying, and Reporting Data Preprocessing/Integrasi, Data Warehouses Sumber Data Database, Web, Paper, Files, Web, eksperimen Diambil dari www.cs.uiuc.edu/~hanj
  • 19. Data Mining: Multi Disiplin Ilmu Data Mining Teknologi DB Statistik Machine Learning Pattern Recognition Algoritma Ilmu Lain Visualisasi
  • 20. Mengapa tidak analisis data biasa? Jumlah data yang sangat besar Algoritma harus scalable untuk menangani data yang sangat besar (tera) Dimensi yang sangat besar: ribuan field Data Kompleks Aliran data dan sensor Data terstruktur, graph, social network, multi-linked data Database dari berbagai sumber, database lama Spasial (peta), multimedia, text, web Software Simulator
  • 21. Data Mining dari berbagai sudut pandang Data Relational, data warehouse, web, transactional, stream, OO, spacial, text, multimedia Pengetahuan yang akan ditambang Karakterisitik, diskriminasi, asosiasi, klasifikasi, clustering, trend, outlier Teknik Database, OLAP, machine learning, statistik, visualiasi Penerapan Retail, telekomunikasi, banking, analisis kejahatan, bio-data mining, saham, text mining, web mining
  • 22. Model dalam Data Mining Verification Model Model ini menggunakan (hypothesis) dari pengguna, dan melakukan test terhadap perkiraan yang diambil sebelumnya dengan menggunakan data-data yang ada. Model verifikasi menggunakan pendekatan top down dengan mengambil hipotesa dari user dan memeriksa validitasnya dengan data sehingga bisa dibuktikan kebenaran hipotesa tersebut.
  • 23. Model dalam Data Mining Discovery Model Sistem secara langsung menemukan informasi- informasi penting yang tersembunyi dalam suatu data yang besar. Data-data yang ada kemudian dipilah- pilah untuk menemukan suatu pola, trend yang ada, dan keadaan umum pada saat itu tanpa adanya campur tangan dan tuntutan dari pengguna. Model knowledge discovery menggunakan pendekatan bottom up untuk mendapatkan informasi yang sebelumnya tidak diketahui. Model ini terbagi menjadi dua directed knowledge discovery dan undirected knowledge discovery.
  • 24. Model dalam Data Mining Discovery Model Pada directed knowledge discovery, data mining akan mencoba mencari penjelasan nilai target field tertentu (seperti pengahasilan, respons, usia, dan lain-lain) terhadap field-field yang lain. Pada undirected knowledge discovery tidak ada target field karena komputer akan mecari pola yang ada pada data. Jadi undirected knowledge discovery digunakan untuk mengenali hubungan/relasi yang ada pada data sedangkan directed discovery akan menjelaskan hubungan/relasi tersebut.
  • 25. Fungsi dalam Data Mining Fungsi atau sub kegiatan yang ada dalam data mining dalam rangka menemukan, menggali, atau menambang pengetahuan, mengacu pada Larose (2005), terdapat enam fungsi dalam data mining, yaitu: Fungsi deskripsi (description) Fungsi estimasi (estimation) Fungsi prediksi (prediction) Fungsi klasifikasi (classification) Fungsi pengelompokan (classification), Fungsi asosiasi (association).
  • 26. Fungsi dalam Data Mining Mengacu pada Berry dan Browne (2006), keenam fungsi data mining tersebut dapat dipilah menjadi: Fungsi minor atau fungsi tambahan, yang meliputi ketiga fungsi pertama, yaitu deskripsi, estimasi, dan prediksi Fungsi mayor atau fungsi utama, yang meliputi ketiga fuingsi berikutnya, yaitu klasifikasi, pengelompokkan, dan asosiasi.
  • 27. Data Mining: Data apa saja? Database Tradisional Relational database, data warehouse, transactional database Advanced Database Data streams dan data sensor Time-series data, temporal data, sequence data (incl. bio-sequences) Structure data, graphs, social networks and multi-linked data Object-relational databases Heterogeneous databases dan legacy databases Spatial data dan spatiotemporal data Multimedia database Text databases World-Wide Web
  • 28. Top-10 Algorithm di ICDM06 #1: C4.5 (61 votes) #2: K-Means (60 votes) #3: SVM (58 votes) #4: Apriori (52 votes) #5: EM (48 votes) #6: PageRank (46 votes) #7: AdaBoost (45 votes) #7: kNN (45 votes) #7: Naive Bayes (45 votes) #10: CART (34 votes)
  • 29. Aplikasi Data Mining Pemasaran/ Penyewaan Identifikasi pola pembayaran pelanggan Menemukan asosiasi diantara karakteristik demografik pelanggan Analisis keranjang pemasaran Perbankan Mendeteksi pola penyalahgunaan kartu kredit Identifikasi pelanggan yang loyal Mendeteksi kartu kredit yang dihabiskan oleh kelompok pelanggan Asuransi & Pelayanan Kesehatan Analisis dari klaim Memprediksi pelanggan yang akan membeli polis baru Identifikasi pola perilaku pelanggan yang berbahaya
  • 30. Aplikasi Data Mining Analisa Perusahaan dan Manajemen Resiko Perencanaan Keuangan dan Evaluasi Aset Perencanaan Sumber Daya (Resource Planning) Persaingan (competition) Competitive Intelligence Telekomunication menerapkan data mining untuk melihat dari jutaan transaksi yang masuk, transaksi mana saja yang masih harus ditangani secara manual (dilayani oleh orang).