ºÝºÝߣ

ºÝºÝߣShare a Scribd company logo
- PERTEMUAN 1 -
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Tujuan : Mahasiswa Dapat memahami konsep KDD
yang merupakan tujuan akhir dari Data Warehouse
dan Data Mining
DATA WAREHOUSE
01 pengantar kdd
DATA MINING
ï‚— Data Mining adalah kegiatan untuk menemukan
informasi atau pengetahuan yang berguna secara
otomatis dari data yang jumlahnya besar.
ï‚— Data Mining merupakan salah satu proses dari
keseluruhan proses yang ada pada Knowledge
Discovery in Databases (KDD).
KDD
ï‚— Knowledge Discovery in Databases (KDD)
merupakan sekumpulan proses untuk menemukan
pengetahuan yang bermanfaat dari data.
ï‚— Kumpulan proses dalam KDD meliputi : pembersihan
data (data cleaning), integrasi data (data integration),
pemilihan data (data selection), transformasi data
(data transformation), penambangan data (data
mining), evaluasi pola (pattern evaluation), dan
presentasi pengetahuan (knowledge presentation).
ï‚— Berdasarkan definisi ini terlihat bahwa data mining
hanya merupakan salah satu proses dari keseluruhan
proses yang ada pada KDD, tetapi merupakan proses
yang sangat penting dalam menemukan pola-pola
yang berguna dari sejumlah data yang besar (data
tersebut bisa disimpan dalam basisdata, Data
Warehouse, atau media penyimpanan informasi
01 pengantar kdd
01 pengantar kdd
KDD vs. DM
ï‚— Menurut Cabena, Data Mining = Knowledge
Discovery in Database (KDD).
ï‚— Menurut Jiawei Han, Data Mining merupakan
Subset atau salah satu tahap dari KDD saja.
Sehingga, batasan ini yang selanjutkan
digunakan.
ï‚— Data Mining bertujuan mengekplorasi basis data
untuk menemukan pola-pola pengetahuan yang
tersembunyi di dalam data tersebut.
TAHAPAN KNOWLEDGE
DISCOVERY IN DATABASE
Menurut Peter Cabena, Tahapan – tahapan
dalam KDD adalah sebagai berikut :
ï‚— Penentuan Sasaran Bisnis (Business Objective
Determination)
ï‚— Persiapan Data (Preparation Data)
ï‚— Data Selection
ï‚— Data Preprocessing
ï‚— Data Transformation
ï‚— Data Mining
ï‚— Anaysis of Result
ï‚— Assimilation of Knowledge
Business Objective Determination
- 1
ï‚— Merupakan sebuah tahapan yang mendefinisikan
permasalahan atau tantangan bisnis dengan jelas.
Hal ini merupakan aspek yang sangat esensial dalam
setiap proyek data mining.
ï‚— Contoh Sasaran Bisnis :
Mengembangkan suatu strategi marketing untuk
mempertahankan loyalitas customer di Jawa Tengah
dan Jawa Timur untuk produk soft drink dengan brand
dan ukuran tertentu (200ml dalam kotak alumunium)
selama bulan April, Mei , Juni yang akan datang.
Perusahaan akan menggunakan kombinasi dari
berbagai strategi marketing (mixed marketing), yang
salah satunya adalah direct mail campaign kepada
customer yang tampaknya "mudah rusak"
loyalitasnya.
Business Objective Determination
- 2
ï‚— Sehingga dampak keseluruhan KDD adalah :
 – Data Selection: dipilih customers yang membeli
produk soft drink 200 ml dalam kotak alumunium di
Jawa Tengah dan Jawa Timur.
 – Data Transformation: customers yang membeli
produk soft drink 200 ml dalam kotak alumunium
disorting dalam 10 kategori, yang masing-masing
membedakan tingkat loyalitasnya: membeli produk
tersebut 0-10%, 11-20%, ..... , 81-90%, 91-100%
sepanjang waktu pembeliannya. Selanjutnya data
inilah yang akan dibawa ke tahap data mining.
Persiapan Data (Preparation Data)
-1
ï‚— Merupakan tahapan untuk mempersiapkan data
yang diperlukan untuk proses data mining.
Tujuannya adalah agar data yang digunakan
benar-benar sesuai dengan permasalahan yang
akan dipecahkan, dapat dijamin kebenarannya,
dan dalam format yang sesuai/tepat.
ï‚— Tahap yang paling banyak mengkonsumsi
resources (manusia, biaya, waktu) yang tersedia.
Biasanya mencapai 60% keseluruhan proyek
KDD.
Persiapan Data (Preparation Data)
-2
ï‚— Data Selection
ï‚— Mengidentifikasi semua sumber informasi internal
dan eksternal dan memilih sebagian saja dari data
yang diperlukan untuk aplikasi data mining.
ï‚— Data Preprocessing
ï‚— Meyakinkan kualitas data yang telah dipilih pada
tahapan sebelumnya. 2 issue yang sering
dihadapkan pada tahapan ini adalah Noisy Data
dan Missing Value.
ï‚— Data Transformation
ï‚— Mengubah data ke dalam model analitis serta
memodelkan data agar sesuai dengan analisa yang
diharapkan dan format data yang diperlukan oleh
algoritma data mining.
Data Mining -1
ï‚— Melakukan proses pencarian pengetahuan
terhadap data yang ditransformasikan pada tahap
sebelumnya.
ï‚— Contoh Pengetahuan berbentuk Association Rule
untuk kasus "Soft Drink“:
ï‚— IF soft drink sejenis dengan ukuran yang lebih
besar (bukan botol kecil) dibeli lebih dari 58%
dalam sejarah pembelian soft drink seorang
consumer
ï‚— THEN consumer tersebut diprediksi Loyal.
ï‚— Pemilihan tugas data mining : pemilihan goal dari
proses KDD misalnya klasifikasi, regresi,
clustering, dll.
Data Mining -2
ï‚— Proses Data mining yaitu proses mencari pola
atau informasi menarik dalam data terpilih
dengan menggunakan teknik atau metode
tertentu. Teknik, metode, atau algoritma dalam
data mining sangat bervariasi. Pemilihan metode
atau algoritma yang tepat sangat bergantung
pada tujuan dan proses KDD secara
keseluruhan.
Anaysis of Result
ï‚— Menginterpretasikan dan mengevaluasi output
dari tahap mining: patterns.
ï‚— Pendekatan analisa yang digunakan akan
bervariasi menurut operasi data mining yang
digunakan, tetapi biasanya akan melibatkan
teknik visualisasi.
Assimilation of Knowledge
ï‚— Menggunakan hasil mining yang telah dievaluasi
ke dalam perilaku organisasi dan sistem informasi
perusahaan.
DATA MINING dan PROSES
KDD - 1
DATA MINING dan PROSES
KDD - 2
ï‚— Pembersihan data (Data Cleaning)
ï‚— Digunakan untuk membuang data yang tidak konsisten dan noise.
ï‚— Intergrasi Data (Data Integration)
ï‚— Data yang diperlukan untuk data mining tidak hanya berasal dari satu
database tetapi juga berasal dari beberapa database atau file teks. Hasil
integrasi data sering diwujudkan dalam sebuah data warehouse karena
dengan data warehouse, data dikonsolidasikan dengan struktur khusus
yang efisien. Selain itu data warehouse juga memungkinkan tipe analisa
seperti OLAP.
ï‚— Transformasi data
ï‚— Transformasi dan pemilihan data ini untuk menentukan kualitas dari hasil
data mining, sehingga data diubah menjadi bentuk sesuai untuk di-
Mining.
ï‚— Aplikasi Teknik Data Mining
ï‚— Aplikasi teknik data mining sendiri hanya merupakan salah satu bagian
dari proses data mining. Ada beberapa teknik data mining yang sudah
umum dipakai.
ï‚— Evaluasi pola yang ditemukan
ï‚— Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas
maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang
ada memang tercapai.
ï‚— Presentasi Pengetahuan
ï‚— Presentasi pola yang ditemukan untuk menghasilkan aksi tahap terakhir
INPUT DAN OUTPUT DATA
MINING
Jenis Data yg di-
Mining
Jenis Pengetahuan
yg didapat
1. Relational Database 1. Decision Tabel
2. Data Warehouse 2. Decision Tree
3. Transactional Database 3. Classification Rule
4. Aplikasi Database
Lanjut Lainnya :
a. Object Oriented
Database
b. Object Relational
Database
c. Spatial Database, dsb
4. Association Rule
5. Berbagai tree untuk
Prediksi Numerik :
a. Regression Tree
b. Model Tree
4. Cluster

More Related Content

Similar to 01 pengantar kdd (20)

BAB_5_Data_Mining.ppt
BAB_5_Data_Mining.pptBAB_5_Data_Mining.ppt
BAB_5_Data_Mining.ppt
NursalamSalampessy
Ìý
data-mining- for business intelligent.ppt
data-mining- for business intelligent.pptdata-mining- for business intelligent.ppt
data-mining- for business intelligent.ppt
widyaginting1
Ìý
MIK4237-02.pdf
MIK4237-02.pdfMIK4237-02.pdf
MIK4237-02.pdf
WahyuWiguna6
Ìý
Pengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.pptPengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.ppt
joeldoel04
Ìý
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
HendroGunawan8
Ìý
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest
Ìý
Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
Ìý
Pertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data miningPertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data mining
MatlubulKhairi
Ìý
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptx
FennyRahmayani
Ìý
Pertemuan 9 data mining dan data ware.pptx
Pertemuan 9 data mining dan data ware.pptxPertemuan 9 data mining dan data ware.pptx
Pertemuan 9 data mining dan data ware.pptx
MalaKetaren
Ìý
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Sangrian1
Ìý
T2 - Desain Basis Data
T2 - Desain Basis DataT2 - Desain Basis Data
T2 - Desain Basis Data
Siska Amelia
Ìý
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e
Ìý
Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......
mochammadagri
Ìý
Data warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comData warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.com
suleman ganteng
Ìý
10
1010
10
dedesumarni3
Ìý
LPR Week 1-KEMASTURA Group-2023.Data Analytics
LPR Week 1-KEMASTURA Group-2023.Data AnalyticsLPR Week 1-KEMASTURA Group-2023.Data Analytics
LPR Week 1-KEMASTURA Group-2023.Data Analytics
DamasPandyaJanottama1
Ìý
Haikal muqoddasy 1418191
Haikal muqoddasy 1418191Haikal muqoddasy 1418191
Haikal muqoddasy 1418191
Haekal Muqoddasy Ar
Ìý
01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdf01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdf
Elvi Rahmi
Ìý
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
Ìý
data-mining- for business intelligent.ppt
data-mining- for business intelligent.pptdata-mining- for business intelligent.ppt
data-mining- for business intelligent.ppt
widyaginting1
Ìý
MIK4237-02.pdf
MIK4237-02.pdfMIK4237-02.pdf
MIK4237-02.pdf
WahyuWiguna6
Ìý
Pengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.pptPengantar Materi Data Mining di Era Digital.ppt
Pengantar Materi Data Mining di Era Digital.ppt
joeldoel04
Ìý
Data Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdfData Mining Diskusi 3.pdf
Data Mining Diskusi 3.pdf
HendroGunawan8
Ìý
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...Jawaban No. 2 Tahap-Tahap Data Mining Karena  DM adalah suatu ...
Jawaban No. 2 Tahap-Tahap Data Mining Karena DM adalah suatu ...
butest
Ìý
Pertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data miningPertemuan 4 Arsitektur dan model data mining
Pertemuan 4 Arsitektur dan model data mining
MatlubulKhairi
Ìý
Pertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptxPertemuan 10 - Metodologi Data Science - Copy.pptx
Pertemuan 10 - Metodologi Data Science - Copy.pptx
FennyRahmayani
Ìý
Pertemuan 9 data mining dan data ware.pptx
Pertemuan 9 data mining dan data ware.pptxPertemuan 9 data mining dan data ware.pptx
Pertemuan 9 data mining dan data ware.pptx
MalaKetaren
Ìý
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Sangrian1
Ìý
T2 - Desain Basis Data
T2 - Desain Basis DataT2 - Desain Basis Data
T2 - Desain Basis Data
Siska Amelia
Ìý
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e
Ìý
Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......Data Mart, Warehouse, Mining, OLAP......
Data Mart, Warehouse, Mining, OLAP......
mochammadagri
Ìý
Data warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.comData warehouse dan data mining dianvs.blogspot.com
Data warehouse dan data mining dianvs.blogspot.com
suleman ganteng
Ìý
LPR Week 1-KEMASTURA Group-2023.Data Analytics
LPR Week 1-KEMASTURA Group-2023.Data AnalyticsLPR Week 1-KEMASTURA Group-2023.Data Analytics
LPR Week 1-KEMASTURA Group-2023.Data Analytics
DamasPandyaJanottama1
Ìý
01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdf01 - Introduction to Data Mining - Original.pdf
01 - Introduction to Data Mining - Original.pdf
Elvi Rahmi
Ìý
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.pptDATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
DATA MINING : ESTIMASI, PREDIKSI, KLASIFIKASI, KLASTERING, DAN ASOSIASI.ppt
muhammadarsyad77
Ìý

Recently uploaded (20)

BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptxBAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
LunduSitohang
Ìý
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.pptenzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
ParlikPujiRahayu
Ìý
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Murad Maulana
Ìý
Random Number Generator Teknik Simulasi.pdf
Random Number Generator Teknik Simulasi.pdfRandom Number Generator Teknik Simulasi.pdf
Random Number Generator Teknik Simulasi.pdf
PratamaYulyNugraha
Ìý
Modul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Ajar Matematika Kelas 11 Fase F Kurikulum MerdekaModul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Kelas
Ìý
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptxSAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
Baharin Salleh
Ìý
Kiraan Kadar Nadi Karvonen nadi mak nadi rehat
Kiraan Kadar Nadi Karvonen nadi mak nadi rehatKiraan Kadar Nadi Karvonen nadi mak nadi rehat
Kiraan Kadar Nadi Karvonen nadi mak nadi rehat
ssuser7d8dcb
Ìý
Danantara: Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Danantara:  Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...Danantara:  Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Danantara: Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Dadang Solihin
Ìý
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
Syarifatul Marwiyah
Ìý
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
SofyanSkmspd
Ìý
Farmakologi (antibiotik, antivirus, antijamur).pptx
Farmakologi (antibiotik, antivirus, antijamur).pptxFarmakologi (antibiotik, antivirus, antijamur).pptx
Farmakologi (antibiotik, antivirus, antijamur).pptx
michellepikachuuu
Ìý
02_Konjugat_Bilangan_Kompleks (Unpak).pdf
02_Konjugat_Bilangan_Kompleks (Unpak).pdf02_Konjugat_Bilangan_Kompleks (Unpak).pdf
02_Konjugat_Bilangan_Kompleks (Unpak).pdf
AsepSaepulrohman4
Ìý
PPT Komponen Penyusun Darah Beserta Fungsinya
PPT Komponen Penyusun Darah Beserta FungsinyaPPT Komponen Penyusun Darah Beserta Fungsinya
PPT Komponen Penyusun Darah Beserta Fungsinya
mileniumiramadhanti
Ìý
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Tata Naipospos
Ìý
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Murad Maulana
Ìý
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docxSENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
Mirza836129
Ìý
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptxPRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
NurulIlyas3
Ìý
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdfPanduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Fajar Baskoro
Ìý
Buku 1 tentang orang Hukum perdata Universitas Negeri Semarang
Buku 1 tentang orang Hukum perdata Universitas Negeri SemarangBuku 1 tentang orang Hukum perdata Universitas Negeri Semarang
Buku 1 tentang orang Hukum perdata Universitas Negeri Semarang
iztawanasya1
Ìý
Jakarta Pasca Ibu Kota Negara - Majalah Telstra
Jakarta Pasca Ibu Kota Negara - Majalah TelstraJakarta Pasca Ibu Kota Negara - Majalah Telstra
Jakarta Pasca Ibu Kota Negara - Majalah Telstra
Dadang Solihin
Ìý
BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptxBAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
BAHAN UNTUK PELATIHAN PS, DRIGEN, MAZMUR.pptx
LunduSitohang
Ìý
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.pptenzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
enzim mikroba KULIAH BIOLOGI MIKROPANGAN.ppt
ParlikPujiRahayu
Ìý
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Manajemen Perpustakaan BAPETEN BerdasarkanÌýSNI 7496:2009
Murad Maulana
Ìý
Random Number Generator Teknik Simulasi.pdf
Random Number Generator Teknik Simulasi.pdfRandom Number Generator Teknik Simulasi.pdf
Random Number Generator Teknik Simulasi.pdf
PratamaYulyNugraha
Ìý
Modul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Ajar Matematika Kelas 11 Fase F Kurikulum MerdekaModul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Ajar Matematika Kelas 11 Fase F Kurikulum Merdeka
Modul Kelas
Ìý
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptxSAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
SAINS TINGKATAN 5 BAB 6 ELEKTROKIMIA.pptx
Baharin Salleh
Ìý
Kiraan Kadar Nadi Karvonen nadi mak nadi rehat
Kiraan Kadar Nadi Karvonen nadi mak nadi rehatKiraan Kadar Nadi Karvonen nadi mak nadi rehat
Kiraan Kadar Nadi Karvonen nadi mak nadi rehat
ssuser7d8dcb
Ìý
Danantara: Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Danantara:  Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...Danantara:  Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Danantara: Pesimis atau Optimis? Podcast Ikatan Alumni Lemhannas RI IKAL Lem...
Dadang Solihin
Ìý
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
1. Zakat dan Zakat Fitrah Part 1_Safari Ramadhan UAS 2025.pdf
Syarifatul Marwiyah
Ìý
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
1. -MICROTEACHING- Modul Penanganan Kekerasan.pptx
SofyanSkmspd
Ìý
Farmakologi (antibiotik, antivirus, antijamur).pptx
Farmakologi (antibiotik, antivirus, antijamur).pptxFarmakologi (antibiotik, antivirus, antijamur).pptx
Farmakologi (antibiotik, antivirus, antijamur).pptx
michellepikachuuu
Ìý
02_Konjugat_Bilangan_Kompleks (Unpak).pdf
02_Konjugat_Bilangan_Kompleks (Unpak).pdf02_Konjugat_Bilangan_Kompleks (Unpak).pdf
02_Konjugat_Bilangan_Kompleks (Unpak).pdf
AsepSaepulrohman4
Ìý
PPT Komponen Penyusun Darah Beserta Fungsinya
PPT Komponen Penyusun Darah Beserta FungsinyaPPT Komponen Penyusun Darah Beserta Fungsinya
PPT Komponen Penyusun Darah Beserta Fungsinya
mileniumiramadhanti
Ìý
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Apakah daging tanpa tulang dan tanpa limfoglandula aman diperdagangkan? Ditje...
Tata Naipospos
Ìý
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Analisis Subjek Literatur Pada Disertasi Kajian Budaya dan Media (KBM) Sekola...
Murad Maulana
Ìý
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docxSENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
SENARAI & JADWAL PEMBICARA Ramadan Masjid Kampus UGM 1446 Hijriah.docx
Mirza836129
Ìý
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptxPRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
PRAKTIK PEMBUATAN RPP DEEP LEARNING fix.pptx
NurulIlyas3
Ìý
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdfPanduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Panduan Entry Nilai Rapor untuk Operator SD_MI 2025.pptx (1).pdf
Fajar Baskoro
Ìý
Buku 1 tentang orang Hukum perdata Universitas Negeri Semarang
Buku 1 tentang orang Hukum perdata Universitas Negeri SemarangBuku 1 tentang orang Hukum perdata Universitas Negeri Semarang
Buku 1 tentang orang Hukum perdata Universitas Negeri Semarang
iztawanasya1
Ìý
Jakarta Pasca Ibu Kota Negara - Majalah Telstra
Jakarta Pasca Ibu Kota Negara - Majalah TelstraJakarta Pasca Ibu Kota Negara - Majalah Telstra
Jakarta Pasca Ibu Kota Negara - Majalah Telstra
Dadang Solihin
Ìý

01 pengantar kdd

  • 1. - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data Mining DATA WAREHOUSE
  • 3. DATA MINING ï‚— Data Mining adalah kegiatan untuk menemukan informasi atau pengetahuan yang berguna secara otomatis dari data yang jumlahnya besar. ï‚— Data Mining merupakan salah satu proses dari keseluruhan proses yang ada pada Knowledge Discovery in Databases (KDD).
  • 4. KDD ï‚— Knowledge Discovery in Databases (KDD) merupakan sekumpulan proses untuk menemukan pengetahuan yang bermanfaat dari data. ï‚— Kumpulan proses dalam KDD meliputi : pembersihan data (data cleaning), integrasi data (data integration), pemilihan data (data selection), transformasi data (data transformation), penambangan data (data mining), evaluasi pola (pattern evaluation), dan presentasi pengetahuan (knowledge presentation). ï‚— Berdasarkan definisi ini terlihat bahwa data mining hanya merupakan salah satu proses dari keseluruhan proses yang ada pada KDD, tetapi merupakan proses yang sangat penting dalam menemukan pola-pola yang berguna dari sejumlah data yang besar (data tersebut bisa disimpan dalam basisdata, Data Warehouse, atau media penyimpanan informasi
  • 7. KDD vs. DM ï‚— Menurut Cabena, Data Mining = Knowledge Discovery in Database (KDD). ï‚— Menurut Jiawei Han, Data Mining merupakan Subset atau salah satu tahap dari KDD saja. Sehingga, batasan ini yang selanjutkan digunakan. ï‚— Data Mining bertujuan mengekplorasi basis data untuk menemukan pola-pola pengetahuan yang tersembunyi di dalam data tersebut.
  • 8. TAHAPAN KNOWLEDGE DISCOVERY IN DATABASE Menurut Peter Cabena, Tahapan – tahapan dalam KDD adalah sebagai berikut : ï‚— Penentuan Sasaran Bisnis (Business Objective Determination) ï‚— Persiapan Data (Preparation Data) ï‚— Data Selection ï‚— Data Preprocessing ï‚— Data Transformation ï‚— Data Mining ï‚— Anaysis of Result ï‚— Assimilation of Knowledge
  • 9. Business Objective Determination - 1 ï‚— Merupakan sebuah tahapan yang mendefinisikan permasalahan atau tantangan bisnis dengan jelas. Hal ini merupakan aspek yang sangat esensial dalam setiap proyek data mining. ï‚— Contoh Sasaran Bisnis : Mengembangkan suatu strategi marketing untuk mempertahankan loyalitas customer di Jawa Tengah dan Jawa Timur untuk produk soft drink dengan brand dan ukuran tertentu (200ml dalam kotak alumunium) selama bulan April, Mei , Juni yang akan datang. Perusahaan akan menggunakan kombinasi dari berbagai strategi marketing (mixed marketing), yang salah satunya adalah direct mail campaign kepada customer yang tampaknya "mudah rusak" loyalitasnya.
  • 10. Business Objective Determination - 2 ï‚— Sehingga dampak keseluruhan KDD adalah : ï‚— – Data Selection: dipilih customers yang membeli produk soft drink 200 ml dalam kotak alumunium di Jawa Tengah dan Jawa Timur. ï‚— – Data Transformation: customers yang membeli produk soft drink 200 ml dalam kotak alumunium disorting dalam 10 kategori, yang masing-masing membedakan tingkat loyalitasnya: membeli produk tersebut 0-10%, 11-20%, ..... , 81-90%, 91-100% sepanjang waktu pembeliannya. Selanjutnya data inilah yang akan dibawa ke tahap data mining.
  • 11. Persiapan Data (Preparation Data) -1 ï‚— Merupakan tahapan untuk mempersiapkan data yang diperlukan untuk proses data mining. Tujuannya adalah agar data yang digunakan benar-benar sesuai dengan permasalahan yang akan dipecahkan, dapat dijamin kebenarannya, dan dalam format yang sesuai/tepat. ï‚— Tahap yang paling banyak mengkonsumsi resources (manusia, biaya, waktu) yang tersedia. Biasanya mencapai 60% keseluruhan proyek KDD.
  • 12. Persiapan Data (Preparation Data) -2 ï‚— Data Selection ï‚— Mengidentifikasi semua sumber informasi internal dan eksternal dan memilih sebagian saja dari data yang diperlukan untuk aplikasi data mining. ï‚— Data Preprocessing ï‚— Meyakinkan kualitas data yang telah dipilih pada tahapan sebelumnya. 2 issue yang sering dihadapkan pada tahapan ini adalah Noisy Data dan Missing Value. ï‚— Data Transformation ï‚— Mengubah data ke dalam model analitis serta memodelkan data agar sesuai dengan analisa yang diharapkan dan format data yang diperlukan oleh algoritma data mining.
  • 13. Data Mining -1 ï‚— Melakukan proses pencarian pengetahuan terhadap data yang ditransformasikan pada tahap sebelumnya. ï‚— Contoh Pengetahuan berbentuk Association Rule untuk kasus "Soft Drink“: ï‚— IF soft drink sejenis dengan ukuran yang lebih besar (bukan botol kecil) dibeli lebih dari 58% dalam sejarah pembelian soft drink seorang consumer ï‚— THEN consumer tersebut diprediksi Loyal. ï‚— Pemilihan tugas data mining : pemilihan goal dari proses KDD misalnya klasifikasi, regresi, clustering, dll.
  • 14. Data Mining -2 ï‚— Proses Data mining yaitu proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan.
  • 15. Anaysis of Result ï‚— Menginterpretasikan dan mengevaluasi output dari tahap mining: patterns. ï‚— Pendekatan analisa yang digunakan akan bervariasi menurut operasi data mining yang digunakan, tetapi biasanya akan melibatkan teknik visualisasi.
  • 16. Assimilation of Knowledge ï‚— Menggunakan hasil mining yang telah dievaluasi ke dalam perilaku organisasi dan sistem informasi perusahaan.
  • 17. DATA MINING dan PROSES KDD - 1
  • 18. DATA MINING dan PROSES KDD - 2 ï‚— Pembersihan data (Data Cleaning) ï‚— Digunakan untuk membuang data yang tidak konsisten dan noise. ï‚— Intergrasi Data (Data Integration) ï‚— Data yang diperlukan untuk data mining tidak hanya berasal dari satu database tetapi juga berasal dari beberapa database atau file teks. Hasil integrasi data sering diwujudkan dalam sebuah data warehouse karena dengan data warehouse, data dikonsolidasikan dengan struktur khusus yang efisien. Selain itu data warehouse juga memungkinkan tipe analisa seperti OLAP. ï‚— Transformasi data ï‚— Transformasi dan pemilihan data ini untuk menentukan kualitas dari hasil data mining, sehingga data diubah menjadi bentuk sesuai untuk di- Mining. ï‚— Aplikasi Teknik Data Mining ï‚— Aplikasi teknik data mining sendiri hanya merupakan salah satu bagian dari proses data mining. Ada beberapa teknik data mining yang sudah umum dipakai. ï‚— Evaluasi pola yang ditemukan ï‚— Dalam tahap ini hasil dari teknik data mining berupa pola-pola yang khas maupun model prediksi dievaluasi untuk menilai apakah hipotesa yang ada memang tercapai. ï‚— Presentasi Pengetahuan ï‚— Presentasi pola yang ditemukan untuk menghasilkan aksi tahap terakhir
  • 19. INPUT DAN OUTPUT DATA MINING Jenis Data yg di- Mining Jenis Pengetahuan yg didapat 1. Relational Database 1. Decision Tabel 2. Data Warehouse 2. Decision Tree 3. Transactional Database 3. Classification Rule 4. Aplikasi Database Lanjut Lainnya : a. Object Oriented Database b. Object Relational Database c. Spatial Database, dsb 4. Association Rule 5. Berbagai tree untuk Prediksi Numerik : a. Regression Tree b. Model Tree 4. Cluster