際際滷

際際滷Share a Scribd company logo
ARSITEKTUR & MODEL DATA MINING
Part 4
1. Tingkat pertama adalah database tingkat di mana data dan metadata disiapkan dan disimpan.
2. Tingkat kedua disebut Data Mining Aplikasi dimana algoritma memproses data dan menyimpan
hasilnya dalam database.
3. Tingkat ketiga adalah lapisan Front-End, yang memudahkan pengaturan parameter untuk Aplikasi
Data Mining dan visualisasi hasil dalam bentuk ditafsirkan.
.
MODEL DATA MINING
Prediction
Methods
Menggunakan
beberapa variabel
untuk memprediksi
sesuatu atau suatu nilai
yang akan datang
Description
Methods
Mendapatkan pola
penafsiran (human-
interpretable patterns)
untuk menjelaskan
data.
Prediksi Pemodelan
Pemodelan prediktif adalah proses yang
digunakan dalam analisis prediktif untuk
membuat model statistik dari perilaku
masa depan. Predictive analytics adalah
bidang data mining yang bersangkutan
dengan probabilitas peramalan dan tren.
Sebuah model prediktif terdiri dari
sejumlah prediksi, baik faktor variabel
yang mungkin mempengaruhi perilaku
masa depan atau hasil. Dalam
pemasaran, misalnya, jenis kelamin
pelanggan, usia, dan sejarah pembelian
mungkin memprediksi kemungkinan
penjualan masa depan.
Pada pemodelan prediktif, data
dikumpulkan untuk prediktor yang
relevan, model statistik dirumuskan,
prediksi yang dibuat dan model
divalidasi (atau revisi) sebagai data
tambahan telah tersedia. Model ini dapat
menggunakan persamaan linier
sederhana atau jaringan syaraf kompleks
, dipetakan oleh perangkat lunak yang
canggih.
Pemodelan prediktif digunakan secara
luas dalam teknologi informasi. Dalam
sistem penyaringan spam, misalnya,
pemodelan prediktif kadang-kadang
digunakan untuk mengidentifikasi
kemungkinan bahwa pesan yang
diberikan adalah spam.
clustering Klasifikasi
Decision tree Asosiasition Rule
Deskriptif
Pemodelan
11/11/2021 PASKAMARTO HASUGIAN
clustering adalah sebuah proses untuk
mengelompokan data ke dalam
beberapa cluster atau kelompok sehingga
data dalam satu cluster memiliki tingkat
kemiripan yang maksimum dan data
antar cluster memiliki kemiripan yang
minimum.
Metode clustering juga harus dapat
mengukur kemampuannya sendiri dalam
usaha untuk menemukan suatu pola
tersembunyi pada data yang sedang diteliti.
Terdapat berbagai metode yang dapat
digunakan untuk mengukur nilai kesamaan
antar objek-objek yang dibandingkan
Suatu metode clustering harus mampu
menangani data dalam jumlah yang besar.
Saat ini data dalam jumlah besar sudah
sangat umum digunakan dalam berbagai
bidang misalnya saja suatu database. Tidak
hanya berisi ratusan objek, suatu database
dengan ukuran besar bahkan berisi lebih
dari jutaan objek.
clustering
11/11/2021 PASKAMARTO HASUGIAN
11/11/2021 PASKAMARTO HASUGIAN
Klasifikasi merupakan salah satu topik utama dalam data
mining atau machine learning. Klasifikasi adalah suatu
proses penyajian data dimana data yang digunakan
tersebut mempunyai kelas label atau target.
Klasifikasi bertujuan untuk mengklasifikasikan item data
menjadi satu dari beberapa kelas standar. Sebagai
contoh, suatu program email dapat mengklasifikasikan
email yang sah dengan email spam. Beberapa algoritma
klasifikasi antara lain pohon keputusan, nearest neighbor,
nave bayes, neural networks dan support vector machines.
Classification merupakan teknik mengklasifikasikan data.
Perbedaannya dengan metode clustering terletak pada data,
dimana pada clustering variabel dependen tidak ada,
sedangkan pada classification diharuskan ada variabel
dependen. Contoh algoritma yang menggunakan metode ini ID3
dan K Nearest Neighbors dan lainnya.
11/11/2021 PASKAMARTO HASUGIAN
Decision tree
Decision Tree (Pohon Keputusan). Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat terkenal. Metode
pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan
Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel
input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon
keputusan sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari
beberapa teknik lain
11/11/2021 PASKAMARTO HASUGIAN
Asosiasition Rule
Pembelajaran aturan asosiasi mencari hubungan antara variabel. Sebagai contoh suatu toko mengumpulkan data kebiasaan
pelanggan dalam berbelanja. Ketika menggunakan pembelajaran aturan asosiasi, toko tersebut dapat menentuan produk
yang sering dibeli bersamaan dan menggunakan informasi ini untuk tujuan pemasaran.
Association (Asosiasi) merupakan teknik dalam data mining yang mempelajari hubungan antar data. Contoh
penggunaannya seperti untuk menganalisis perilaku mahasiswa yang datang terlambat. jika mahasiswa memiliki jadwal
dengan dosen A dan B, maka mahasiswa akan datang terlambat.
11/11/2021 PASKAMARTO HASUGIAN
SEKIAN DAN TERIMAKASIH

More Related Content

Similar to Pertemuan 4.pdf (20)

Arsitektur dan model data mining
Arsitektur dan model data miningArsitektur dan model data mining
Arsitektur dan model data mining
Universitas Bina Darma Palembang
Manajemen basis data
Manajemen basis data Manajemen basis data
Manajemen basis data
'Oke Aflatun'
Haikal muqoddasy 1418191
Haikal muqoddasy 1418191Haikal muqoddasy 1418191
Haikal muqoddasy 1418191
Haekal Muqoddasy Ar
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Sangrian1
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e
Tugas 1 dm1
Tugas 1 dm1Tugas 1 dm1
Tugas 1 dm1
Alvian yudha Prawira
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
HendroGunawan8
data mining
data miningdata mining
data mining
dewi2093
minggu ke 5 data mining dan kdd oke sipp
minggu ke 5 data mining dan kdd oke sippminggu ke 5 data mining dan kdd oke sipp
minggu ke 5 data mining dan kdd oke sipp
miftaardianti1
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
Kacung Abdullah
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptx
RahmaNatasyah
bds spatial data mining
bds spatial data miningbds spatial data mining
bds spatial data mining
Universitas Bina Darma Palembang
penggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannyapenggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannya
Angga Joe Amstrong
Kecerdasan bisnis
Kecerdasan bisnisKecerdasan bisnis
Kecerdasan bisnis
HehePangibulan2
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
ym.ygrex@comp
Database ms. access by esde
Database ms. access by esdeDatabase ms. access by esde
Database ms. access by esde
Sii Esde
DATA MINING
DATA MININGDATA MINING
DATA MINING
Adam Fahmi
26813 9 arsitektur data mining
26813 9 arsitektur data mining26813 9 arsitektur data mining
26813 9 arsitektur data mining
Universitas Bina Darma Palembang
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data mining
Charlez Dbc
Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
Dasufianti
Manajemen basis data
Manajemen basis data Manajemen basis data
Manajemen basis data
'Oke Aflatun'
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptxTUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
TUGAS 1 KEL 4 SISTEM LOGISTIK.pptx
Sangrian1
99 1-414-2-10-20190724
99 1-414-2-10-2019072499 1-414-2-10-20190724
99 1-414-2-10-20190724
ssuser82ed8e
Data Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdfData Mining Diskusi 2.pdf
Data Mining Diskusi 2.pdf
HendroGunawan8
data mining
data miningdata mining
data mining
dewi2093
minggu ke 5 data mining dan kdd oke sipp
minggu ke 5 data mining dan kdd oke sippminggu ke 5 data mining dan kdd oke sipp
minggu ke 5 data mining dan kdd oke sipp
miftaardianti1
Analisis dan penyajian data
Analisis dan penyajian dataAnalisis dan penyajian data
Analisis dan penyajian data
Kacung Abdullah
ppt metopen kel 09.pptx
ppt metopen kel 09.pptxppt metopen kel 09.pptx
ppt metopen kel 09.pptx
RahmaNatasyah
penggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannyapenggunaan condition pada C++ (devc++) dan penjelasannya
penggunaan condition pada C++ (devc++) dan penjelasannya
Angga Joe Amstrong
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
Jurnal metode clustering dengan algoritma fuzzy c means untuk rekomendasi pem...
ym.ygrex@comp
Database ms. access by esde
Database ms. access by esdeDatabase ms. access by esde
Database ms. access by esde
Sii Esde
DATA MINING
DATA MININGDATA MINING
DATA MINING
Adam Fahmi
Essential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data miningEssential sql server 2008 bi sql server indonesia group - data mining
Essential sql server 2008 bi sql server indonesia group - data mining
Charlez Dbc
Kecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang KeputusanKecerdasan bisnis- Sistem Penunjang Keputusan
Kecerdasan bisnis- Sistem Penunjang Keputusan
Dasufianti

More from HasanulFahmi2 (10)

Week14-Multimedia Information Retrieval.pptx
Week14-Multimedia Information Retrieval.pptxWeek14-Multimedia Information Retrieval.pptx
Week14-Multimedia Information Retrieval.pptx
HasanulFahmi2
Week11-Purchasing Managementtttttttttttt
Week11-Purchasing ManagementttttttttttttWeek11-Purchasing Managementtttttttttttt
Week11-Purchasing Managementtttttttttttt
HasanulFahmi2
Modern information Retrieval-Relevance Feedback
Modern information Retrieval-Relevance FeedbackModern information Retrieval-Relevance Feedback
Modern information Retrieval-Relevance Feedback
HasanulFahmi2
Android Architecture, Environment, and Components.pptx
Android Architecture, Environment, and Components.pptxAndroid Architecture, Environment, and Components.pptx
Android Architecture, Environment, and Components.pptx
HasanulFahmi2
Topic 1. Self Discipline _ Self Control.pptx
Topic 1. Self  Discipline _ Self Control.pptxTopic 1. Self  Discipline _ Self Control.pptx
Topic 1. Self Discipline _ Self Control.pptx
HasanulFahmi2
2. definisi AI.pptx
2. definisi AI.pptx2. definisi AI.pptx
2. definisi AI.pptx
HasanulFahmi2
komdat3-PHYSICAL LAYER DAN MEDIA.pptx
komdat3-PHYSICAL LAYER DAN MEDIA.pptxkomdat3-PHYSICAL LAYER DAN MEDIA.pptx
komdat3-PHYSICAL LAYER DAN MEDIA.pptx
HasanulFahmi2
komdat2- MODEL JARINGAN.pptx
komdat2- MODEL JARINGAN.pptxkomdat2- MODEL JARINGAN.pptx
komdat2- MODEL JARINGAN.pptx
HasanulFahmi2
komdat1-PENDAHULUAN.pptx
komdat1-PENDAHULUAN.pptxkomdat1-PENDAHULUAN.pptx
komdat1-PENDAHULUAN.pptx
HasanulFahmi2
Pertemuan_I.pptx
Pertemuan_I.pptxPertemuan_I.pptx
Pertemuan_I.pptx
HasanulFahmi2
Week14-Multimedia Information Retrieval.pptx
Week14-Multimedia Information Retrieval.pptxWeek14-Multimedia Information Retrieval.pptx
Week14-Multimedia Information Retrieval.pptx
HasanulFahmi2
Week11-Purchasing Managementtttttttttttt
Week11-Purchasing ManagementttttttttttttWeek11-Purchasing Managementtttttttttttt
Week11-Purchasing Managementtttttttttttt
HasanulFahmi2
Modern information Retrieval-Relevance Feedback
Modern information Retrieval-Relevance FeedbackModern information Retrieval-Relevance Feedback
Modern information Retrieval-Relevance Feedback
HasanulFahmi2
Android Architecture, Environment, and Components.pptx
Android Architecture, Environment, and Components.pptxAndroid Architecture, Environment, and Components.pptx
Android Architecture, Environment, and Components.pptx
HasanulFahmi2
Topic 1. Self Discipline _ Self Control.pptx
Topic 1. Self  Discipline _ Self Control.pptxTopic 1. Self  Discipline _ Self Control.pptx
Topic 1. Self Discipline _ Self Control.pptx
HasanulFahmi2
2. definisi AI.pptx
2. definisi AI.pptx2. definisi AI.pptx
2. definisi AI.pptx
HasanulFahmi2
komdat3-PHYSICAL LAYER DAN MEDIA.pptx
komdat3-PHYSICAL LAYER DAN MEDIA.pptxkomdat3-PHYSICAL LAYER DAN MEDIA.pptx
komdat3-PHYSICAL LAYER DAN MEDIA.pptx
HasanulFahmi2
komdat2- MODEL JARINGAN.pptx
komdat2- MODEL JARINGAN.pptxkomdat2- MODEL JARINGAN.pptx
komdat2- MODEL JARINGAN.pptx
HasanulFahmi2
komdat1-PENDAHULUAN.pptx
komdat1-PENDAHULUAN.pptxkomdat1-PENDAHULUAN.pptx
komdat1-PENDAHULUAN.pptx
HasanulFahmi2

Pertemuan 4.pdf

  • 1. ARSITEKTUR & MODEL DATA MINING Part 4
  • 2. 1. Tingkat pertama adalah database tingkat di mana data dan metadata disiapkan dan disimpan. 2. Tingkat kedua disebut Data Mining Aplikasi dimana algoritma memproses data dan menyimpan hasilnya dalam database. 3. Tingkat ketiga adalah lapisan Front-End, yang memudahkan pengaturan parameter untuk Aplikasi Data Mining dan visualisasi hasil dalam bentuk ditafsirkan.
  • 3. . MODEL DATA MINING Prediction Methods Menggunakan beberapa variabel untuk memprediksi sesuatu atau suatu nilai yang akan datang Description Methods Mendapatkan pola penafsiran (human- interpretable patterns) untuk menjelaskan data.
  • 4. Prediksi Pemodelan Pemodelan prediktif adalah proses yang digunakan dalam analisis prediktif untuk membuat model statistik dari perilaku masa depan. Predictive analytics adalah bidang data mining yang bersangkutan dengan probabilitas peramalan dan tren. Sebuah model prediktif terdiri dari sejumlah prediksi, baik faktor variabel yang mungkin mempengaruhi perilaku masa depan atau hasil. Dalam pemasaran, misalnya, jenis kelamin pelanggan, usia, dan sejarah pembelian mungkin memprediksi kemungkinan penjualan masa depan. Pada pemodelan prediktif, data dikumpulkan untuk prediktor yang relevan, model statistik dirumuskan, prediksi yang dibuat dan model divalidasi (atau revisi) sebagai data tambahan telah tersedia. Model ini dapat menggunakan persamaan linier sederhana atau jaringan syaraf kompleks , dipetakan oleh perangkat lunak yang canggih. Pemodelan prediktif digunakan secara luas dalam teknologi informasi. Dalam sistem penyaringan spam, misalnya, pemodelan prediktif kadang-kadang digunakan untuk mengidentifikasi kemungkinan bahwa pesan yang diberikan adalah spam.
  • 5. clustering Klasifikasi Decision tree Asosiasition Rule Deskriptif Pemodelan 11/11/2021 PASKAMARTO HASUGIAN
  • 6. clustering adalah sebuah proses untuk mengelompokan data ke dalam beberapa cluster atau kelompok sehingga data dalam satu cluster memiliki tingkat kemiripan yang maksimum dan data antar cluster memiliki kemiripan yang minimum. Metode clustering juga harus dapat mengukur kemampuannya sendiri dalam usaha untuk menemukan suatu pola tersembunyi pada data yang sedang diteliti. Terdapat berbagai metode yang dapat digunakan untuk mengukur nilai kesamaan antar objek-objek yang dibandingkan Suatu metode clustering harus mampu menangani data dalam jumlah yang besar. Saat ini data dalam jumlah besar sudah sangat umum digunakan dalam berbagai bidang misalnya saja suatu database. Tidak hanya berisi ratusan objek, suatu database dengan ukuran besar bahkan berisi lebih dari jutaan objek. clustering 11/11/2021 PASKAMARTO HASUGIAN
  • 7. 11/11/2021 PASKAMARTO HASUGIAN Klasifikasi merupakan salah satu topik utama dalam data mining atau machine learning. Klasifikasi adalah suatu proses penyajian data dimana data yang digunakan tersebut mempunyai kelas label atau target. Klasifikasi bertujuan untuk mengklasifikasikan item data menjadi satu dari beberapa kelas standar. Sebagai contoh, suatu program email dapat mengklasifikasikan email yang sah dengan email spam. Beberapa algoritma klasifikasi antara lain pohon keputusan, nearest neighbor, nave bayes, neural networks dan support vector machines. Classification merupakan teknik mengklasifikasikan data. Perbedaannya dengan metode clustering terletak pada data, dimana pada clustering variabel dependen tidak ada, sedangkan pada classification diharuskan ada variabel dependen. Contoh algoritma yang menggunakan metode ini ID3 dan K Nearest Neighbors dan lainnya.
  • 8. 11/11/2021 PASKAMARTO HASUGIAN Decision tree Decision Tree (Pohon Keputusan). Pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat terkenal. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan Pohon keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Karena pohon keputusan memadukan antara eksplorasi data dan pemodelan, pohon keputusan sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain
  • 9. 11/11/2021 PASKAMARTO HASUGIAN Asosiasition Rule Pembelajaran aturan asosiasi mencari hubungan antara variabel. Sebagai contoh suatu toko mengumpulkan data kebiasaan pelanggan dalam berbelanja. Ketika menggunakan pembelajaran aturan asosiasi, toko tersebut dapat menentuan produk yang sering dibeli bersamaan dan menggunakan informasi ini untuk tujuan pemasaran. Association (Asosiasi) merupakan teknik dalam data mining yang mempelajari hubungan antar data. Contoh penggunaannya seperti untuk menganalisis perilaku mahasiswa yang datang terlambat. jika mahasiswa memiliki jadwal dengan dosen A dan B, maka mahasiswa akan datang terlambat.