際際滷

際際滷Share a Scribd company logo
ilmubiner@gmail.com

Data Mining

http://ilmubiner.blogspot.com

Belajar Mudah Algoritma Data Mining Clustering : k-means
Clustering atau analisis cluster adalah :
 Proses pembentukan kelompok data (cluster) dari himpunan data yang tidak diketahui
kelompok-kelompok atau kelas-kelasnya.
 Proses menentukan data-data termasuk ke dalam cluster yang mana.
Bisa dibilang, clustering merupakan proses untuk mengetahui kelas-kelas atau taksonomi atau
botryologi, atau analisis topologi dari data-data yang ada. Dilihat dari kacamata data mining,
clustering bukanlah proses klasifikasi. Karena dalam proses klasifikasi, data dikelompokkan ke
dalam kelas-kelas yang telah diketahui sebelumnya.
Ada beberapa metode atau model untuk melakukan clustering, antara lain :
 Model connectivity.
 Model centroid.
 Model density.
 Model subspace.
 Model group.
 Model graph based.
Algoritma k-means merupakan model
centroid. Model centroid adalah model yang
menggunakan centroid untuk membuat
cluster. Centroid adalah titik tengah suatu
cluster. Centroid berupa nilai. Centroid
digunakan untuk menghitung jarak suatu
objek data terhadap centroid. Suatu objek data
termasuk dalam suatu cluster jika memiliki
jarak terpendek terhadap centroid cluster
tersebut.
Secara umum algoritma k-means adalah :
1. Menentukan banyaknya cluster (k).
2. Menentukan centroid.
3. Apakah centroid-nya berubah?
a. Jika ya, hitung jarak data dari centroid.
b. Jikat tidak, selesai.
4. Mengelompokkan data berdasarkan jarak
yang terdekat.
Diagram alir (flowchart) algoritma k-means
ada pada Gambar 1. Sedangkan Gambar 2
merupakan contoh posisi titik-titik data dan
centroid-centroid-nya (lingkaran yang lebih
besar.

Gambar 1. Diagram Alir Algoritma k-means

Page 1 of 5
ilmubiner@gmail.com

Data Mining

http://ilmubiner.blogspot.com

Untuk lebih jelasnya, berikut pembahasan pemakaian
algoritma k-means. Tabel 1 berisi data sumber yang
akan dianalisis cluster-nya :
Tabel 1. Data Sumber
n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

Gambar 2. Contoh Cluster
1. Tentukan banyaknya cluster adalah dua (k = 2) yang akan dibuat. Banyaknya cluster
harus lebih kecil dari pada banyaknya data (k < n).
2. Tentukan centroid setiap cluster.
Untuk menentukan centroid awal (initial centroid) banyak metode yang dapat digunakan.
Di sini metode yang digunakan adalah mengambil data dari data sumber, secara acak atau
random (Sel yang berwarna kuning dan hijau di Tabel 1).
Tabel 2. Centroid pada Pengulangan ke-0

c1
c2

a
1
2

b
1
1

Untuk pengulangan berikutnya (pengulangan ke-1 sampai selesai), centroid baru dihitung
dengan menghitung nilai rata-rata data pada setiap cluster. Jika centroid baru berbeda
dengan centroid sebelumnya, maka proses dilanjutkan ke langkah berikutnya. Namun
jika centroid yang baru dihitung sama dengan centroid sebelumnya, maka proses
clustering selesai.
3. Hitung jarak data dengan centroid. Rumus-rumus untuk menghitung jarak antara lain :
a. Euclidean.
b. Manhattan / City Block.
c. Minkowski.
Rumus yang digunakan di sini adalah rumus Euclidean Distance :

Page 2 of 5
ilmubiner@gmail.com

=
=
=
=
=

,

Data Mining

=	

(

http://ilmubiner.blogspot.com

 )

	

Jarak data dengan cluster 1 adalah :
( ,

) =	 (

( +,

) =	 (

( ,

( ,

) =	 (
) =	 (

%
+



) +(



) +(




) +(
) +(

%
+



!)

	 	=

	 (1  1) + (1  1) = 0



!)

	 	=

	 (5  1) + (4  1) = 5




!)
!)

	 	=
	 	=

	 (2  1) + (1  1) = 1

	 (4  1) + (3  1) = 3.605551

Jarak data dengan cluster 2 adalah :
( ,

) =	 (

( +,

) =	 (

( ,
( ,

) =	 (
) =	 (

%
+



) +(



) +(




) +(
) +(

%
+



!)

	 	=

	 (1  2) + (1  1) = 1



!)

	 	=

	 (5  2) + (4  1) = 4.242641




!)
!)

	 	=
	 	=

	 (2  2) + (1  1) = 0

	 (4  2) + (3  1) = 2.828427

Untuk seterusnya, hitung jarak pada setiap baris data, dan hasilnya seperti pada Tabel 3.
Tabel 3. Hasil Perhitungan Jarak
n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641

4. Kelompokkan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak terpendek.
Contoh; karena ( , ) < 	 ( , ) maka
masuk ke dalam cluster 1. Pada Tabel 4,
data n = 1 masuk ke dalam cluster 1 karena dc1 < dc2, sedangkan data n = 2, 3, 4 masuk
ke dalam cluster 2 karena dc2 < dc1.

Page 3 of 5
ilmubiner@gmail.com

Data Mining

http://ilmubiner.blogspot.com

Tabel 4. Hasil Perhitungan Jarak dan Pengelompokkan Data
n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641

c1
Ok

c2
Ok
Ok
Ok

5. Proses kembali lagi ke langkah no. 2.
Untuk hasil clustering yang lebih lengkap, berikut tabel-tabel hasil analisis dan perhitungan dari
awal sampai selesai :
Inisialisasi
n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

c1
c2

a
1
2

b
1
1

n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641

c1
Ok

c2
Ok
Ok
Ok

Pengulangan ke-1
c1
c2
n
1
2
3
4

a
b
Nilai pada sel diperoleh dari menghitung
1
1
rata-rata pada tabel di atasnya sesuai
3.666667 2.666667 dengan warna sel
a
1
2
4
5

b
1
1
3
4

dc1
dc2
0
3.14466
1
2.357023
3.605551 0.471405
5
1.885618

Page 4 of 5

c1
Ok
Ok

c2

Ok
Ok
ilmubiner@gmail.com

Data Mining

http://ilmubiner.blogspot.com

Pengulangan ke-2
c1
c2

a
1.5
4.5

b
1
3.5

n
1
2
3
4

a
1
2
4
5

b
1
1
3
4

a
1.5
4.5

b
1
3.5

dc1
0.5
0.5
3.201562
4.609772

dc2
4.301163
2.357023
0.471405
1.885618

c1
Ok
Ok

Pengulangan ke-3
c1
c2

Karena centroid tidak mengalami perubahan (sama dengan centroid
sebelumnya) maka proses clustering selesai

[EoF]

Page 5 of 5

c2

Ok
Ok

More Related Content

What's hot (20)

Analisis Semantik - P 6 Teknik Kompilasi
Analisis Semantik - P 6 Teknik KompilasiAnalisis Semantik - P 6 Teknik Kompilasi
Analisis Semantik - P 6 Teknik Kompilasi
ahmad haidaroh
Sistem Pendukung Keputusan
Sistem Pendukung KeputusanSistem Pendukung Keputusan
Sistem Pendukung Keputusan
Lia Rusdyana Dewi
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQLKelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Dejiko Chaem
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAMPENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
Muhammad Baihaqi
Presentasi sistem perpustakaan
Presentasi sistem perpustakaanPresentasi sistem perpustakaan
Presentasi sistem perpustakaan
D. Syafa'atul Anbiya
Basis Data - Pengenalan DML dan DDL
Basis Data - Pengenalan DML dan DDLBasis Data - Pengenalan DML dan DDL
Basis Data - Pengenalan DML dan DDL
Walid Umar
Algoritma penjadwalan proses
Algoritma penjadwalan prosesAlgoritma penjadwalan proses
Algoritma penjadwalan proses
Rakhmi Khalida, M.M.S.I
Use skenario
Use skenarioUse skenario
Use skenario
Septyy Wulandary
Modul 4 representasi pengetahuan
Modul 4   representasi pengetahuanModul 4   representasi pengetahuan
Modul 4 representasi pengetahuan
ahmad haidaroh
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop OnlineERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
Lucha Kamala Putri
Proposal Sistem Informasi Pemesanan Tiket Bioskop Online
Proposal Sistem Informasi Pemesanan Tiket Bioskop OnlineProposal Sistem Informasi Pemesanan Tiket Bioskop Online
Proposal Sistem Informasi Pemesanan Tiket Bioskop Online
Lucha Kamala Putri
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan Komputer
Auliaa Oktarianii
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
Dedes ssi
Pertemuan 6 & 7 ars. gerbang logika
Pertemuan 6 & 7 ars. gerbang logikaPertemuan 6 & 7 ars. gerbang logika
Pertemuan 6 & 7 ars. gerbang logika
Buhori Muslim
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan HotelMakalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Muhammad Iqbal
Perancangan (diagram softekz, dfd level 0,1,2)
Perancangan (diagram softekz, dfd level 0,1,2)Perancangan (diagram softekz, dfd level 0,1,2)
Perancangan (diagram softekz, dfd level 0,1,2)
Joel Marobo
Analisis sistem-informasi
Analisis sistem-informasiAnalisis sistem-informasi
Analisis sistem-informasi
ryanprasetya
Analisis ERD Database Rumah Sakit
Analisis ERD Database Rumah SakitAnalisis ERD Database Rumah Sakit
Analisis ERD Database Rumah Sakit
Fitria Nuri
INTERAKSI MANUSIA DAN KOMPUTER
INTERAKSI MANUSIA DAN KOMPUTERINTERAKSI MANUSIA DAN KOMPUTER
INTERAKSI MANUSIA DAN KOMPUTER
solikin6
Analisis Semantik - P 6 Teknik Kompilasi
Analisis Semantik - P 6 Teknik KompilasiAnalisis Semantik - P 6 Teknik Kompilasi
Analisis Semantik - P 6 Teknik Kompilasi
ahmad haidaroh
Sistem Pendukung Keputusan
Sistem Pendukung KeputusanSistem Pendukung Keputusan
Sistem Pendukung Keputusan
Lia Rusdyana Dewi
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQLKelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Kelompok 8 - Implementasi Role & Privilege pada database Oracle & my SQL
Dejiko Chaem
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAMPENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
PENDEKATAN PERANCANGAN TERSTRUKTUR DATA FLOW DIAGRAM
Muhammad Baihaqi
Basis Data - Pengenalan DML dan DDL
Basis Data - Pengenalan DML dan DDLBasis Data - Pengenalan DML dan DDL
Basis Data - Pengenalan DML dan DDL
Walid Umar
Modul 4 representasi pengetahuan
Modul 4   representasi pengetahuanModul 4   representasi pengetahuan
Modul 4 representasi pengetahuan
ahmad haidaroh
Algoritma Apriori
Algoritma AprioriAlgoritma Apriori
Algoritma Apriori
dedidarwis
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop OnlineERD Sistem Informasi Pemesanan Tiket Bioskop Online
ERD Sistem Informasi Pemesanan Tiket Bioskop Online
Lucha Kamala Putri
Proposal Sistem Informasi Pemesanan Tiket Bioskop Online
Proposal Sistem Informasi Pemesanan Tiket Bioskop OnlineProposal Sistem Informasi Pemesanan Tiket Bioskop Online
Proposal Sistem Informasi Pemesanan Tiket Bioskop Online
Lucha Kamala Putri
Ragam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan KomputerRagam Dialog :: Interaksi Manusia dan Komputer
Ragam Dialog :: Interaksi Manusia dan Komputer
Auliaa Oktarianii
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
[PPT] BAB 2 KONSEP DASAR SISTEM, INFORMASI DAN SISTEM TEKNOLOGI INFORMASI
Dedes ssi
Pertemuan 6 & 7 ars. gerbang logika
Pertemuan 6 & 7 ars. gerbang logikaPertemuan 6 & 7 ars. gerbang logika
Pertemuan 6 & 7 ars. gerbang logika
Buhori Muslim
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan HotelMakalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Makalah Perancangan ERD & LRS Pada Sistem Pemesanan Hotel
Muhammad Iqbal
Perancangan (diagram softekz, dfd level 0,1,2)
Perancangan (diagram softekz, dfd level 0,1,2)Perancangan (diagram softekz, dfd level 0,1,2)
Perancangan (diagram softekz, dfd level 0,1,2)
Joel Marobo
Analisis sistem-informasi
Analisis sistem-informasiAnalisis sistem-informasi
Analisis sistem-informasi
ryanprasetya
Analisis ERD Database Rumah Sakit
Analisis ERD Database Rumah SakitAnalisis ERD Database Rumah Sakit
Analisis ERD Database Rumah Sakit
Fitria Nuri
INTERAKSI MANUSIA DAN KOMPUTER
INTERAKSI MANUSIA DAN KOMPUTERINTERAKSI MANUSIA DAN KOMPUTER
INTERAKSI MANUSIA DAN KOMPUTER
solikin6

Viewers also liked (20)

Belajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining aprioriBelajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining apriori
ilmuBiner
K means Clustering Algorithm
K means Clustering AlgorithmK means Clustering Algorithm
K means Clustering Algorithm
Kasun Ranga Wijeweera
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
aiiniR
Mengenal Rapidminer
Mengenal RapidminerMengenal Rapidminer
Mengenal Rapidminer
Bowo Prasetyo
Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5
ilmuBiner
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
Uofa_Unsada
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
Uofa_Unsada
K means Clustering
K means ClusteringK means Clustering
K means Clustering
Edureka!
Algoritma median
Algoritma medianAlgoritma median
Algoritma median
Khuria Amila
Visualisasi serangan DoS dengan clustering
Visualisasi serangan DoS dengan clusteringVisualisasi serangan DoS dengan clustering
Visualisasi serangan DoS dengan clustering
comnets
Modul clustering data mining modul clustering
Modul clustering data mining modul clusteringModul clustering data mining modul clustering
Modul clustering data mining modul clustering
Universitas Bina Darma Palembang
Windows Server 2008 R2 Failover Cluster
Windows Server 2008 R2 Failover ClusterWindows Server 2008 R2 Failover Cluster
Windows Server 2008 R2 Failover Cluster
Agus Kurniawan
Tutorial dasar-pemrograman-google-maps-api
Tutorial dasar-pemrograman-google-maps-apiTutorial dasar-pemrograman-google-maps-api
Tutorial dasar-pemrograman-google-maps-api
Gien Rockmantic
Minggu10 algoritma genetika
Minggu10   algoritma genetikaMinggu10   algoritma genetika
Minggu10 algoritma genetika
mkbx01
67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani
irhdy
Support Vector Machine
Support Vector MachineSupport Vector Machine
Support Vector Machine
Randy Wihandika
Sistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokokSistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokok
Abdul Fauzan
Data mining
Data miningData mining
Data mining
Agung Apriyadi
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Aris Prasetyo
Belajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining aprioriBelajar mudah algoritma data mining apriori
Belajar mudah algoritma data mining apriori
ilmuBiner
Pert 04 clustering data mining
Pert 04 clustering   data miningPert 04 clustering   data mining
Pert 04 clustering data mining
aiiniR
Mengenal Rapidminer
Mengenal RapidminerMengenal Rapidminer
Mengenal Rapidminer
Bowo Prasetyo
Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5Belajar mudah algoritma data mining c4.5
Belajar mudah algoritma data mining c4.5
ilmuBiner
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
PERANCANGAN DAN PEMBUATAN APLIKASI DATAMINING BERBASIS WEB MENGGUNAKAN ALGORI...
Uofa_Unsada
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
PENERAPAN ALGORITMA APRIORI DALAM MENEMUKAN HUBUNGAN DATA AWAL MASUK DENGAN D...
Uofa_Unsada
K means Clustering
K means ClusteringK means Clustering
K means Clustering
Edureka!
Algoritma median
Algoritma medianAlgoritma median
Algoritma median
Khuria Amila
Visualisasi serangan DoS dengan clustering
Visualisasi serangan DoS dengan clusteringVisualisasi serangan DoS dengan clustering
Visualisasi serangan DoS dengan clustering
comnets
Windows Server 2008 R2 Failover Cluster
Windows Server 2008 R2 Failover ClusterWindows Server 2008 R2 Failover Cluster
Windows Server 2008 R2 Failover Cluster
Agus Kurniawan
Tutorial dasar-pemrograman-google-maps-api
Tutorial dasar-pemrograman-google-maps-apiTutorial dasar-pemrograman-google-maps-api
Tutorial dasar-pemrograman-google-maps-api
Gien Rockmantic
Minggu10 algoritma genetika
Minggu10   algoritma genetikaMinggu10   algoritma genetika
Minggu10 algoritma genetika
mkbx01
67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani67 jurnal skripsi dwi martha - fuzzy mamdani
67 jurnal skripsi dwi martha - fuzzy mamdani
irhdy
Support Vector Machine
Support Vector MachineSupport Vector Machine
Support Vector Machine
Randy Wihandika
Sistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokokSistem informasi prediksi harga kebutuhan bahan pokok
Sistem informasi prediksi harga kebutuhan bahan pokok
Abdul Fauzan
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Implementasi algoritma genetika untuk memprediksi gunung meletus berdasarkan ...
Aris Prasetyo

Similar to Belajar mudah algoritma data mining k means (20)

pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
EriekOrlando
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptxAnalisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
suciayulestari8
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
Kimnur1
LN s10-machine vision-s2
LN s10-machine vision-s2LN s10-machine vision-s2
LN s10-machine vision-s2
Binus Online Learning
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
AbdulMajid84127
K-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptxK-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptx
GemmaDwiPrasetya
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
PandeKadek3
Clusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdfClusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdf
FadlyFebriya2
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
Adam Superman
Analisis Cluster
Analisis ClusterAnalisis Cluster
Analisis Cluster
Kurnia Millati
Data mining 7
Data mining 7Data mining 7
Data mining 7
dedidarwis
Presentasi Materi Data Maning klasifikasi
Presentasi Materi Data Maning klasifikasiPresentasi Materi Data Maning klasifikasi
Presentasi Materi Data Maning klasifikasi
Andri946883
Algoritma Klasifikasi K-Means Clustering.pptx
Algoritma Klasifikasi K-Means Clustering.pptxAlgoritma Klasifikasi K-Means Clustering.pptx
Algoritma Klasifikasi K-Means Clustering.pptx
anirmakandidagtg15
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Elvi Rahmi
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdf
HendroGunawan8
Machine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdf
HendroGunawan8
Ukuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.pptUkuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.ppt
HusniAsnawi
Pengurutan (Sorting)
Pengurutan (Sorting)Pengurutan (Sorting)
Pengurutan (Sorting)
Materi Kuliah Online
Analisis klaster
Analisis klasterAnalisis klaster
Analisis klaster
Institut Teknologi Bandung
pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_ke_9_sistem_cerdas pert_...
EriekOrlando
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptxAnalisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
Analisis Cluster-Teknik data mining perpisahan objek sesuai karakteristikpptx
suciayulestari8
KMeans.pdf
KMeans.pdfKMeans.pdf
KMeans.pdf
Kimnur1
PPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptxPPT_Data_Mining_Kel_3.pptx
PPT_Data_Mining_Kel_3.pptx
AbdulMajid84127
K-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptxK-MEANS CLUSTERING.pptx
K-MEANS CLUSTERING.pptx
GemmaDwiPrasetya
Clustering _IgedeAris.ppt
Clustering _IgedeAris.pptClustering _IgedeAris.ppt
Clustering _IgedeAris.ppt
PandeKadek3
Clusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdfClusteringgggggggggggggggfffffffffffg.pdf
Clusteringgggggggggggggggfffffffffffg.pdf
FadlyFebriya2
K-Means Clustering.ppt
K-Means Clustering.pptK-Means Clustering.ppt
K-Means Clustering.ppt
Adam Superman
Data mining 7
Data mining 7Data mining 7
Data mining 7
dedidarwis
Presentasi Materi Data Maning klasifikasi
Presentasi Materi Data Maning klasifikasiPresentasi Materi Data Maning klasifikasi
Presentasi Materi Data Maning klasifikasi
Andri946883
Algoritma Klasifikasi K-Means Clustering.pptx
Algoritma Klasifikasi K-Means Clustering.pptxAlgoritma Klasifikasi K-Means Clustering.pptx
Algoritma Klasifikasi K-Means Clustering.pptx
anirmakandidagtg15
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdfKlasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Klasterisasi - AHC (Agglomerative Hierarchical Clustering).pdf
Elvi Rahmi
Machine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdfMachine Learning Diskusi 10.pdf
Machine Learning Diskusi 10.pdf
HendroGunawan8
Machine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdfMachine Learning Diskusi 9.pdf
Machine Learning Diskusi 9.pdf
HendroGunawan8
Ukuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.pptUkuran_Pemusatan_s1.ppt
Ukuran_Pemusatan_s1.ppt
HusniAsnawi

Belajar mudah algoritma data mining k means

  • 1. ilmubiner@gmail.com Data Mining http://ilmubiner.blogspot.com Belajar Mudah Algoritma Data Mining Clustering : k-means Clustering atau analisis cluster adalah : Proses pembentukan kelompok data (cluster) dari himpunan data yang tidak diketahui kelompok-kelompok atau kelas-kelasnya. Proses menentukan data-data termasuk ke dalam cluster yang mana. Bisa dibilang, clustering merupakan proses untuk mengetahui kelas-kelas atau taksonomi atau botryologi, atau analisis topologi dari data-data yang ada. Dilihat dari kacamata data mining, clustering bukanlah proses klasifikasi. Karena dalam proses klasifikasi, data dikelompokkan ke dalam kelas-kelas yang telah diketahui sebelumnya. Ada beberapa metode atau model untuk melakukan clustering, antara lain : Model connectivity. Model centroid. Model density. Model subspace. Model group. Model graph based. Algoritma k-means merupakan model centroid. Model centroid adalah model yang menggunakan centroid untuk membuat cluster. Centroid adalah titik tengah suatu cluster. Centroid berupa nilai. Centroid digunakan untuk menghitung jarak suatu objek data terhadap centroid. Suatu objek data termasuk dalam suatu cluster jika memiliki jarak terpendek terhadap centroid cluster tersebut. Secara umum algoritma k-means adalah : 1. Menentukan banyaknya cluster (k). 2. Menentukan centroid. 3. Apakah centroid-nya berubah? a. Jika ya, hitung jarak data dari centroid. b. Jikat tidak, selesai. 4. Mengelompokkan data berdasarkan jarak yang terdekat. Diagram alir (flowchart) algoritma k-means ada pada Gambar 1. Sedangkan Gambar 2 merupakan contoh posisi titik-titik data dan centroid-centroid-nya (lingkaran yang lebih besar. Gambar 1. Diagram Alir Algoritma k-means Page 1 of 5
  • 2. ilmubiner@gmail.com Data Mining http://ilmubiner.blogspot.com Untuk lebih jelasnya, berikut pembahasan pemakaian algoritma k-means. Tabel 1 berisi data sumber yang akan dianalisis cluster-nya : Tabel 1. Data Sumber n 1 2 3 4 a 1 2 4 5 b 1 1 3 4 Gambar 2. Contoh Cluster 1. Tentukan banyaknya cluster adalah dua (k = 2) yang akan dibuat. Banyaknya cluster harus lebih kecil dari pada banyaknya data (k < n). 2. Tentukan centroid setiap cluster. Untuk menentukan centroid awal (initial centroid) banyak metode yang dapat digunakan. Di sini metode yang digunakan adalah mengambil data dari data sumber, secara acak atau random (Sel yang berwarna kuning dan hijau di Tabel 1). Tabel 2. Centroid pada Pengulangan ke-0 c1 c2 a 1 2 b 1 1 Untuk pengulangan berikutnya (pengulangan ke-1 sampai selesai), centroid baru dihitung dengan menghitung nilai rata-rata data pada setiap cluster. Jika centroid baru berbeda dengan centroid sebelumnya, maka proses dilanjutkan ke langkah berikutnya. Namun jika centroid yang baru dihitung sama dengan centroid sebelumnya, maka proses clustering selesai. 3. Hitung jarak data dengan centroid. Rumus-rumus untuk menghitung jarak antara lain : a. Euclidean. b. Manhattan / City Block. c. Minkowski. Rumus yang digunakan di sini adalah rumus Euclidean Distance : Page 2 of 5
  • 3. ilmubiner@gmail.com = = = = = , Data Mining = ( http://ilmubiner.blogspot.com ) Jarak data dengan cluster 1 adalah : ( , ) = ( ( +, ) = ( ( , ( , ) = ( ) = ( % + ) +( ) +( ) +( ) +( % + !) = (1 1) + (1 1) = 0 !) = (5 1) + (4 1) = 5 !) !) = = (2 1) + (1 1) = 1 (4 1) + (3 1) = 3.605551 Jarak data dengan cluster 2 adalah : ( , ) = ( ( +, ) = ( ( , ( , ) = ( ) = ( % + ) +( ) +( ) +( ) +( % + !) = (1 2) + (1 1) = 1 !) = (5 2) + (4 1) = 4.242641 !) !) = = (2 2) + (1 1) = 0 (4 2) + (3 1) = 2.828427 Untuk seterusnya, hitung jarak pada setiap baris data, dan hasilnya seperti pada Tabel 3. Tabel 3. Hasil Perhitungan Jarak n 1 2 3 4 a 1 2 4 5 b 1 1 3 4 dc1 dc2 0 1 1 0 3.605551 2.828427 5 4.242641 4. Kelompokkan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak terpendek. Contoh; karena ( , ) < ( , ) maka masuk ke dalam cluster 1. Pada Tabel 4, data n = 1 masuk ke dalam cluster 1 karena dc1 < dc2, sedangkan data n = 2, 3, 4 masuk ke dalam cluster 2 karena dc2 < dc1. Page 3 of 5
  • 4. ilmubiner@gmail.com Data Mining http://ilmubiner.blogspot.com Tabel 4. Hasil Perhitungan Jarak dan Pengelompokkan Data n 1 2 3 4 a 1 2 4 5 b 1 1 3 4 dc1 dc2 0 1 1 0 3.605551 2.828427 5 4.242641 c1 Ok c2 Ok Ok Ok 5. Proses kembali lagi ke langkah no. 2. Untuk hasil clustering yang lebih lengkap, berikut tabel-tabel hasil analisis dan perhitungan dari awal sampai selesai : Inisialisasi n 1 2 3 4 a 1 2 4 5 b 1 1 3 4 c1 c2 a 1 2 b 1 1 n 1 2 3 4 a 1 2 4 5 b 1 1 3 4 dc1 dc2 0 1 1 0 3.605551 2.828427 5 4.242641 c1 Ok c2 Ok Ok Ok Pengulangan ke-1 c1 c2 n 1 2 3 4 a b Nilai pada sel diperoleh dari menghitung 1 1 rata-rata pada tabel di atasnya sesuai 3.666667 2.666667 dengan warna sel a 1 2 4 5 b 1 1 3 4 dc1 dc2 0 3.14466 1 2.357023 3.605551 0.471405 5 1.885618 Page 4 of 5 c1 Ok Ok c2 Ok Ok