Dokumen tersebut berisi data set cuaca, jarak, pemakaian, dan pelanggan datang. Data set tersebut digunakan untuk membangun model pohon keputusan (decision tree) C4.5 untuk memprediksi apakah pelanggan akan datang berdasarkan atribut-atribut tersebut. Dokumen ini juga menjelaskan cara kerja algoritma C4.5 untuk membangun model pohon keputusan dan menemukan kelasnya.
2. DATA SET :
CUACA JARAK PEMAKAIAN PELANGGANDATANG
berawan dekat normal ya yes
berawan jauh normal tidak no
berawan jauh tinggi tidak no
berawan sedang tinggi ya yes
cerah dekat normal tidak yes
cerah jauh tinggi tidak no
cerah jauh tinggi ya yes
cerah sedang normal ya yes
cerah sedang tinggi tidak no
hujan dekat normal tidak no
hujan dekat normal ya yes
hujan sedang normal tidak no
hujan sedang tinggi ya yes
hujan sedang tinggi tidak yes
3. E=Entropy, G=Gain Informasi
1 I(yes,no)
CUACA DATANG Jumlah I(8,6) 0.461346 0.523882 0.985228
berawan no 2 I(2,2) 0.5 0.5 1
yes 2 I(3,2) 0.442179 0.528771 0
cerah no 2 I(3,2) 0.442179 0.528771 0.970951
yes 3 E(Cuaca) 0.632482
hujan no 2 G(Cuaca) 0.352746
yes 3
14
JARAK DATANG Jumlah I(9,5) 0.461346 0.523882 0.985228
jauh no 3 I(2,2) 0.5 0.311278 0.811278
yes 1 I(4,2) 0.311278 0.5 0.811278
dekat no 1 I(3,1) 0.389975 0.528321 0.918296
yes 3 E(JARAK) 0.857143
sedang no 2 G(JARAK) 0.128085
yes 4
14
PEMAKAIAN PLAY Jumlah I(9,5) 0.461346 0.523882 0.985228
normal no 3 I(3,4) 0.461346 0.523882 0.985228
yes 4 I(6,1) 0.461346 0.523882 0.985228
tinggi no 3 E(PAKAI) 0.985228
yes 4 G(PAKAI) 0
14
PELANGGAN PLAY Jumlah I(9,5) 0.461346 0.523882 0.985228
ya no 0 I(3,4) 0 #NUM! 0
yes 6 I(6,1) 0.5 0.311278 0.811278
tidak no 6 E(WIND) 0.463587
yes 2 G(WIND) 0.521641
14
2 PELANGGAN = TIDAK
CUACA DATANG Jumlah I(8,6) 0.5 0.311278 0.811278
berawan no 2 I(2,2) #NUM! 0 0
yes 0 I(3,2) 0.528321 0.389975 0.918296
cerah no 2 I(3,2) 0.528321 0.389975 0.918296
yes 1 E(Cuaca) 0.688722
hujan no 2 G(Cuaca) 0.122556
yes 1
8
JARAK DATANG Jumlah I(9,5) 0.5 0.311278 0.811278
jauh no 3 I(2,2) #NUM! 0 0
4. yes 0 I(4,2) 0.5 0.5 1
dekat no 1 I(3,1) 0.528321 0.389975 0.918296
yes 1 E(JARAK) 0.594361
sedang no 2 G(JARAK) 0.216917
yes 1
8
PEMAKAIAN PLAY Jumlah I(9,5) 0.5 0.311278 0.811278
normal no 3 I(3,1) 0.5 0.311278 0.811278
yes 1 I(1,3) 0.5 0.311278 0.811278
tinggi no 3 E(PAKAI) 0.811278
yes 1 G(PAKAI) 0
8
2.1 JARAK = dekat
CUACA DATANG Jumlah I(8,6) 0.5 0.5 1
berawan no 0 I(2,2) #DIV/0! #DIV/0! 0
yes 0 I(3,2) 0 #NUM! 0
cerah no 0 I(3,2) #NUM! 0 0
yes 1 E(Cuaca) 0
hujan no 1 G(Cuaca) 1
yes 0
2
PEMAKAIAN PLAY Jumlah I(9,5) 0.5 0.5 1
normal no 1 I(3,1) 0.5 0.5 1
yes 1 I(1,3) #DIV/0! #DIV/0! 0
tinggi no 0 E(PAKAI) 1
yes 0 G(PAKAI) 0
2
2.2 JARAK =sedang
CUACA DATANG Jumlah I(8,6) 0.528321 0.389975 0.918296
berawan no 0 I(2,2) #DIV/0! #DIV/0! 0
yes 0 I(3,2) #NUM! 0 0
cerah no 1 I(3,2) 0.5 0.5 0
yes 0 E(Cuaca) 0
hujan no 1 G(Cuaca) 0.918296
yes 1
3
PEMAKAIAN PLAY Jumlah I(9,5) 0.528321 0.389975 0.918296
normal no 1 I(3,1) #NUM! 0 0
yes 0 I(1,3) 0.5 0.5 0
tinggi no 1 E(PAKAI) 0
yes 1 G(PAKAI) 0.918296
3
5. 2.2.1 CUACA = Hujan
PEMAKAIAN PLAY Jumlah I(9,5) #NUM! 0 0
normal no 1 I(3,1) #NUM! 0 0
yes 0 I(1,3) #NUM! 0 0
tinggi no 1 E(PAKAI) 0
yes 0 G(PAKAI) 0
2
6. Cara Membuat Model Tree dan Bagaimana Menemukan Klas
berikut adalah cara membuat model tree dan bagaimana mesin dapat menemukan klasnya
1 Menghitung Informasi (I) untuk seluruh sample tiap class
dengan pi adalah probabilitas sample kelas Ci :
2 Mencari Entrophy masing-masing Atribut
3 Mencari besar Gain Informasi masing-masing atribut
4 Memilih Gain Informasi yang terbesar untuk digunakan sebagai root
pada model tree yang akan dibuat
5 Setiap kali attribut terpilih, maka dihitung lagi dengan hanya menggunakan
Data Set untuk atribut itu saja
6 Tree tidak bercabang lagi saat nilai I = 0, dianggap sudah menemukan klasnya
7. RULE :
1 IF Pelanggan THEN Come=Yes
2 IF Bukan Pelanggan ^ Jarak Jauh THEN Come=No
3 IF Bukan Pelanggan ^ Jarak Dekat ^ Cerah THEN Come=Yes
4 IF Bukan Pelanggan ^ Jarak Dekat ^ Hujan THEN Come=No
5 IF Bukan Pelanggan ^ Jarak Dekat ^ Berawan THEN Come=Yes/No ?
6 IF Bukan Pelanggan ^ Jarak Sedang ^ Cerah THEN Come=Yes
7 IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian tinggi THEN Come=Yes
8 IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian normal THEN Come=No
9 IF Bukan Pelanggan ^ Jarak Sedang ^ Berawan THEN Come=Yes/No ?