ºÝºÝߣ

ºÝºÝߣShare a Scribd company logo
Decission Tree C45
putu.sundika@gmail.com
DATA SET :

CUACA        JARAK    PEMAKAIAN   PELANGGANDATANG
berawan      dekat    normal      ya       yes
berawan      jauh     normal      tidak    no
berawan      jauh     tinggi      tidak    no
berawan      sedang   tinggi      ya       yes
cerah        dekat    normal      tidak    yes
cerah        jauh     tinggi      tidak    no
cerah        jauh     tinggi      ya       yes
cerah        sedang   normal      ya       yes
cerah        sedang   tinggi      tidak    no
hujan        dekat    normal      tidak    no
hujan        dekat    normal      ya       yes
hujan        sedang   normal      tidak    no
hujan        sedang   tinggi      ya       yes
hujan        sedang   tinggi      tidak    yes
E=Entropy, G=Gain Informasi

1                                          I(yes,no)
        CUACA        DATANG       Jumlah   I(8,6)      0.461346 0.523882 0.985228
       berawan         no           2      I(2,2)            0.5      0.5       1
                       yes          2      I(3,2)      0.442179 0.528771        0
         cerah         no           2      I(3,2)      0.442179 0.528771 0.970951
                       yes          3      E(Cuaca)    0.632482
         hujan         no           2      G(Cuaca)    0.352746
                       yes          3
                                    14

        JARAK        DATANG       Jumlah   I(9,5)      0.461346 0.523882 0.985228
         jauh          no           3      I(2,2)            0.5 0.311278 0.811278
                       yes          1      I(4,2)      0.311278        0.5 0.811278
         dekat         no           1      I(3,1)      0.389975 0.528321 0.918296
                       yes          3      E(JARAK)    0.857143
        sedang         no           2      G(JARAK)    0.128085
                       yes          4
                                    14

     PEMAKAIAN        PLAY        Jumlah   I(9,5)      0.461346 0.523882 0.985228
       normal          no           3      I(3,4)      0.461346 0.523882 0.985228
                       yes          4      I(6,1)      0.461346 0.523882 0.985228
         tinggi        no           3      E(PAKAI)    0.985228
                       yes          4      G(PAKAI)           0
                                    14

     PELANGGAN        PLAY        Jumlah   I(9,5)      0.461346 0.523882 0.985228
         ya            no           0      I(3,4)              0 #NUM!           0
                       yes          6      I(6,1)            0.5 0.311278 0.811278
         tidak         no           6      E(WIND)     0.463587
                       yes          2      G(WIND)     0.521641
                                    14

2   PELANGGAN = TIDAK
        CUACA      DATANG         Jumlah   I(8,6)            0.5 0.311278 0.811278
       berawan        no            2      I(2,2)      #NUM!            0        0
                      yes           0      I(3,2)      0.528321 0.389975 0.918296
         cerah        no            2      I(3,2)      0.528321 0.389975 0.918296
                      yes           1      E(Cuaca)    0.688722
         hujan        no            2      G(Cuaca)    0.122556
                      yes           1
                                    8

        JARAK        DATANG       Jumlah   I(9,5)          0.5 0.311278 0.811278
         jauh          no           3      I(2,2)      #NUM!          0        0
yes       0      I(4,2)           0.5      0.5       1
           dekat       no        1      I(3,1)     0.528321 0.389975 0.918296
                       yes       1      E(JARAK)   0.594361
          sedang       no        2      G(JARAK)   0.216917
                       yes       1
                                 8

       PEMAKAIAN       PLAY    Jumlah   I(9,5)           0.5 0.311278 0.811278
         normal         no       3      I(3,1)           0.5 0.311278 0.811278
                        yes      1      I(1,3)           0.5 0.311278 0.811278
           tinggi       no       3      E(PAKAI)   0.811278
                        yes      1      G(PAKAI)           0
                                 8

2.1   JARAK = dekat
          CUACA       DATANG   Jumlah   I(8,6)          0.5       0.5       1
         berawan        no       0      I(2,2)     #DIV/0!   #DIV/0!        0
                        yes      0      I(3,2)             0 #NUM!          0
           cerah        no       0      I(3,2)     #NUM!             0      0
                        yes      1      E(Cuaca)           0
           hujan        no       1      G(Cuaca)           1
                        yes      0
                                 2

       PEMAKAIAN       PLAY    Jumlah   I(9,5)          0.5       0.5       1
         normal         no       1      I(3,1)          0.5       0.5       1
                        yes      1      I(1,3)     #DIV/0!   #DIV/0!        0
           tinggi       no       0      E(PAKAI)           1
                        yes      0      G(PAKAI)           0
                                 2

2.2   JARAK =sedang
          CUACA       DATANG   Jumlah   I(8,6)     0.528321 0.389975 0.918296
         berawan        no       0      I(2,2)     #DIV/0!   #DIV/0!        0
                        yes      0      I(3,2)     #NUM!             0      0
           cerah        no       1      I(3,2)           0.5      0.5       0
                        yes      0      E(Cuaca)           0
           hujan        no       1      G(Cuaca)   0.918296
                        yes      1
                                 3

       PEMAKAIAN       PLAY    Jumlah   I(9,5)     0.528321 0.389975 0.918296
         normal         no       1      I(3,1)     #NUM!            0       0
                        yes      0      I(1,3)           0.5      0.5       0
           tinggi       no       1      E(PAKAI)           0
                        yes      1      G(PAKAI)   0.918296
                                 3
2.2.1 CUACA = Hujan
        PEMAKAIAN     PLAY   Jumlah   I(9,5)     #NUM!       0   0
          normal       no      1      I(3,1)     #NUM!       0   0
                       yes     0      I(1,3)     #NUM!       0   0
          tinggi       no      1      E(PAKAI)           0
                       yes     0      G(PAKAI)           0
                               2
Cara Membuat Model Tree dan Bagaimana Menemukan Klas
berikut adalah cara membuat model tree dan bagaimana mesin dapat menemukan klasnya

        1 Menghitung Informasi (I) untuk seluruh sample tiap class




          dengan pi adalah probabilitas sample kelas Ci :


        2 Mencari Entrophy masing-masing Atribut




        3 Mencari besar Gain Informasi masing-masing atribut




        4 Memilih Gain Informasi yang terbesar untuk digunakan sebagai root
          pada model tree yang akan dibuat
        5 Setiap kali attribut terpilih, maka dihitung lagi dengan hanya menggunakan
          Data Set untuk atribut itu saja
        6 Tree tidak bercabang lagi saat nilai I = 0, dianggap sudah menemukan klasnya
RULE :
         1   IF Pelanggan THEN Come=Yes
         2   IF Bukan Pelanggan ^ Jarak Jauh THEN Come=No
         3   IF Bukan Pelanggan ^ Jarak Dekat ^ Cerah THEN Come=Yes
         4   IF Bukan Pelanggan ^ Jarak Dekat ^ Hujan THEN Come=No
         5   IF Bukan Pelanggan ^ Jarak Dekat ^ Berawan THEN Come=Yes/No ?
         6   IF Bukan Pelanggan ^ Jarak Sedang ^ Cerah THEN Come=Yes
         7   IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian tinggi THEN Come=Yes
         8   IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian normal THEN Come=No
         9   IF Bukan Pelanggan ^ Jarak Sedang ^ Berawan THEN Come=Yes/No ?

More Related Content

C45 sample case

  • 2. DATA SET : CUACA JARAK PEMAKAIAN PELANGGANDATANG berawan dekat normal ya yes berawan jauh normal tidak no berawan jauh tinggi tidak no berawan sedang tinggi ya yes cerah dekat normal tidak yes cerah jauh tinggi tidak no cerah jauh tinggi ya yes cerah sedang normal ya yes cerah sedang tinggi tidak no hujan dekat normal tidak no hujan dekat normal ya yes hujan sedang normal tidak no hujan sedang tinggi ya yes hujan sedang tinggi tidak yes
  • 3. E=Entropy, G=Gain Informasi 1 I(yes,no) CUACA DATANG Jumlah I(8,6) 0.461346 0.523882 0.985228 berawan no 2 I(2,2) 0.5 0.5 1 yes 2 I(3,2) 0.442179 0.528771 0 cerah no 2 I(3,2) 0.442179 0.528771 0.970951 yes 3 E(Cuaca) 0.632482 hujan no 2 G(Cuaca) 0.352746 yes 3 14 JARAK DATANG Jumlah I(9,5) 0.461346 0.523882 0.985228 jauh no 3 I(2,2) 0.5 0.311278 0.811278 yes 1 I(4,2) 0.311278 0.5 0.811278 dekat no 1 I(3,1) 0.389975 0.528321 0.918296 yes 3 E(JARAK) 0.857143 sedang no 2 G(JARAK) 0.128085 yes 4 14 PEMAKAIAN PLAY Jumlah I(9,5) 0.461346 0.523882 0.985228 normal no 3 I(3,4) 0.461346 0.523882 0.985228 yes 4 I(6,1) 0.461346 0.523882 0.985228 tinggi no 3 E(PAKAI) 0.985228 yes 4 G(PAKAI) 0 14 PELANGGAN PLAY Jumlah I(9,5) 0.461346 0.523882 0.985228 ya no 0 I(3,4) 0 #NUM! 0 yes 6 I(6,1) 0.5 0.311278 0.811278 tidak no 6 E(WIND) 0.463587 yes 2 G(WIND) 0.521641 14 2 PELANGGAN = TIDAK CUACA DATANG Jumlah I(8,6) 0.5 0.311278 0.811278 berawan no 2 I(2,2) #NUM! 0 0 yes 0 I(3,2) 0.528321 0.389975 0.918296 cerah no 2 I(3,2) 0.528321 0.389975 0.918296 yes 1 E(Cuaca) 0.688722 hujan no 2 G(Cuaca) 0.122556 yes 1 8 JARAK DATANG Jumlah I(9,5) 0.5 0.311278 0.811278 jauh no 3 I(2,2) #NUM! 0 0
  • 4. yes 0 I(4,2) 0.5 0.5 1 dekat no 1 I(3,1) 0.528321 0.389975 0.918296 yes 1 E(JARAK) 0.594361 sedang no 2 G(JARAK) 0.216917 yes 1 8 PEMAKAIAN PLAY Jumlah I(9,5) 0.5 0.311278 0.811278 normal no 3 I(3,1) 0.5 0.311278 0.811278 yes 1 I(1,3) 0.5 0.311278 0.811278 tinggi no 3 E(PAKAI) 0.811278 yes 1 G(PAKAI) 0 8 2.1 JARAK = dekat CUACA DATANG Jumlah I(8,6) 0.5 0.5 1 berawan no 0 I(2,2) #DIV/0! #DIV/0! 0 yes 0 I(3,2) 0 #NUM! 0 cerah no 0 I(3,2) #NUM! 0 0 yes 1 E(Cuaca) 0 hujan no 1 G(Cuaca) 1 yes 0 2 PEMAKAIAN PLAY Jumlah I(9,5) 0.5 0.5 1 normal no 1 I(3,1) 0.5 0.5 1 yes 1 I(1,3) #DIV/0! #DIV/0! 0 tinggi no 0 E(PAKAI) 1 yes 0 G(PAKAI) 0 2 2.2 JARAK =sedang CUACA DATANG Jumlah I(8,6) 0.528321 0.389975 0.918296 berawan no 0 I(2,2) #DIV/0! #DIV/0! 0 yes 0 I(3,2) #NUM! 0 0 cerah no 1 I(3,2) 0.5 0.5 0 yes 0 E(Cuaca) 0 hujan no 1 G(Cuaca) 0.918296 yes 1 3 PEMAKAIAN PLAY Jumlah I(9,5) 0.528321 0.389975 0.918296 normal no 1 I(3,1) #NUM! 0 0 yes 0 I(1,3) 0.5 0.5 0 tinggi no 1 E(PAKAI) 0 yes 1 G(PAKAI) 0.918296 3
  • 5. 2.2.1 CUACA = Hujan PEMAKAIAN PLAY Jumlah I(9,5) #NUM! 0 0 normal no 1 I(3,1) #NUM! 0 0 yes 0 I(1,3) #NUM! 0 0 tinggi no 1 E(PAKAI) 0 yes 0 G(PAKAI) 0 2
  • 6. Cara Membuat Model Tree dan Bagaimana Menemukan Klas berikut adalah cara membuat model tree dan bagaimana mesin dapat menemukan klasnya 1 Menghitung Informasi (I) untuk seluruh sample tiap class dengan pi adalah probabilitas sample kelas Ci : 2 Mencari Entrophy masing-masing Atribut 3 Mencari besar Gain Informasi masing-masing atribut 4 Memilih Gain Informasi yang terbesar untuk digunakan sebagai root pada model tree yang akan dibuat 5 Setiap kali attribut terpilih, maka dihitung lagi dengan hanya menggunakan Data Set untuk atribut itu saja 6 Tree tidak bercabang lagi saat nilai I = 0, dianggap sudah menemukan klasnya
  • 7. RULE : 1 IF Pelanggan THEN Come=Yes 2 IF Bukan Pelanggan ^ Jarak Jauh THEN Come=No 3 IF Bukan Pelanggan ^ Jarak Dekat ^ Cerah THEN Come=Yes 4 IF Bukan Pelanggan ^ Jarak Dekat ^ Hujan THEN Come=No 5 IF Bukan Pelanggan ^ Jarak Dekat ^ Berawan THEN Come=Yes/No ? 6 IF Bukan Pelanggan ^ Jarak Sedang ^ Cerah THEN Come=Yes 7 IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian tinggi THEN Come=Yes 8 IF Bukan Pelanggan ^ Jarak Sedang ^ Hujan ^ pemakaian normal THEN Come=No 9 IF Bukan Pelanggan ^ Jarak Sedang ^ Berawan THEN Come=Yes/No ?