Dokumen ini menjelaskan proses klasifikasi dokumen teks menggunakan metode Naive Bayes. Terdapat data latih yang terdiri dari beberapa dokumen dan frekuensi kata-kata, serta data uji untuk ditentukan kategorinya secara otomatis dengan menghitung probabilitas kata-kata pada setiap kategori.
1 of 1
Download to read offline
More Related Content
Coba NBC
1. Data Latih Data Uji
kategori kategori
dokumenkata kata 1 kata 2 kata 3 kata 4 kata 5 secara dokumenkata kata 1 kata 2 kata 3 kata 4 kata 5 secara
manual otomatis
dok. latih 1 0 1 3 0 8 a dok.test 1 5 3 8 0 1 a
dok. latih 2 3 0 8 1 4 b dok.test 2 0 0 3 6 7 b
dok. latih 3 0 4 5 0 1 a
dok. latih 4 6 4 0 0 7 a
dok. latih 5 8 0 1 5 5 b
Menentukan Kategori Dok.test
vMAP arg max P (v j ) i P ai | v j
vj v
|docs a| 3 n(kata) pd kategori a 39 dok.test 1 dok.test 2
|docs b| 2 n(kata) pd kategori b 35 P(a) 0.0017 0.0011
P(b) 0.0002 0.0044
|contoh| 5 docs j max 0.0017 0.0044
P (v j )
|kosakata| 5 contoh
P(Va) 0.6
n(kata 1) pada kategori a 6 P(Vb) 0.4
n(kata 1) pada kategori b 11
nk 1
P(ai | v j )
n(kata 2) pada kategori a n kosakata
9
n(kata 2) pada kategori b 0 P(kata1|a) 0.1591
P(kata1|b) 0.3000
n(kata 3) pada kategori a 8 P(kata2|a) 0.2273
n(kata 3) pada kategori b 9 P(kata2|b) 0.0250
P(kata3|a) 0.2045
n(kata 4) pada kategori a 0 P(kata3|b) 0.2500
n(kata 4) pada kategori b 6 p(kata4|a) 0.0227
p(kata4|b) 0.1750
n(kata 5) pada kategori a 16 P(kata5|a) 0.3864
n(kata 5) pada kategori b 9 P(kata5|b) 0.2500