2. dataHacker.rs
Kako kNN radi?
k Nearest Neighbors za svaki element iz skupa podataka
prvo defini邸e razdaljinu od susednih elemenata.
Ta razdaljina mo転e da predstavlja rastojanje izmeu dve
take.
Parametar k biramo mi i on utie na broj suseda za jednu
taku koju ispitujemo u njegovoj okolini.
3. dataHacker.rs
Kreiranje klase
Defini邸emo dve klase elemenata tako 邸to
emo runo napraviti elemente klase.
Neka elementi klase 1 budu take
koordinatnog sistema sa pozitivnim
koeficijentima, a elementi klase 2 sa
negativnim.
4. dataHacker.rs
Klasifikacija novih podataka
Na sledeoj slici prikazan je osnovni nain rada kNN algoritma.
Novi podatak za klasifikaciju e biti rasporeen u onu klasu koja
ima vi邸e taaka (podataka) u blizini novog podatka.
5. dataHacker.rs
Definisanje nove take
Zamislimo da dobijemo novu taku (2,1) koja predstavlja test
skup.
Na邸 zadatak je da odredimo da li ona pripada klasi 1 ili klasi 2.
6. dataHacker.rs
Parametar k
Parametar k kNN algoritma je pode邸en na vrednost 3.
Pronaimo 3 najbli転e take na邸oj test taki.
kNN algoritam e izbrojati najbli転e take i primenit tzv. majority
vote: 3-0 u korsit klase 1, pa e taka pripasti klasi 1.
10. dataHacker.rs
Training vs Test
Trening i test set
Prvih 80% podataka iskoristiemo za pravljenje na邸eg trening
dataset-a, preostalih 20% koristiemo za pravljenje test skupa.