際際滷

際際滷Share a Scribd company logo
dataHacker.rs
kNN (k Nearest Neighbors) 
k najbli転i sused
http://datahacker.rs/007-knn/
dataHacker.rs
Kako kNN radi?
 k Nearest Neighbors za svaki element iz skupa podataka
prvo defini邸e razdaljinu od susednih elemenata.
 Ta razdaljina mo転e da predstavlja rastojanje izmeu dve
take.
 Parametar k biramo mi i on utie na broj suseda za jednu
taku koju ispitujemo u njegovoj okolini.
dataHacker.rs
Kreiranje klase
 Defini邸emo dve klase elemenata tako 邸to
emo runo napraviti elemente klase.
 Neka elementi klase 1 budu take
koordinatnog sistema sa pozitivnim
koeficijentima, a elementi klase 2 sa
negativnim.
dataHacker.rs
Klasifikacija novih podataka
 Na sledeoj slici prikazan je osnovni nain rada kNN algoritma.
 Novi podatak za klasifikaciju e biti rasporeen u onu klasu koja
ima vi邸e taaka (podataka) u blizini novog podatka.
dataHacker.rs
Definisanje nove take
 Zamislimo da dobijemo novu taku (2,1) koja predstavlja test
skup.
 Na邸 zadatak je da odredimo da li ona pripada klasi 1 ili klasi 2.
dataHacker.rs
Parametar k
 Parametar k kNN algoritma je pode邸en na vrednost 3.
 Pronaimo 3 najbli転e take na邸oj test taki.
 kNN algoritam e izbrojati najbli転e take i primenit tzv. majority
vote: 3-0 u korsit klase 1, pa e taka pripasti klasi 1.
dataHacker.rs
kNN tok algoritma u sklearn
dataHacker.rs
kNN i Iris dataset
Primena kNN algoritam na Iris dataset
dataHacker.rs
Shuffle
Da bismo na sluajan nain birali cvetove iz sva tri skupa mo転emo da
se poslu転imo naredbom .random.shuffle().
dataHacker.rs
Training vs Test
Trening i test set
Prvih 80% podataka iskoristiemo za pravljenje na邸eg trening
dataset-a, preostalih 20% koristiemo za pravljenje test skupa.
dataHacker.rs
Predikcija
Nakon 邸to inicijalizujemo vrednost klasifikatora na 5, proslediemo
test skup i pokrenuti algoritam naredbom .predict(X_test) i
sauvati rezultat kalsifikacije.
dataHacker.rs
Vizualizacija podataka
dataHacker.rs
Vizualizacija podataka
dataHacker.rs
Biblioteka seaborn
Pored biblioteke matplotlib, esto se koristi i biblioteka seaborn.
Seaborn omoguava praveljenje veoma lepih i korisnih grafika za
Exploratory Data Analysis  EDA.
dataHacker.rs
Biblioteka seaborn
Prikaz prvih pet redova iris dataset-a
dataHacker.rs
Vizualizacija podataka

More Related Content

kNN algorithm za Iris dataset