ݺߣ

ݺߣShare a Scribd company logo
Machine Learning
dla developerów
Krzysztof Kędzierski, 23.08.2017
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Windykacja – maksymalizacja zysku
• 10 000 spraw
• Cena - 15% wartości nominalnej
• Kwoty od 15 groszy do 300 000zł
• Pełne dane o historii zadłużenia
• Pełne dane o dłużniku
Problem?
Dla danego dłużnika przydziel kategorię z grupy:
Windykacja telefoniczna
Windykacja terenowa
Windykacja komornicza
Rezygnacja
Podejście standardowe
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
• Młody dłużnik spłaca lepiej niż stary
• Dłużnik z miasta spłaca lepiej
• Emeryci spłacają jak komornik siada na emeryturę
• Większy dług to większy potencjalny zarobek
• Poniżej 200zł nie opłaca się windykować
• Jak telefon jest nieaktualny to nie ma sensu dzwonić
• Jak się przedawni to nie ściągniemy nic
• Itd..
I 200 innych mądrych reguł…
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
powstanie silnik reguł
oparty o współczynniki wyliczone
za pomocą estymacji metodą LWPzD…
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
GAME CHANGER…
WARTOŚCIOWE DANE HISTORYCZNE
Machine Learning
=
wyszukiwanie wzorów w danych
Podejście machine learning
dług wiek typ długu zawód zysk forma
300000 40 hipoteka kierowca 100000 komornik
400 70 telefon emeryt 300 telefon
7000 28 gotówkowy bezrobotny -1500 terenowy
30000 60 rachunki przedsiębiorca -9000 komornik
…
dług wiek hipoteka gotówkowy rachunek emerytpracadługi klasa
300000 40 1 0 0 0 1 1 komornik (3)
400 70 0 0 1 1 0 2 telefon (1)
7000 28 0 1 0 0 0 1 strata (0)
50000 30 0 0 1 0 1 4 strata (0)
…
Dane historyczne
Podejście machine learning
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Podejście machine learning
Machine Learning pipeline
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Garbage IN => Garbage OUT
„More data beats clever algorithms,
but better data beats more data”
Peter Norvig, Google
Feature engineering
dług wiek typ długu zawód zysk forma
300000 40 hipoteka kierowca 100000 komornik
400 70 telefon emeryt 300 telefon
7000 28 gotówkowy bezrobotny -1500 terenowy
30000 60 rachunki przedsiębiorca -9000 komornik
…
dług wiek hip. got. rachunek emeryt praca długi żyje klasa
300000 40 1 0 0 0 1 1 1 komornik (3)
400 70 0 0 1 1 0 2 1 telefon (1)
7000 28 0 1 0 0 0 1 1 strata (0)
50000 60 0 0 1 0 1 4 0 strata (0)
…
Dane historyczne
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Naucz się podstaw
Zrozum swoje dane
Zadaj odpowiednie pytanie
prosta heurystyka > ML
ML > algorytm ekspercki
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Skieruj pacjenta do lekarza, gdy minimum
jeden z parametrów nie jest w normie…
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
Andrew Ng + Coursera
Jak szybko zacząć?
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski
RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski

More Related Content

RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski