ݺߣ

ݺߣShare a Scribd company logo
ZPRACOVÁNÍ DAT Z
VEŘEJNÝCH ZDROJŮ
ONDŘEJ KOKEŠ
1
STÁT SE OTEVÍRÁ
▸ víc než kdy dřív
▸ mění se přístup státu
▸ pomalu, ale jistě
▸ podílíme se na tom my všichni
2
CO S TÍM?
KROK PRVNÍ: STÁHNU DATA
3
NE
4
KROK PRVNÍ: DEFINUJI
PROBLÉM
5
KOLIK UTRATILA MOJE OBEC ZA LOŇSKÝ
ROK?
KOLIK UTRATILA MOJE OBEC ZA LOŇSKÝ
ROK… ZA OPRAVY CHODNÍKŮ?
6
KDO KANDIDUJE POKAŽDÉ ZA JINOU PARTAJ?
KDO SKONČIL POD ČAROU, NEBYL NÁSLEDNĚ
DOSAZEN DO MĚSTSKÉ FIRMY?
7
O ČEM SE MLUVÍ VE SNĚMOVNĚ? NEŠLO BY
TO NĚJAK STROJOVĚ ZPRACOVAT (NLP)?
8
KDO BERE EVROPSKÉ DOTACE?
9
KROK DRUHÝ: NAJÍT DATA
10
KDE NAJDU SEZNAM IČO?
KDE NAJDU ADMINISTRATIVNÍ INFORMACE?
KDE NAJDU DOTACE?
KDE NAJDU ZAKÁZKY?
11
KROK TŘETÍ: TECHNICKY
ZPRACOVAT DATA
12
13
▸ Co je to FoxPro?
13
▸ Co je to FoxPro?
▸ Jak zpracovat milion XML souborů?
13
▸ Co je to FoxPro?
▸ Jak zpracovat milion XML souborů?
▸ ... já chtěl prostě tabulku
13
KROK ČTVRTÝ: ANALYTICKY
ZPRACOVAT DATA
14
15
▸ Proč tu chybí data?
15
▸ Proč tu chybí data?
▸ Můžu bezhlavě agregovat?
15
▸ Proč tu chybí data?
▸ Můžu bezhlavě agregovat?
▸ Kdy podepsali tuto smlouvu?
15
▸ Proč tu chybí data?
▸ Můžu bezhlavě agregovat?
▸ Kdy podepsali tuto smlouvu?
▸ Kdy čerpali peníze?
15
A TO JE VŠE!
16
17
1. Definovat problém
17
1. Definovat problém
2. Najít data
17
1. Definovat problém
2. Najít data
3. Technicky zpracovat data
17
1. Definovat problém
2. Najít data
3. Technicky zpracovat data
4. Analyticky zpracovat data
17
MÁME MÍSTY LUXUSNÍ ZDROJE
▸ administrativní informace
▸ smlouvy
▸ rozpočty
18
ALE STÁLE NARÁŽÍME
▸ je to o lidech
▸ je to o legislativě
▸ je to o nás všech
19
NEMÁ TOHLE VŠECHNO
NĚKDO NA PRÁCI?
20
PROČ O TOM MLUVÍM ZROVNA JÁ?
▸ github.com/kokes/od
▸ github.com/kokes/knod nebo knod.cz
▸ video ukázka
21
DÍKY
22

More Related Content

Ondřej Kokeš: Zpracování dat z veřejných zdrojů