3. Il piano per oggi
Fonti dati partiamo dal dato
Struttura stiamo dicendo le stesse cose in lingue
diverse
Visualizzazione un disegno vale pi湛 di mille
parole
Mappe e una mappa (a volte) vale pi湛 di molti
diagrammi
Fonti dati le note dolenti
5. Dove sono I dati?
I dati possono trovarsi sul web in tanti formati
Tabellari
xls xlsx csv tsv ods dbf
Strutturati
xml json (shp)
Linked data
RDF
Altro
HTML
75%
20%
5
50%
6. Dove sono I dati?
I dati possono trovarsi sul web in tanti formati
Tabellari
xls xlsx csv tsv ods dbf
Strutturati
xml json (shp)
Linked data
RDF
Altro
HTML
75%
20%
5
50%
7. Partiamo dai dati tabellari
I dati possono trovarsi sul web in tanti formati
Tabellari
xls xlsx csv tsv ods dbf
Strutturati
xml json (shp)
Linked data
RDF
Altro
HTML
75%
20%
5
50%
8. Dati gi tabellari
Portali open data (attenzione alle licenze)
Google
Filetype:csv/xls
Enti internazionali
Agenzie di statistica
40. La Mappa
Tanti fattori
Geoide (approssimazione pi湛 o meno precisa della
sfera terrestre)
Posizione del polo nord
Primo meridiano
Equatore
Superficie di proiezione
Circa 35000 modi per definire una poisizione...
55. Partiamo dai dati tabellari
I dati possono trovarsi sul web in tanti formati
Tabellari
xls xlsx csv tsv ods dbf
Strutturati
xml json (shp)
Linked data
RDF
Altro
HTML
75%
20%
5
50%
56. Il Bengodi!!!
C竪 un problema:
Diversi enti definiscono la stessa cosa in modi
completamente diversi
Diventa difficilissimo fare le operazioni di VLOOKUP
57. Dove sono I dati?
I dati possono trovarsi sul web in tanti formati
Tabellari
xls xlsx csv tsv ods dbf
Strutturati
xml json (shp)
Linked data
RDF
Altro
HTML
75%
20%
5
50%
58. Scraping
Excel
Chrome
table extractor
Scraper
Firefox outwit
I PDF
Zamzar
Tabula
Scraperwiki