際際滷

際際滷Share a Scribd company logo
Sonia Montegiove, Alfredo Parisi, Italo Vignoli
Strumenti open source per il giornalismo:
come usare gli open data
OpenData,chi?
Open
cosa?
Un contenuto o un dato si definisce
aperto se chiunque 竪 libero di
usarlo, riusarlo, ridistribuirlo 
soggetto, al massimo, al requisito di
attribuzione e/o condivisione allo
stesso modo
Open Knowledge Foundation
OpenDataatavola
Foto di Karen Morgan, Flickr
ovverocomerendereappetibili
ingredientichenonlosono
Ingredienti
Per l'impasto:
100 g di Open Data
400 g di altre Fonti di Informazione
1 Kg di Pazienza nella ricerca
LibreOffice e altri sw open source
Per la comprensione e il mash-up:
Passione q.b.Foto di The Hellos, Flickr
Dovetrovareingredientifreschi
Portale www.dati.gov.it
Portali Open Data delle PA
Sezione Trasparenza Siti della PA
Da motore di ricerca con parola magica open data
Data scraping
Foto di Young Sok Yun, Flickr
Setrovodati.CSV
SEMPLICE!
Aprire il file con
LibreOffice e importare
il testo
Esetrovoun.XLS?
Un formato chiuso per esporre un dato aperto? Ossimoro?
Esetrovoun.pdf?
1. Scarico Tabula
2. Lo installo
3. Apro Tabula.exe
4. Faccio upload del file
.pdf
Esetrovoun.pdf?
Aspetto che arrivino
i dati in forma
tabellare.
L'attesa dipende
dalla complessit
del file.
Esetrovounatabellahtml?
Questo non 竪 il
formato adatto a
pubblicare
Il caro vecchio
copia-incolla
pu嘆 aiutarci
Fonte: http://www.benisequestraticonfiscati.it/
UnLibreOfficeincucina
Foto di Young Sok Yun, Flickr
Decorareconigrafici
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
I 5 farmaci pi湛 venduti in Italia nell'ultimo semestre
dacos狸...
...温界看壊狸
Fonte: http://www.dati.salute.gov.it/
Decorareconigrafici
1.scaricare il dataset e aprirlo in Calc
2. selezionare i dati da rappresentare
3. Inserisci  Grafico
4. Seguire la creazione guidata
5. Rifinire modificando alcuni elementi
Decorareconigrafici(inmodoguidato)
Da Inserisci-Grafico...
1 2
3 4
Mettereinrisaltoalcunidati
Fonte: http://itacan.ispo.toscana.it/italian/itacan.htm
Comefare?Formattazionecondizionata
Da:
Formato
Formattazione
condizionata
Condizione
Selezionaretratanteinformazioni
Partiamo dal
dataset
(da notare il
solo
formato .xls)
Fonte: http://www.dati.piemonte.it/catalogodati/dato/100670-.html
Selezionaretratanteinformazioni
Da Dati
Filtro
Filtro standard
Ho cos狸 un elenco esatto delle scuole con connessione veloce
Foto di Geoff Llerena, Flickr
Otteneresomme,medie,conteggiperdato
Fonte: http:/dati.lombardia.it/
Otteneresomme,medie,conteggiperdato
Da Dati
Subtotali
Cheariatira?
1 2
3 Fonte: http://www.arpa.umbria.it/open-data.aspx
Eseidatisonotanti
禽温界看壊狸...
...温界看壊狸
Lafortunadiavereletabellepivot
Da Dati
Tabella Pivot
Crea
RappresentareDati
Listadellaspesa
Elaborazione dati:
 LibreOffice
 Open Refine (ex Google Refine)
Grafici:
 Plotly
 Datawrapper
Mappe:
 Mapbox
OpenRefine

Software prodotto da Google

Finalizzato al data cleaning

Interfaccia intuitiva e semplice da usare

Open Source, sorgente disponibile in Github

Refine offre una serie di trasformazioni preconfezionate
(trasformazioni comuni)

Refine utilizza il linguaggio GREL (Google Refine Expression Language)
per trasformazioni avanzate

Supporta diversi formati: TSV, CSV, *SV, JSON, XML, RDF
OpenRefine
Luoghi di interesse, Citt di Firenze (Risorsa in CSV).
OpenRefine
1. Importare il file CSV in Open Refine
OpenRefine
2. Eliminare colonne duplicate (italiano/inglese)
OpenRefine
3. Rinominare intestazione colonne
OpenRefine
4. Trasformare celle utilizzando caratteri maiuscoli
OpenRefine
5. Unire due colonne ed ottenere l'indirizzo completo
OpenRefine
5. Unire due colonne ed ottenere l'indirizzo completo
OpenRefine
5. Unire due colonne ed ottenere l'indirizzo completo
6. Esportare il dataset! Formati disponibili TSV, CSV, ODS, XLS.
DaOpenDataaGrafici

Grafici veloci in pochi secondi

Grafici interattivi

Creazione e modifica dei grafici in modalit
collaborativa

Possibilit di condividere i grafici creati (Embed e Social)

Serve solamente un browser web
Collaboriamo!
DaOpenDataaGrafici
Servizi educativi per la prima infanzia, Regione Umbria:
si evidenziano i dati anagrafici, numero totale di bambini accolti al 15
dicembre di ogni anno suddivisi per categorie, informazioni sintetiche
riguardanti i periodi di apertura, spazi e strutture presenti, meccanismi di
graduazione.
DaOpenDataaGrafici
DaOpenDataaGrafici
DaOpenDataaGrafici-Mappe

Grafici veloci in pochi secondi (in 4 passi)

Mappe interattive (beta)

Open Source, sorgente disponibile in Github

Serve solamente un browser web
DaOpenDataaGrafici-Mappe
DaOpenDataaGrafici-Mappe
DaOpenDataaMappe

Mappe veloci in pochi secondi

Personalizzare i punti e le mappe

Utilizzare diversi template

Mapbox crea mappe interattive

Mapbox crea oggetti embed che si possono importare in blog

Importa diversi formati: CSV, geojson, KML e gpx
DaOpenDataaMappe
Hotspot Wifi in Umbria (Risorsa in geojson):
DaOpenDataaMappe
Hotspot Wifi in Umbria (risorsa in geojson):
DaOpenDataaMappe
Hotspot Wifi in Umbria (risorsa in geojson):
CreativeCommons
Le licenze Creative Commons offrono [] diverse articolazioni dei
diritti d'autore per [] creatori che desiderino condividere in
maniera ampia le proprie opere secondo il modello "alcuni diritti
riservati"
I vari moduli vengono combinati (volendo, in risposta a semplici
domande), stabilendo:
Quali diritti lautore voglia riservarsi
Quali diritti lautore voglia condividere
CreativeCommons
6 combinazioni possibili:
Attribuzione - Non commerciale -
Non opere derivate
Attribuzione - Non commerciale -
Condividi allo stesso modo
Attribuzione - Non commerciale
Attribuzione - Non opere derivate
Attribuzione - Condividi allo
stesso modo
Attribuzione
CreativeCommons
1.0
2.0
2.5
3.0
4.0
CreativeCommons4.0
Internazionalizzazione: per favorire l'adozione globale delle
licenze
Interoperabilit: tra le licenze Creative Commons e le altre licenze
Durata: anticipazione dei problemi legali e di adozione, per
favorire la durata delle licenze
Governi e Istituzioni Pubbliche: gestione dei problemi di adozione
delle licenze nelle aree dei dati, della scuola e della ricerca
Modelli di Adozione: compatibilit con le versioni precedenti alla
4.0
ConsiderevoleSforzoComunicativo
Commons Deed
Versione "comprensibile agli umani"
Traduzioni
Adattamento ai sistemi giuridici nazionali
Gestione dei Metadati
Filtro per licenza tramite Google, Yahoo, etc.
Add-on per Office, LibreOffice, Firefox, etc.
Siti web comprensibili e FAQ
http://www.creativecommons.org
http://www.creativecommons.it
LiberiTutti:CC0
Rinuncia a tutti i diritti d'autore e connessi (inclusi quelli
sulle banche di dati) su un'opera
allenta il pi湛 possibile i legami giuridici con quell'opera
Waiver of rigths: rinuncia a ogni diritto
in subordine, licenza gratuita e irrevocabile
in subordine, impegno a non esercitare i diritti rimasti
in capo al detentore
Standard?
Standard?
Standard: PDF, HTML, JPG
Non Standard: DOC, XLS, PPT, AI, MDF, SWF, WMF
AdozionedegliStandard
1
1970 1980 1990 1995 2000 2005
Standard Proprietari
Standard Nazionali
Standard Globali
InnovazioneChiusaeAperta
ChiusaversoAperta
BillGates[1]
One thing we have got to change in our strategy - allowing Office
documents to be rendered very well by other peoples browsers is
one of the most destructive things we could do to the company. We
have to stop putting any effort into this and make sure that Office
documents very well depends on PROPRIETARY IE capabilities
Dobbiamo cambiare la nostra strategia: consentire che i
documenti di Office vengano visualizzati bene da altri software 竪
una delle cose peggiori che possiamo fare. Dobbiamo smetterla di
fare sforzi in questa direzione, e assicurarci che i documenti di
Office dipendano da funzionalit proprietarie di IE
BillGates[2]
3 million computers get sold every year in China, but people don't
pay for the software. Someday they will, though. As long as they
are going to steal it, we want them to steal ours. They'll get sort of
addicted, and then we'll somehow figure out how to collect
sometime in the next decade
Ogni anno, in Cina vengono venduti circa 3 milioni di PC, ma
nessuno paga il software. Per嘆, un giorno pagheranno. Fino a
quando lo rubano, vogliamo che rubino il nostro perch辿 diventino
- in un certo senso - dipendenti. A quel punto, faremo in modo di
raccogliere qualcosa, anche se sar nel prossimo decennio
FormatoStandard
Sviluppato da un Ente Neutrale
Consenso tra Software Vendor e Utenti Finali
Costruito come Standard Aperto
Nessun Componente Proprietario o Incapsulato
Implementazione Nativa Libera
Verifica del Formato Indipendente dal Vendor
Agnostico verso l'Utente
Apertura/Salvataggio senza Condizioni
FormatoAperto
E' indipendente da un unico software (e vendor)
E' interoperabile, perch辿 permette una
condivisione trasparente dei dati tra pi湛 sistemi
eterogenei
E' perenne, perch辿 tutela il patrimonio di
informazioni
nel tempo di fronte all'evoluzione della tecnologia
E' neutrale, perch辿 non costringe l'utente a usare
uno specifico software, ma lascia un'ampia scelta
Open ContentClosed Content
Open FormatClosed Format
Documento=???
Documento=Contenitore
CONTENT.XML
Open Document Format
la scelta che permette di scegliere
ODFallaBasedell'Interoperabilit
SW
Contenuto
Vecchio Stile
Contenuto strettamente legato
all'applicazione che lo genera
Controllo in mano a chi sviluppa
l'applicazione e non all'utente
SW SW SW
Contenuto
Nuovo Stile
Contenuto rappresentato attraverso uno standard aperto
che non viene controllato da un unico vendor, per cui pi湛
applicazioni possono crearlo e modificarlo
Controllo in mano all'utente e non al software vendor
Interoperabilit
Formato Standard
Open Document Format
Componenti Standard e Multipiattaforma
Font Libere e Multipiattaforma
Elementi Grafici: JPEG e TIFF, PNG
Multimedia: MP3 e OGG, MP4 e H.256
Costruzione "Neutrale" del Documento
Nessun Elemento Proprietario
ProcessodiStandardizzazione
ODF
Basato sul formato XML di OOo
12 dic 2002: sottoposto a OASIS
1 mag 2005: rilascio dello
standard ODF da parte di OASIS
16 nov 2005: sottoposto a ISO/IEC
JTC1 con le regole della Publicly
Available Specification (PAS)
3 mag 2006: approvazione dello
standard ISO/IEC IS 26300
720 pagine in 1239 giorni
OOXML
Basato sul formato XML di Office
2003
15 dic 2005: sottoposto a ECMA
31 dic 2006: standard ECMA
approvato dalla Ecma General
Assembly
31 gen 2007: sottoposto a ISO/IEC
JTC1 con le regole della FastTrack
31 mar 2008: approvazione dello
pseudo-standard ISO/IEC
7200 pagine in 838 giorni
RiusodegliStandard:unConfronto
ODF
Dublin Core
XLS:FO
SVG
MathML
XLink
SMIL
XForms
OOXML
Dublin Core
ODFeOOXML
FalsoStandardAperto
OOXML
Microsoft
Office 2013
ODF
LibreOffice
4.3
ProblemiconAltriCalendari
OOXML non prende in considerazione gli utenti di religione
ebraica e musulmana, che utilizzano un altro calendario
Indipendentemente dalla configurazione locale, la
funzione Networkdays() restituisce sempre sabato e
domenica come weekend
Errore per Algeria, Bahrain, Bangladesh, Iraq, Israel,
Jordan, Libya, Pakistan, Qatar, Sudan, Syria e United Arab
Emirates
ODF gestisce il problema correttamente
FontProprietarieBrevettati
BrevettiClearType
FontLibere
FormatiDisponibili
Documento di Testo ODF (ODT)
Modello di Documento di Testo ODF (OTT)
Microsoft Word 2007/2010/2013 XML (DOCX)
Microsoft Word 97/2000/XP/2003 (DOC)
Modello di Documento DOC (DOT)
Rich Text Format (RTF)
Testo (TXT)
Testo  Scegli la Codifica (TXT)
Formatiperl'Interoperabilit
Documento di Testo ODF (ODT) CONSIGLIATO
Microsoft Word 2007/2010/2013 XML (DOCX)
Microsoft Word 97/2000/XP/2003 (DOC) ACCETTATO
Rich Text Format (RTF) SCONSIGLIATO
鰻艶壊壊顎稼温鴛稼岳艶姻看沿艶姻温恢庄鉛庄岳
NonStandard:Circa2000AC
酷温鉛壊温鴛稼岳艶姻看沿艶姻温恢庄鉛庄岳
NonStandard:Circa2000DC
閣艶姻温鴛稼岳艶姻看沿艶姻温恢庄鉛庄岳
Standard:Circa2000DC
#opendatachevorrei
Nell'open data che vorrei non ci sono
formato chiusi n辿 dati precotti
Grazie!
info@libreitalia.it @libreitalia
sonia@libreitalia.it @suxsonica
alfredo@libreitalia.it @alfparisi
italo@libreitalia.it @italovignoli

More Related Content

Strumenti open source per il giornalismo: come usare gli open data