際際滷 che Filippo d'angelo dell'inps ha utilizzato per tenere il seminario online sui dati perti dell'INPS per Dati.gov.it
qui maggiori info: http://www.dati.gov.it/content/terzo-ciclo-di-seminari-online-sui-dati-aperti
2. STATO DELLARTE
The best way to get value from
...LEuropa corre veloce data is to give it away..[..]..Lets join
together
Dicembre 2011 - Nuova OpenData Strategy and share our data
Neelie Kroes, Vice-Presidente Commissione europea per lAgenda digitale.
Marzo 2012- ePSI platform Conference
Taking re-use to the next level
Practical example of OpenData reuse and grass roots
support and experience play an important role here..
[..]..
Go out and make the case for OpenData more
strongly!
3. Le direttive dalla Digital Agenda di Dicembre 2011
Aggiornamento direttive 2003 sul riuso del PSI
Rendere accessibili e riutilizzabili i contenuti documentali della PA.
Rendere i dati in formato machine readable (RDF, JSON, XML).
Creazione di un data portal della commissione europea.
Aggiornamento delle direttive dalla ePSI conference 2012
Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso
commerciale e non commerciale.
Gli stati membri devono introdurre un sistema di supervisione e
regolamentazione al 鍖ne di rispettare le direttive UE sul riuso nei tempi
stabiliti.
Lo scopo delle direttive sar esteso alle informazioni contenute nelle
digital libraries, musei e archivi.
4. IL RIUSO COME CRITERIO
OBIETTIVO:
VALUTARE LA VALUTARE LA QUALIT
QUALIT DEI DATASET DEI PROCESSI DI
PUBBLICATI GOVERNANCE
(Open Government)
Open Data
(Government Data) Tutti le tipologie di dati che
Tutti le tipologie di dati di contribuiscono alla
interesse pubblico trasparenza delle
amministrazioni
5. COME VALUTA LUNIONE EUROPEA ?
Il riuso negli indicatori di punteggio:
Implementazione delle direttive EU Dati delle amministrazioni Locali
Sviluppo dei formati Pratiche di riuso
Eventi ed attivit correlate
8. Qualche dettaglio sulla valutazione degli
OpenData in Italia
Dal punto di vista del punteggio non
siamo lontani dai paesi gi avviati in
materia di open government (UK).
Implementazione delle direttive EU
Sviluppo dei formati
Eventi ed attivit correlate
Cosa migliorare?
Rilascio dei dati delle amministrazioni Locali
Per migliorare il riuso implementare i Pratiche di riuso
formati non basta !
10. La correlazione tra pratiche di riuso e rilascio dei dataset degli enti
locali suggerisce di implementare un piano di rilascio OpenData a
partire dal modello degli Enti pubblici pi湛 importanti.
11. Interestingly the INPS data website explicitly refers to
the EU PSI Directive as the reason for publishing data for
re-use.
..continuous dialogue between data holders and
re-users is needed, as we are learning how to do
this by doing. The INPS data release is a good step
forward, and creates appetite for more.
13. Perch竪 le linee guida sono importanti
?
Il lavoro sugli OpenData 竪 collaborativo.
E necessario individuare le tappe del processo.
E necessario che la metodologia sia condivisa.
14. MA...
Quali dati vanno
Da dove partire?
aperti?
E i metadati? Come produrre un
dataset di qualit?
Come mettere insieme i pezzi?
17. 1- Analisi di dominio e individuazione dei dati
2 - Analisi tipologica dei dati
3 - Preparazione dei dati
4 - De鍖nizione dei formati
5 - De鍖nizione dei metadati
6 - Attribuzione della licenza
18. ANALISI DI DOMINIO
INDIVIDUAZIONE DEI DATI
Obiettivo?
identi鍖care i contenuti gi esposti dallistituto allinterno delle aree
di pubblicazione al 鍖ne di identi鍖care i dati.
INPS.IT
19. Individuare subito i dati che possono
essere aperti ...
Sottosezioni
1.Relazioni annuali
2.Bilanci sociali
3.Osservatorio statistico
4.Statistiche della previdenza
5.Rapporto sulla coesione sociale
20. Ma XLS non 竪 un p嘆 poco
Si, ma..
Abbiamo sempre bisogno
di dati grezzi da cui partire
La definizione del formato 竪
un processo graduale e in itinere.
Possiamo sempre implementare
il formato una volta pubblicati i dati.
21. ANALISI TIPOLOGICA
DEI DATI
Di che tipo sono i dati (XLS) che abbiamo trovato?
Obiettivo?
Distinguere in maniera ef鍖cace dati grezzi dai dati gi manipolati:
23. PREPARAZIONE DEI DATI
Obiettivo?
Poich竪 molte delle fonti dei dati presentano le informazioni in maniera non strutturata
竪 opportuno effettuare unoperazione di pulizia riguardante la struttura
delle tabelle e il contenuto delle stesse.
24. DEFINIZIONE DEI FORMATI
Obiettivo?
Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare
successivamente formati non proprietari come:
: testo ( PDF, TXT )
: struttura proprietaria ( XLS )
: struttura aperta ( CSV,XML )
: struttura con URL e URI
: Linked Data ( RDF + Link )
Livello di apertura
25. DEFINIZIONE DEI METADATI
Obiettivo?
Lo step successivo nella creazione degli Open Data 竪 la de鍖nizione e la
creazione di metadati, cio竪 informazioni che descrivono uno o un
insieme di dati.
Tali informazioni rappresentano delle propriet pi湛 signi鍖cative 鍖ssate e
consentono la ricerca e il recupero dei dati stessi con lo scopo di
migliorarne la visibilit e facilitarne laccesso.
Alcuni importanti standard per i metadati
ISO/IEC 11179
ISO 15836 Dublin Core
W3C SKOS, W3C RDF/OWL
26. La creazione e limplementazione dei metadati
richiede attenzione alle risorse informative che tali
metadati devono ri鍖ettere. Molta attenzione deve
essere data alla qualit, perch竪 un pessimo metadato
竪 peggio dellassenza di metadati.
Per tale ragioni sono stati creati opportuni metadati
per descrivere al meglio i dati INPS. Metadati Sintattici
Descr ivono il dato attr aver so le sue
caratteristiche strutturali, in cui sono comprese
le informazioni sul processo di creazione,
organizzazione e pubblicazione. Tali metadati
non aggiungono informazioni sul contenuto del
dataset.
Titolo: titolo dei dati
Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato
allinterno del portale/minisito OpenData Inps.
Formato: lestensione del file (.pdf; .xls; .rdf; .doc)
Licenza : il tipo di licenza a cui 竪 legato il dato
Dimensione in byte: la dimensione fisica del dato
Identificativo : numero progressivo univoco del dato
Link: (URL-permanent link-, link annidati, short URL)
Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)
27. Metadati Semantici
Descrivono il dato attraverso le sue
caratteristiche semantiche, ovvero
le informazioni sul contenuto. Tali
aspetti consentono di individuare
univocamente la risorse.
Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica:
Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale)
Copertura temporale: rappresenta lestensione temporale del dato (es. ante 2000, 2001-2005,
2006-2011, 2012-)
Livello di lavorazione del dato: grezzo, statistica, bilancio.
Tags: parole chiave dellargomento principale
Area di pubblicazione: a sezione in cui viene pubblicato allinterno del portale Inps.it.
Descrizione: un breve abstract del dato
Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato.
Argomento trattato: il soggetto semantico del dato
28. Dal dato al metadato...
De鍖niamo cos狸 nel
complesso la modalit
di fruizione dei dati
attraverso le
informazioni che li
descrivono.
29. ATTRIBUZIONE DELLA
LICENZA
Obiettivo?
Scegliere una licenza che consenta allutente un riuso pi湛 facile e libero
possibile
La IODL 2.0 prevede che lutente possa
liberamente:
1-Consultare, estrarre,copiare e pubblicare i dati
2-Creare un lavoro derivato integrando diversi
dataset.
..rispetto alla IODL 1.0?
Non prevede lobbligo
dellutente di pubblicare o
condividere i lavori con la
stessa licenza. E chiesto solo di
indicare la fonte!
30. ....Perch竪 la
semantica?
Aiutare gli utenti
Mettere in relazione i dati
31. Lavoriamo sui metadati semantici!
Cosa possiamo farci?
Una volta de鍖niti i metadati semantici, questi sono utilizzati per la creazione
delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti
o dimensioni attraverso i quali si pu嘆 descrivere una stessa risorsa.
32. Motore a faccette
Selezionando una faccetta, si riducono i dataset trovati;
selezionandone pi湛 di una si operer una intersezione tra i
dati, riducendo ancora di pi湛 鍖no a trovare esattamente
quanto cercato.
33. Query expansion
La modalit di ricerca Query expansion consente
di interrogare il sistema utilizzando il linguaggio
naturale, piuttosto che inserire parole chiave che
lutente potrebbe non conoscere.
In questo modo il raggiungimento delle risorse
sar notevolmente facilitato per tutte le categorie
di utenti (dai pi湛 esperti ai meno esperti)
Ad esempio: supponiamo che lutente digiti
la query centri per le cure termali.
Utilizzando la query expansion, nonostante
la stringa inserita non sia presente nelle
descrizioni dei dati, lutente sar indirizzato
al dato Cure forme vie respiratorie -
elenco alberghi convenzionati per la
stagione termale.
34. Arricchire semanticamente i dati
signi鍖ca stabilire uno standard di qualit
dei dataset in vista dei
Linked Open Data.
Fare linked open data consente di abbattere
le barriere 鍖siche tra i dati.
connettere e
condividere dataset
attraverso standard
gi implementati
35. La qualit dei dataset pubblicati costituisce una
buona pratica OpenData!
Pi湛 i dati sono ricchi di
informazioni ed esposti
in modo preciso
maggiore sar il riuso
che se ne potr fare.
36. Buona pratica
Un esempio applicativo
Dati sugli attraversamenti stradali
(integrazione)
Dati sugli incidenti stradali
Dal dato allinformazione
37. Gli Open Data Linked possono essere facilmente accessibili
da persone e applicazioni (via mashup) per i pi湛 diversi scopi
ma soprattutto...
- consentono di passare dal dato allinformazione -
IL RIUSO COME CRITERIO DI VALUTAZIONE
Riuso nella PA: maggior controllo del territorio con pi湛 semplicit
Riuso privato: informazioni ai cittadini, maggiore trasparenza
Riuso commerciale: sviluppo di applicazioni pi湛 intelligenti e integrate
38. Il modello
OPEN DATA
Un modello di qualit per lo sviluppo OpenData in Italia
Un modello per le PA locali
Grazie a tutti !
Filippo DAngelo
鍖lippo.dangelo@inps.it