際際滷

際際滷Share a Scribd company logo
OPEN DATA
STATO DELLARTE
                                                                 The best way to get value from
...LEuropa corre veloce                                       data is to give it away..[..]..Lets join
                                                                              together
Dicembre 2011 - Nuova OpenData Strategy                                  and share our data
Neelie Kroes, Vice-Presidente Commissione europea per lAgenda digitale.




                                                   Marzo 2012- ePSI     platform Conference
                                                             Taking re-use to the next level




                                            Practical example of OpenData reuse and grass roots
                                             support and experience play an important role here..
                                                                     [..]..
                                                Go out and make the case for OpenData more
                                                                  strongly!
Le direttive dalla Digital Agenda di Dicembre 2011

                Aggiornamento direttive 2003 sul riuso del PSI


     Rendere accessibili e riutilizzabili i contenuti documentali della PA.
     Rendere i dati in formato machine readable (RDF, JSON, XML).
     Creazione di un data portal della commissione europea.



 Aggiornamento delle direttive dalla ePSI conference 2012


  Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso
commerciale e non commerciale.

   Gli stati membri devono introdurre un sistema di supervisione e
regolamentazione al 鍖ne di rispettare le direttive UE sul riuso nei tempi
stabiliti.

   Lo scopo delle direttive sar esteso alle informazioni contenute nelle
digital libraries, musei e archivi.
IL RIUSO COME CRITERIO

                                       OBIETTIVO:

  VALUTARE LA                                       VALUTARE LA QUALIT
QUALIT DEI DATASET                                     DEI PROCESSI DI
   PUBBLICATI                                          GOVERNANCE




                                                            (Open Government)
           Open                                                        Data
(Government Data)                                          Tutti le tipologie di dati che
Tutti le tipologie di dati di                                   contribuiscono alla
    interesse pubblico                                           trasparenza delle
                                                                  amministrazioni
COME VALUTA LUNIONE EUROPEA ?




                  Il riuso negli indicatori di punteggio:
Implementazione delle direttive EU                                  Dati delle amministrazioni Locali

                   Sviluppo dei formati                     Pratiche di riuso

                                     Eventi ed attivit correlate
QUALE
VALUTAZIONE
 PER ITALIA?
LITALIA NON VA MALE !


    8属 POSIZIONE
Qualche dettaglio sulla valutazione degli
                            OpenData in Italia

                                                 Dal punto di vista del punteggio non
                                                 siamo lontani dai paesi gi avviati in
                                                 materia di open government (UK).




Implementazione delle direttive EU
Sviluppo dei formati
Eventi ed attivit correlate
                                                      Cosa migliorare?
                                               Rilascio dei dati delle amministrazioni Locali

      Per migliorare il riuso implementare i                 Pratiche di riuso
               formati non basta !
Qualche idea?
La correlazione tra pratiche di riuso e rilascio dei dataset degli enti
 locali suggerisce di implementare un piano di rilascio OpenData a
        partire dal modello degli Enti pubblici pi湛 importanti.
Interestingly the INPS data website explicitly refers to
the EU PSI Directive as the reason for publishing data for
re-use.

                       ..continuous dialogue between data holders and
                       re-users is needed, as we are learning how to do
                       this by doing. The INPS data release is a good step
                       forward, and creates appetite for more.
Liberare i dati
Perch竪 le linee guida sono importanti
                   ?




Il lavoro sugli OpenData 竪 collaborativo.
E necessario individuare le tappe del processo.
E necessario che la metodologia sia condivisa.
MA...

                         Quali dati vanno
Da dove partire?
                             aperti?



E i metadati?                 Come produrre un
                               dataset di qualit?



        Come mettere insieme i pezzi?
STOP !!
Il modello
     INPS
1- Analisi di dominio e individuazione dei dati

 2 - Analisi tipologica dei dati

      3 - Preparazione dei dati

        4 - De鍖nizione dei formati

            5 - De鍖nizione dei metadati

                6 - Attribuzione della licenza
ANALISI DI DOMINIO
         INDIVIDUAZIONE DEI DATI
                            Obiettivo?
identi鍖care i contenuti gi esposti dallistituto allinterno delle aree
            di pubblicazione al 鍖ne di identi鍖care i dati.




                          INPS.IT
Individuare subito i dati che possono
essere aperti ...




 Sottosezioni
1.Relazioni annuali
2.Bilanci sociali
3.Osservatorio statistico
4.Statistiche della previdenza
5.Rapporto sulla coesione sociale
Ma XLS non 竪 un p嘆 poco
Si,	 ma..
                Abbiamo	 sempre	 bisogno
             	 di	 dati	 grezzi	 da	 cui	 partire


              La	 definizione	 del	 formato	 竪	 
            un	 processo	 graduale	 e	 in	 itinere.


              Possiamo	 sempre	 implementare	 
        il	 formato	 una	 volta	 pubblicati	 i	 dati.
ANALISI TIPOLOGICA
     DEI DATI
      Di che tipo sono i dati (XLS) che abbiamo trovato?


                         Obiettivo?
Distinguere in maniera ef鍖cace dati grezzi dai dati gi manipolati:
Dati Grezzi




Dati Statistici
  (gi manipolati)
PREPARAZIONE DEI DATI
                                      Obiettivo?
Poich竪 molte delle fonti dei dati presentano le informazioni in maniera non strutturata
       竪 opportuno effettuare unoperazione di pulizia riguardante la struttura
                       delle tabelle e il contenuto delle stesse.
DEFINIZIONE DEI FORMATI
                                      Obiettivo?
    Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare
                     successivamente formati non proprietari come:




                            : testo ( PDF, TXT )
                             : struttura proprietaria ( XLS )
                             : struttura aperta ( CSV,XML )
                              : struttura con URL e URI
                               : Linked Data ( RDF + Link )
Livello di apertura
DEFINIZIONE DEI METADATI
                                 Obiettivo?
   Lo step successivo nella creazione degli Open Data 竪 la de鍖nizione e la
   creazione di metadati, cio竪 informazioni che descrivono uno o un
   insieme di dati.

   Tali informazioni rappresentano delle propriet pi湛 signi鍖cative 鍖ssate e
   consentono la ricerca e il recupero dei dati stessi con lo scopo di
   migliorarne la visibilit e facilitarne laccesso.




 Alcuni importanti standard per i metadati

  ISO/IEC 11179
  ISO 15836 Dublin Core
 W3C SKOS, W3C RDF/OWL
La creazione e limplementazione dei metadati
richiede attenzione alle risorse informative che tali
metadati devono ri鍖ettere. Molta attenzione deve
essere data alla qualit, perch竪 un pessimo metadato
竪 peggio dellassenza di metadati.

Per tale ragioni sono stati creati opportuni metadati
per descrivere al meglio i dati INPS.                                        Metadati Sintattici
                                                                                 Descr ivono il dato attr aver so le sue
                                                                                 caratteristiche strutturali, in cui sono comprese
                                                                                 le informazioni sul processo di creazione,
                                                                                 organizzazione e pubblicazione. Tali metadati
                                                                                 non aggiungono informazioni sul contenuto del
                                                                                 dataset.


    Titolo: titolo dei dati

     Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato
     allinterno del portale/minisito OpenData Inps.

    Formato: lestensione del file (.pdf; .xls; .rdf; .doc)

    Licenza : il tipo di licenza a cui 竪 legato il dato

    Dimensione in byte: la dimensione fisica del dato

    Identificativo : numero progressivo univoco del dato

    Link: (URL-permanent link-, link annidati, short URL)

    Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)
Metadati Semantici
                                                                                                Descrivono il dato attraverso le sue
                                                                                                caratteristiche semantiche, ovvero
                                                                                                le informazioni sul contenuto. Tali
                                                                                                aspetti consentono di individuare
                                                                                                univocamente la risorse.


   Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica:
    Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale)

   Copertura temporale: rappresenta lestensione temporale del dato (es. ante 2000, 2001-2005,
    2006-2011, 2012-)

   Livello di lavorazione del dato: grezzo, statistica, bilancio.

   Tags: parole chiave dellargomento principale

   Area di pubblicazione: a sezione in cui viene pubblicato allinterno del portale Inps.it.

   Descrizione: un breve abstract del dato

   Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato.

   Argomento trattato: il soggetto semantico del dato
Dal dato al metadato...




 De鍖niamo cos狸 nel
complesso la modalit
 di fruizione dei dati
     attraverso le
  informazioni che li
      descrivono.
ATTRIBUZIONE DELLA
                   LICENZA
                                             Obiettivo?
                Scegliere una licenza che consenta allutente un riuso pi湛 facile e libero
                                               possibile
La IODL 2.0 prevede che lutente possa
liberamente:

1-Consultare, estrarre,copiare e pubblicare i dati
2-Creare un lavoro derivato integrando diversi
dataset.


              ..rispetto alla IODL 1.0?
          Non prevede lobbligo
        dellutente di pubblicare o
        condividere i lavori con la
     stessa licenza. E chiesto solo di
             indicare la fonte!
....Perch竪 la
     semantica?




         Aiutare gli utenti
Mettere in relazione i dati
Lavoriamo sui metadati semantici!

                                                           Cosa possiamo farci?

  Una volta de鍖niti i metadati semantici, questi sono utilizzati per la creazione
  delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti
  o dimensioni attraverso i quali si pu嘆 descrivere una stessa risorsa.
Motore a faccette




Selezionando una faccetta, si riducono i dataset trovati;
selezionandone pi湛 di una si operer una intersezione tra i
dati, riducendo ancora di pi湛 鍖no a trovare esattamente
quanto cercato.
Query expansion


             La modalit di ricerca Query expansion consente
               di interrogare il sistema utilizzando il linguaggio
              naturale, piuttosto che inserire parole chiave che
                      lutente potrebbe non conoscere.
               In questo modo il raggiungimento delle risorse
             sar notevolmente facilitato per tutte le categorie
                  di utenti (dai pi湛 esperti ai meno esperti)


                  Ad esempio: supponiamo che lutente digiti
                  la query centri per le cure termali.


                  Utilizzando la query expansion, nonostante
                  la stringa inserita non sia presente nelle
                  descrizioni dei dati, lutente sar indirizzato
                  al dato Cure forme vie respiratorie -
                  elenco alberghi convenzionati per la
                  stagione termale.
Arricchire semanticamente i dati
signi鍖ca stabilire uno standard di qualit
          dei dataset in vista dei
        Linked Open Data.


         Fare linked open data consente di abbattere
                          le barriere 鍖siche tra i dati.



                connettere e
            condividere dataset
            attraverso standard
              gi implementati
La qualit dei dataset pubblicati costituisce una
           buona pratica OpenData!


                                    Pi湛 i dati sono ricchi di
                                   informazioni ed esposti
                                       in modo preciso
                                     maggiore sar il riuso
                                     che se ne potr fare.
Buona pratica
       Un esempio applicativo

        Dati sugli attraversamenti stradali
                  (integrazione)
        Dati sugli incidenti stradali

Dal dato allinformazione
Gli Open Data Linked possono essere facilmente accessibili
                da persone e applicazioni (via mashup) per i pi湛 diversi scopi

    ma soprattutto...
- consentono di passare dal dato allinformazione -
                                 IL RIUSO COME CRITERIO DI VALUTAZIONE




                             Riuso nella PA: maggior   controllo del territorio con pi湛 semplicit

                                  Riuso privato: informazioni   ai cittadini, maggiore trasparenza

                              Riuso commerciale: sviluppo   di applicazioni pi湛 intelligenti e integrate
Il modello
OPEN DATA
Un modello di qualit per lo sviluppo OpenData in Italia
             Un modello per le PA locali


           Grazie a tutti !
                                  Filippo DAngelo
                               鍖lippo.dangelo@inps.it

More Related Content

Open data INPS

  • 2. STATO DELLARTE The best way to get value from ...LEuropa corre veloce data is to give it away..[..]..Lets join together Dicembre 2011 - Nuova OpenData Strategy and share our data Neelie Kroes, Vice-Presidente Commissione europea per lAgenda digitale. Marzo 2012- ePSI platform Conference Taking re-use to the next level Practical example of OpenData reuse and grass roots support and experience play an important role here.. [..].. Go out and make the case for OpenData more strongly!
  • 3. Le direttive dalla Digital Agenda di Dicembre 2011 Aggiornamento direttive 2003 sul riuso del PSI Rendere accessibili e riutilizzabili i contenuti documentali della PA. Rendere i dati in formato machine readable (RDF, JSON, XML). Creazione di un data portal della commissione europea. Aggiornamento delle direttive dalla ePSI conference 2012 Tutti i dati resi disponibili dal PSI devono poter essere riutilizzabili per uso commerciale e non commerciale. Gli stati membri devono introdurre un sistema di supervisione e regolamentazione al 鍖ne di rispettare le direttive UE sul riuso nei tempi stabiliti. Lo scopo delle direttive sar esteso alle informazioni contenute nelle digital libraries, musei e archivi.
  • 4. IL RIUSO COME CRITERIO OBIETTIVO: VALUTARE LA VALUTARE LA QUALIT QUALIT DEI DATASET DEI PROCESSI DI PUBBLICATI GOVERNANCE (Open Government) Open Data (Government Data) Tutti le tipologie di dati che Tutti le tipologie di dati di contribuiscono alla interesse pubblico trasparenza delle amministrazioni
  • 5. COME VALUTA LUNIONE EUROPEA ? Il riuso negli indicatori di punteggio: Implementazione delle direttive EU Dati delle amministrazioni Locali Sviluppo dei formati Pratiche di riuso Eventi ed attivit correlate
  • 7. LITALIA NON VA MALE ! 8属 POSIZIONE
  • 8. Qualche dettaglio sulla valutazione degli OpenData in Italia Dal punto di vista del punteggio non siamo lontani dai paesi gi avviati in materia di open government (UK). Implementazione delle direttive EU Sviluppo dei formati Eventi ed attivit correlate Cosa migliorare? Rilascio dei dati delle amministrazioni Locali Per migliorare il riuso implementare i Pratiche di riuso formati non basta !
  • 10. La correlazione tra pratiche di riuso e rilascio dei dataset degli enti locali suggerisce di implementare un piano di rilascio OpenData a partire dal modello degli Enti pubblici pi湛 importanti.
  • 11. Interestingly the INPS data website explicitly refers to the EU PSI Directive as the reason for publishing data for re-use. ..continuous dialogue between data holders and re-users is needed, as we are learning how to do this by doing. The INPS data release is a good step forward, and creates appetite for more.
  • 13. Perch竪 le linee guida sono importanti ? Il lavoro sugli OpenData 竪 collaborativo. E necessario individuare le tappe del processo. E necessario che la metodologia sia condivisa.
  • 14. MA... Quali dati vanno Da dove partire? aperti? E i metadati? Come produrre un dataset di qualit? Come mettere insieme i pezzi?
  • 16. Il modello INPS
  • 17. 1- Analisi di dominio e individuazione dei dati 2 - Analisi tipologica dei dati 3 - Preparazione dei dati 4 - De鍖nizione dei formati 5 - De鍖nizione dei metadati 6 - Attribuzione della licenza
  • 18. ANALISI DI DOMINIO INDIVIDUAZIONE DEI DATI Obiettivo? identi鍖care i contenuti gi esposti dallistituto allinterno delle aree di pubblicazione al 鍖ne di identi鍖care i dati. INPS.IT
  • 19. Individuare subito i dati che possono essere aperti ... Sottosezioni 1.Relazioni annuali 2.Bilanci sociali 3.Osservatorio statistico 4.Statistiche della previdenza 5.Rapporto sulla coesione sociale
  • 20. Ma XLS non 竪 un p嘆 poco Si, ma.. Abbiamo sempre bisogno di dati grezzi da cui partire La definizione del formato 竪 un processo graduale e in itinere. Possiamo sempre implementare il formato una volta pubblicati i dati.
  • 21. ANALISI TIPOLOGICA DEI DATI Di che tipo sono i dati (XLS) che abbiamo trovato? Obiettivo? Distinguere in maniera ef鍖cace dati grezzi dai dati gi manipolati:
  • 22. Dati Grezzi Dati Statistici (gi manipolati)
  • 23. PREPARAZIONE DEI DATI Obiettivo? Poich竪 molte delle fonti dei dati presentano le informazioni in maniera non strutturata 竪 opportuno effettuare unoperazione di pulizia riguardante la struttura delle tabelle e il contenuto delle stesse.
  • 24. DEFINIZIONE DEI FORMATI Obiettivo? Se in prima battuta cerchiamo dati raw dobbiamo anche pensare di implementare successivamente formati non proprietari come: : testo ( PDF, TXT ) : struttura proprietaria ( XLS ) : struttura aperta ( CSV,XML ) : struttura con URL e URI : Linked Data ( RDF + Link ) Livello di apertura
  • 25. DEFINIZIONE DEI METADATI Obiettivo? Lo step successivo nella creazione degli Open Data 竪 la de鍖nizione e la creazione di metadati, cio竪 informazioni che descrivono uno o un insieme di dati. Tali informazioni rappresentano delle propriet pi湛 signi鍖cative 鍖ssate e consentono la ricerca e il recupero dei dati stessi con lo scopo di migliorarne la visibilit e facilitarne laccesso. Alcuni importanti standard per i metadati ISO/IEC 11179 ISO 15836 Dublin Core W3C SKOS, W3C RDF/OWL
  • 26. La creazione e limplementazione dei metadati richiede attenzione alle risorse informative che tali metadati devono ri鍖ettere. Molta attenzione deve essere data alla qualit, perch竪 un pessimo metadato 竪 peggio dellassenza di metadati. Per tale ragioni sono stati creati opportuni metadati per descrivere al meglio i dati INPS. Metadati Sintattici Descr ivono il dato attr aver so le sue caratteristiche strutturali, in cui sono comprese le informazioni sul processo di creazione, organizzazione e pubblicazione. Tali metadati non aggiungono informazioni sul contenuto del dataset. Titolo: titolo dei dati Data di pubblicazione: Questa informazione riguarda la data di pubblicazione del dato allinterno del portale/minisito OpenData Inps. Formato: lestensione del file (.pdf; .xls; .rdf; .doc) Licenza : il tipo di licenza a cui 竪 legato il dato Dimensione in byte: la dimensione fisica del dato Identificativo : numero progressivo univoco del dato Link: (URL-permanent link-, link annidati, short URL) Fonte: opzionale, chi ha prodotto il dato (Direzione, altro soggetto)
  • 27. Metadati Semantici Descrivono il dato attraverso le sue caratteristiche semantiche, ovvero le informazioni sul contenuto. Tali aspetti consentono di individuare univocamente la risorse. Copertura spaziale: rappresenta il riferimento geografico del dato (coverage=area geografica: Internazionale, Europeo, Nazionale, Regionale, Provinciale, Comunale) Copertura temporale: rappresenta lestensione temporale del dato (es. ante 2000, 2001-2005, 2006-2011, 2012-) Livello di lavorazione del dato: grezzo, statistica, bilancio. Tags: parole chiave dellargomento principale Area di pubblicazione: a sezione in cui viene pubblicato allinterno del portale Inps.it. Descrizione: un breve abstract del dato Data di aggiornamento: mostra ogni quanto il dato viene tenuto aggiornato. Argomento trattato: il soggetto semantico del dato
  • 28. Dal dato al metadato... De鍖niamo cos狸 nel complesso la modalit di fruizione dei dati attraverso le informazioni che li descrivono.
  • 29. ATTRIBUZIONE DELLA LICENZA Obiettivo? Scegliere una licenza che consenta allutente un riuso pi湛 facile e libero possibile La IODL 2.0 prevede che lutente possa liberamente: 1-Consultare, estrarre,copiare e pubblicare i dati 2-Creare un lavoro derivato integrando diversi dataset. ..rispetto alla IODL 1.0? Non prevede lobbligo dellutente di pubblicare o condividere i lavori con la stessa licenza. E chiesto solo di indicare la fonte!
  • 30. ....Perch竪 la semantica? Aiutare gli utenti Mettere in relazione i dati
  • 31. Lavoriamo sui metadati semantici! Cosa possiamo farci? Una volta de鍖niti i metadati semantici, questi sono utilizzati per la creazione delle faccette per il motore di ricerca. Le faccette rappresentano i diversi aspetti o dimensioni attraverso i quali si pu嘆 descrivere una stessa risorsa.
  • 32. Motore a faccette Selezionando una faccetta, si riducono i dataset trovati; selezionandone pi湛 di una si operer una intersezione tra i dati, riducendo ancora di pi湛 鍖no a trovare esattamente quanto cercato.
  • 33. Query expansion La modalit di ricerca Query expansion consente di interrogare il sistema utilizzando il linguaggio naturale, piuttosto che inserire parole chiave che lutente potrebbe non conoscere. In questo modo il raggiungimento delle risorse sar notevolmente facilitato per tutte le categorie di utenti (dai pi湛 esperti ai meno esperti) Ad esempio: supponiamo che lutente digiti la query centri per le cure termali. Utilizzando la query expansion, nonostante la stringa inserita non sia presente nelle descrizioni dei dati, lutente sar indirizzato al dato Cure forme vie respiratorie - elenco alberghi convenzionati per la stagione termale.
  • 34. Arricchire semanticamente i dati signi鍖ca stabilire uno standard di qualit dei dataset in vista dei Linked Open Data. Fare linked open data consente di abbattere le barriere 鍖siche tra i dati. connettere e condividere dataset attraverso standard gi implementati
  • 35. La qualit dei dataset pubblicati costituisce una buona pratica OpenData! Pi湛 i dati sono ricchi di informazioni ed esposti in modo preciso maggiore sar il riuso che se ne potr fare.
  • 36. Buona pratica Un esempio applicativo Dati sugli attraversamenti stradali (integrazione) Dati sugli incidenti stradali Dal dato allinformazione
  • 37. Gli Open Data Linked possono essere facilmente accessibili da persone e applicazioni (via mashup) per i pi湛 diversi scopi ma soprattutto... - consentono di passare dal dato allinformazione - IL RIUSO COME CRITERIO DI VALUTAZIONE Riuso nella PA: maggior controllo del territorio con pi湛 semplicit Riuso privato: informazioni ai cittadini, maggiore trasparenza Riuso commerciale: sviluppo di applicazioni pi湛 intelligenti e integrate
  • 38. Il modello OPEN DATA Un modello di qualit per lo sviluppo OpenData in Italia Un modello per le PA locali Grazie a tutti ! Filippo DAngelo 鍖lippo.dangelo@inps.it