際際滷

際際滷Share a Scribd company logo
SKOS, Nuovo Soggettario e Wikidata
appunti per l'evoluzione dei sistemi di gestione
dell'informazione bibliografica
Giovanni Bergamin, Biblioteca Nazionale Centrale Firenze
Parler嘆 di
 il punto di partenza:
o collegamenti NS - Wikipedia, 2006 -
o pubblicazione del NS in SKOS e in Zthes, 2010 -
 cosa sta cambiando con Wikidata, 2012 -
 intanto ... schema.org, 2011-
Parler嘆 di (2)
 qualche appunto di viaggio
o equilibrio (non facile) tra visioni dallalto e soluzioni
che partono da esigenze concrete
o noi bibliotecari non siamo pi湛 gli unici (o i principali?)
produttori di metadati bibliografici.
Nuovo soggettario e fonti
La fonte 竪 resa come collegamento (link) attivabile
(cliccabile) tra tre pagine web
Nuovo soggettario e fruibilit da altre
applicazioni (p. es. sistemi di catalogazione)
La proposta Zthes: modello standard Z39.50
con evoluzione del protocollo - http - e
sintassi di codifica - xml.
Domanda:
<http://zthes.it?query=dc.title = Bioarchitettura>
http://zthes.bncf.firenze.sbn.it/SRU/servlet/SRU?query=dc.titl
e+%3D+%22Bioarchitettura%22&version=1.1&operation=se
archRetrieve&startRecord=1
Nuovo soggettario e fruibilit da altre
applicazioni (p. es. sistemi di catalogazione) -2
Risposta:
Risposta Zthes:
Nuovo soggettario e fruibilit da altre
applicazioni (p. es. sistemi di catalogazione) - 3
Il successo dellofferta Zthes 
pro:
 evolve uno strumento di successo della tradizione
bibliotecaria (Z39.50)
contro:
 non fa propriamente parte del mondo del web
semantico e dei linked data
Lofferta SKOS del NS - il contesto
 Stiamo sicuramente andando verso il web
dei dati (o web semantico)
 Il web dei dati 竪 in realt un web dove i
metadati hanno un ruolo fondamentale
Il contesto,1: Metadati: 3 definizioni
Wikipedia: data about data
P. CAPLAN structured information about an information
resource of any media type or format dove structured
information significa che l'informazione must be recorded in
accordance with some documented metadata scheme.
K. COYLE, Metadata is: constructed (metadata is wholly
artificial, created by human beings.); for a purpose (there is no
universal metadata: for metadata to be useful it has to serve a
purpose); to facilitate an activity (there's something that you do
with metadata.)
Il contesto,2: open data - linked data - linked
open data
Se ne parla dal 2006 con lobiettivo di
affermare nella vita quotidiana le visioni del
Web semantico proposte agli inizi di questo
secolo:
integrare nel web dei documenti un web
dei dati.
Il contesto,3: Web semantico
 Il web dei documenti 竪 basato sulla pubblicazione di
documenti contenenti dati strutturati prevalentemente ai fini
della loro presentazione e fruizione da parte degli utenti, ma
non strutturati per il loro riuso e recupero da parte di
applicazioni.
 mancano in questi documenti metadati strutturati che
attribuiscono ad una determinata stringa di caratteri il
significato di prezzo, titolo di un libro, ricetta ecc
Il contesto,4: RDF e SPARQL
 1997- la proposta - da parte del World Wide
Web Consortium - del linguaggio RDF
(Resource Description Framework) per pubblicare
su web dati interpretabili senza ambiguit da
parte di macchine.
 2008 - SPARQL (SPARQL Protocol and RDF
Query Language) come linguaggio di
interrogazione per dati rappresentati tramite RDF
Dal 2010 NS disponibile in SKOS
<tns:33097>
<w3:syntax-ns#type>
<w3:skos/core#Concept> .
<tns:33097>
<w3:skos/core#prefLabel>
"Bioarchitettura"@it .
<tns:33097>
<w3:skos/core#broader>
<tns:1076> .
<tns:33097>
<w3:skos/core#closeMatch>
<wikipedia:Bioarchitettura> .
<tns:33097>
<w3:skos/core#editorialNote
>
"FONTE: BNI
2006-2013; Treccani.it; DeM;
Wikipedia(IT)"
Architettura
E disponibile anche un endpoint SPQRQL
Domanda: quanti e quali i collegamenti semantici del NS (
51335 voci a marzo 2014)?
20746 collegamenti semantici
I risultati dellofferta SKOS
 - oltre allaumento dei collegamenti semantici verso
 - crescono anche i collegamenti semantici da,
principalmente:
o Wikipedia (attraverso Wikidata)
o LCSH (Library of Congress Subject Headings)
 - Avvio in BNCF di un progetto sperimentale di
indicizzazione (semi)automatica dei documenti
digitali nativi (principalmente)
I collegamenti semantici da Wikipedia
(via Wikidata) - 1
I collegamenti semantici da Wikipedia
(via Wikidata) - 2
Da Wikidata - 1
Da Wikidata - 2
Da Wikidata - 3
Da Wikidata - 4
BNCF
Thesaurus
P508
Wikidata - 5
Wikidata - 6
Wikidata - 7
nasce come punto centrale per
 agevolare i link tra le pagine (relative allo
stesso argomento) delle 287 versioni di
Wikipedia
 condividere in unico punto informazioni che
possono apparire in pagine diverse (es. la
popolazione di Roma)
Wikidata - 8
 竪 diventato (il | un) nodo centrale per integrare il
web dei documenti e il web dei dati (al di la della
stessa Wikipedia)
 il progetto ha ricevuto donazioni anche da: Allen
Institute for Artificial Intelligence [ai]2; the Gordon
and Betty Moore Foundation; Google (~2 mln )
 ha preferito prima risolvere problemi reali e poi
evolvere verso (e contribuire a) RDF/SPARQL
ecc
Anche i motori di ricerca stanno lavorando
per integrare web dei dati e web dei documenti
la proposta oggi pi湛 coerente:
schema.org = arricchire le pagine web correnti con
metadati strutturati che attribuiscono ad una
determinata stringa di caratteri il significato di
prezzo, titolo di un libro, ricetta ecc
NB: gli stessi motori di ricerca usano database
strutturati sul modello wikidata per rispondere alle
richieste degli utenti anche con dati non solo con
documenti (p. es Google usa tra gli altri db
Freebase e Wikipedia per il suo Knowledge Graph )
Schema.org - 2
Un esempio di
ricerca su
Google
versione
inglese che
sfrutta
schema.org per
le ricette
Schema.org - 3
Un esempio con
Custom Search
Google limitato a
Worldcat. Con CS
si pu嘆 limitare la
ricerca -tra le altre
possibilit - alle
sole pagine
codificate con
schema.org (e/o
provenienti da uno
o pi湛 siti
web/cataloghi)
Appunti finali
 Attraverso gli OPAC occorre che i dati bibliografici
siano presenti semanticamente sul web:
o la strutturazione dei dati con schema.org sembra
essere un buon punto di partenza
o Si pu嘆 fare ora senza aspettare la conversione in
RDF (basata su complesse ontologie) dei nostri
cataloghi
 Interessante la recente decisione di OCLC di
pubblicare 197 mln di opere con the properties
defined by the CreativeWork type from the
Schema.org vocabulary
Appunti finali - 2
 Integrare nei sistemi di catalogazione la
possibilit di acquisire (e di creare) identificativi
URI relativi a entit bibliografiche (autori, opere
ecc.) sfruttando anche Wikidata come crocevia
fondamentale per il web dei dati
 noi bibliotecari non siamo pi湛 gli unici (o i
principali?) produttori di metadati bibliografici.
Grazie

More Related Content

SKOS, Nuovo Soggettario e Wikidata

  • 1. SKOS, Nuovo Soggettario e Wikidata appunti per l'evoluzione dei sistemi di gestione dell'informazione bibliografica Giovanni Bergamin, Biblioteca Nazionale Centrale Firenze
  • 2. Parler嘆 di il punto di partenza: o collegamenti NS - Wikipedia, 2006 - o pubblicazione del NS in SKOS e in Zthes, 2010 - cosa sta cambiando con Wikidata, 2012 - intanto ... schema.org, 2011-
  • 3. Parler嘆 di (2) qualche appunto di viaggio o equilibrio (non facile) tra visioni dallalto e soluzioni che partono da esigenze concrete o noi bibliotecari non siamo pi湛 gli unici (o i principali?) produttori di metadati bibliografici.
  • 5. La fonte 竪 resa come collegamento (link) attivabile (cliccabile) tra tre pagine web
  • 6. Nuovo soggettario e fruibilit da altre applicazioni (p. es. sistemi di catalogazione) La proposta Zthes: modello standard Z39.50 con evoluzione del protocollo - http - e sintassi di codifica - xml. Domanda: <http://zthes.it?query=dc.title = Bioarchitettura> http://zthes.bncf.firenze.sbn.it/SRU/servlet/SRU?query=dc.titl e+%3D+%22Bioarchitettura%22&version=1.1&operation=se archRetrieve&startRecord=1
  • 7. Nuovo soggettario e fruibilit da altre applicazioni (p. es. sistemi di catalogazione) -2 Risposta: Risposta Zthes:
  • 8. Nuovo soggettario e fruibilit da altre applicazioni (p. es. sistemi di catalogazione) - 3 Il successo dellofferta Zthes pro: evolve uno strumento di successo della tradizione bibliotecaria (Z39.50) contro: non fa propriamente parte del mondo del web semantico e dei linked data
  • 9. Lofferta SKOS del NS - il contesto Stiamo sicuramente andando verso il web dei dati (o web semantico) Il web dei dati 竪 in realt un web dove i metadati hanno un ruolo fondamentale
  • 10. Il contesto,1: Metadati: 3 definizioni Wikipedia: data about data P. CAPLAN structured information about an information resource of any media type or format dove structured information significa che l'informazione must be recorded in accordance with some documented metadata scheme. K. COYLE, Metadata is: constructed (metadata is wholly artificial, created by human beings.); for a purpose (there is no universal metadata: for metadata to be useful it has to serve a purpose); to facilitate an activity (there's something that you do with metadata.)
  • 11. Il contesto,2: open data - linked data - linked open data Se ne parla dal 2006 con lobiettivo di affermare nella vita quotidiana le visioni del Web semantico proposte agli inizi di questo secolo: integrare nel web dei documenti un web dei dati.
  • 12. Il contesto,3: Web semantico Il web dei documenti 竪 basato sulla pubblicazione di documenti contenenti dati strutturati prevalentemente ai fini della loro presentazione e fruizione da parte degli utenti, ma non strutturati per il loro riuso e recupero da parte di applicazioni. mancano in questi documenti metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc
  • 13. Il contesto,4: RDF e SPARQL 1997- la proposta - da parte del World Wide Web Consortium - del linguaggio RDF (Resource Description Framework) per pubblicare su web dati interpretabili senza ambiguit da parte di macchine. 2008 - SPARQL (SPARQL Protocol and RDF Query Language) come linguaggio di interrogazione per dati rappresentati tramite RDF
  • 14. Dal 2010 NS disponibile in SKOS <tns:33097> <w3:syntax-ns#type> <w3:skos/core#Concept> . <tns:33097> <w3:skos/core#prefLabel> "Bioarchitettura"@it . <tns:33097> <w3:skos/core#broader> <tns:1076> . <tns:33097> <w3:skos/core#closeMatch> <wikipedia:Bioarchitettura> . <tns:33097> <w3:skos/core#editorialNote > "FONTE: BNI 2006-2013; Treccani.it; DeM; Wikipedia(IT)" Architettura
  • 15. E disponibile anche un endpoint SPQRQL Domanda: quanti e quali i collegamenti semantici del NS ( 51335 voci a marzo 2014)?
  • 17. I risultati dellofferta SKOS - oltre allaumento dei collegamenti semantici verso - crescono anche i collegamenti semantici da, principalmente: o Wikipedia (attraverso Wikidata) o LCSH (Library of Congress Subject Headings) - Avvio in BNCF di un progetto sperimentale di indicizzazione (semi)automatica dei documenti digitali nativi (principalmente)
  • 18. I collegamenti semantici da Wikipedia (via Wikidata) - 1
  • 19. I collegamenti semantici da Wikipedia (via Wikidata) - 2
  • 23. Da Wikidata - 4 BNCF Thesaurus P508
  • 26. Wikidata - 7 nasce come punto centrale per agevolare i link tra le pagine (relative allo stesso argomento) delle 287 versioni di Wikipedia condividere in unico punto informazioni che possono apparire in pagine diverse (es. la popolazione di Roma)
  • 27. Wikidata - 8 竪 diventato (il | un) nodo centrale per integrare il web dei documenti e il web dei dati (al di la della stessa Wikipedia) il progetto ha ricevuto donazioni anche da: Allen Institute for Artificial Intelligence [ai]2; the Gordon and Betty Moore Foundation; Google (~2 mln ) ha preferito prima risolvere problemi reali e poi evolvere verso (e contribuire a) RDF/SPARQL ecc
  • 28. Anche i motori di ricerca stanno lavorando per integrare web dei dati e web dei documenti la proposta oggi pi湛 coerente: schema.org = arricchire le pagine web correnti con metadati strutturati che attribuiscono ad una determinata stringa di caratteri il significato di prezzo, titolo di un libro, ricetta ecc NB: gli stessi motori di ricerca usano database strutturati sul modello wikidata per rispondere alle richieste degli utenti anche con dati non solo con documenti (p. es Google usa tra gli altri db Freebase e Wikipedia per il suo Knowledge Graph )
  • 29. Schema.org - 2 Un esempio di ricerca su Google versione inglese che sfrutta schema.org per le ricette
  • 30. Schema.org - 3 Un esempio con Custom Search Google limitato a Worldcat. Con CS si pu嘆 limitare la ricerca -tra le altre possibilit - alle sole pagine codificate con schema.org (e/o provenienti da uno o pi湛 siti web/cataloghi)
  • 31. Appunti finali Attraverso gli OPAC occorre che i dati bibliografici siano presenti semanticamente sul web: o la strutturazione dei dati con schema.org sembra essere un buon punto di partenza o Si pu嘆 fare ora senza aspettare la conversione in RDF (basata su complesse ontologie) dei nostri cataloghi Interessante la recente decisione di OCLC di pubblicare 197 mln di opere con the properties defined by the CreativeWork type from the Schema.org vocabulary
  • 32. Appunti finali - 2 Integrare nei sistemi di catalogazione la possibilit di acquisire (e di creare) identificativi URI relativi a entit bibliografiche (autori, opere ecc.) sfruttando anche Wikidata come crocevia fondamentale per il web dei dati noi bibliotecari non siamo pi湛 gli unici (o i principali?) produttori di metadati bibliografici.