ݺߣ

ݺߣShare a Scribd company logo
Öppna data &
länkade data
Presenterat för Lärosäten Syd
Lund 7 oktober 2013
Marie Gustafsson Friberger
marie.friberger@mah.se
twitter: mariegus
http://www.flickr.com/photos/thomasleuthard/5969305019/
Living Archives
Data Games
data-games.org

livingarchives.mah.se
3

http://librisbloggen.kb.se/2013/08/09/
syftet-med-librissystemen-ochlibrissamarbetet/
4
5
Öppna data?
Data kan kallas öppna data om vem
som helst fritt får använda,
återanvända och distribuera dessa
med som största motprestation att
ange källa eller krav på att dela
data på samma sätt.
Översättning från Open Knowledge Foundation

http://opendatahandbook.org/en/what-is-open-data/index.html
Tekniskt öppen: maskinläsbart
format (minimum)
Juridiskt öppen: tydlig licens
som medger både kommerciell och
icke-kommerciell användning utan
restriktioner
Varför?
Insyn
Samhällsnytta
Innovation
...
Fler kan göra intressanta saker med data
Öppna data & Länkade data
Öppna data & Länkade data
Öppna data & Länkade data
Öppna data & Länkade data
Öppna data & Länkade data
★ Tillgänglig på webben (oavsett format),
med en öppen licens
★★ Tillgänglig som maskinläsbar strukturerad
data (t ex Excel i stället för scannad tabell)
★★★ som (2) samt ickeproprietärt format
(t ex CSV i stället för Excel)
★★★★ Alla ovan, plus att använda W3C-standarder (RDF
och SPARQL) för beskriva saker
★★★★★ Alla ovan plus att länka din data till andras data
Principer för länkade data
1. Använd URI:er för att namnge saker
2. Använd HTTP URI:er så att dessa namn
kan användas för att få mer information
3. När någon kollar en URI, ge användbar
information genom standarder (RDF*,
SPARQL)
4. Inkludera länkar till andra URI:er så att fler
saker kan upptäckas
http://www.w3.org/DesignIssues/LinkedData.html
16
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Semantiska webben
• Data-webb (snarare än dokument-webb).
• Idag kontrollerar applikationer ofta sin egen
data och delar inte med sig av den.

• Visionen med den semantiska webben är

att göra det möjligt att kombinera data från
flera olika källor.

18
Why Linked Data
matters to libraries

Fix layout

”Although making a library catalogue available as Linked
Data is mostly a matter of technical details and
transformation of data, the implications are more
profound. Sharing data, especially with communities
outside the library sector, creates an interest in our work.
Using tools and techniques that are not unique to libraries
lets us communicate easier with professionals in other
areas.
Linked Data finally, truly, connects libraries to the web.”
Martin Malmsten, LIBRIS/KB

Exposing Library Data as Linked Data – http://bit.ly/1dZ5i4Y
En kort introduktion till
W3C-rekommendationer
relaterade till den
semantiska webben
Resource Description
Framework
“Description”?
Subject - Predicate - Object
Subject - Predicate - Object

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Flera källor

+
+

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
En graf...

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Vad är vad?
• Om två källor använder samma

benämningar, avser de då samma ”sak”?

• URI:er to the rescue!
• En URI avser en specifik resurs.
http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/
Ontologier – OWL
• Kallas ofta vokabulärer i

samband med länkade data

• Används för att beskriva

begrepp och relationer mellan
begrepp i någon domän

• Kan innehålla allt från en enkel
vokabulär till komplexa
logiska uttryck för att dra
slutsatser baserat på data

29
Exempel: Nobelpris
Classes:
NobelPrize
LaureateAward
Laureate
Category
PrizeFile
AwardFile

Objectproperties:
nobelPrize (kopplar Laureate till NobelPrize)
university (kopplar Laureate till universitet
från DBPedia)
....
Datatypeproperties:
year
motivation
contribution
...
http://www.nobelprize.org/nobel_organizations/nobelmedia/
nobelprize_org/developer/manual-linkeddata/terms.rdf
dc syftar på ”namespace” http://purl.org/dc/elements/1.1/
http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/
Simple Knowledge
Organization System (SKOS)

• RDF vokabulär för att representera

semiformella knowledge organization systems
(KOSs), exempelvis thesauri o taxonomier.

ex:animals rdf:type skos:Concept;
skos:prefLabel "animals"@en;
skos:narrower ex:mammals.
ex:birds rdf:type skos:Concept;
skos:prefLabel "birds"@en;
skos:related ex:ornithology.
SPARQL
• SPARQL Protocol and RDF Query
Language

• En fråga består av en uppsättning trippelmönster (tripple patterns).

• Trippel-mönster är som RDF-tripplar

förutom att varje subjekt, predikat och
objekt kan vara en variabel.
Exempel
Libris
Libris som länkade data
Sedan 2008...
Länkar till flera
olika dataset, bl a
DBPedia, Library
of Congress
För att leka med SPARQL: http://libris.kb.se/sparql
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
select ?uri ?book ?title where {
?uri foaf:name "August Strindberg" .
?uri rdf:type foaf:Person .
?book dc:creator ?uri .
?book dc:title ?title .
}
http://libris.kb.se/sparql
37
38
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX dbpedia: <http://dbpedia.org/ontology/>
PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
select ?book ?title ?author where {
?book dc:subject <http://libris.kb.se/resource/auth/150197> .
?book dc:title ?title .
?book dc:creator ?author .
}
limit 100
40
• Extraherar strukturerad information från
Wikipedia och tillgängliggör den via
webben.

• Beskriver över 3,77 miljoner saker, varav

2,35 miljoner är klassificerade i en
konsistent ontologi som innehåller 764.000
personer, 573.000 platser, 112.000
musikalbum, 72.000 filmer, 18.000
videospel, 192.000 organisationer, 202.000
arter och 5.500 sjukdomar.
Möjliga frågor
• DBPedia gör det möjligt att ställa frågor där
informationen som behövs för att svara
finns spridd över flera olika Wikipediaartiklar.

• Till exempel...
Personer födda i
Köpenhamn innan år 1900.

43
44
45
http://www.flickr.com/photos/nationaalarchief/4398562726/

DISKA
Digitala semantiska
kulturarvsauktoriteter
”väsentliga auktoritetslistor
som länkbar, öppen data via
webben”
http://www.digisam.se/index.php/hem/tags/tag/diska

46

Exempel på poster: http://prezi.com/qdze6qvqmscr/
diska-ett-projekt-pa-digisam-i-samarbete-med-kth/
ٳٱ://ɷɷ.fli.dz/dzٴDz/󲹲Գdz/3383629917/
Frågor?
Marie Gustafsson Friberger
marie.friberger@mah.se
twitter: mariegus

More Related Content

Öppna data & Länkade data

  • 1. Öppna data & länkade data Presenterat för Lärosäten Syd Lund 7 oktober 2013 Marie Gustafsson Friberger marie.friberger@mah.se twitter: mariegus http://www.flickr.com/photos/thomasleuthard/5969305019/
  • 4. 4
  • 5. 5
  • 6. Öppna data? Data kan kallas öppna data om vem som helst fritt får använda, återanvända och distribuera dessa med som största motprestation att ange källa eller krav på att dela data på samma sätt. Översättning från Open Knowledge Foundation http://opendatahandbook.org/en/what-is-open-data/index.html
  • 7. Tekniskt öppen: maskinläsbart format (minimum) Juridiskt öppen: tydlig licens som medger både kommerciell och icke-kommerciell användning utan restriktioner
  • 14. ★ Tillgänglig på webben (oavsett format), med en öppen licens ★★ Tillgänglig som maskinläsbar strukturerad data (t ex Excel i stället för scannad tabell) ★★★ som (2) samt ickeproprietärt format (t ex CSV i stället för Excel) ★★★★ Alla ovan, plus att använda W3C-standarder (RDF och SPARQL) för beskriva saker ★★★★★ Alla ovan plus att länka din data till andras data
  • 15. Principer för länkade data 1. Använd URI:er för att namnge saker 2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information 3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL) 4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas http://www.w3.org/DesignIssues/LinkedData.html
  • 16. 16
  • 17. Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 18. Semantiska webben • Data-webb (snarare än dokument-webb). • Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den. • Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor. 18
  • 19. Why Linked Data matters to libraries Fix layout ”Although making a library catalogue available as Linked Data is mostly a matter of technical details and transformation of data, the implications are more profound. Sharing data, especially with communities outside the library sector, creates an interest in our work. Using tools and techniques that are not unique to libraries lets us communicate easier with professionals in other areas. Linked Data finally, truly, connects libraries to the web.” Martin Malmsten, LIBRIS/KB Exposing Library Data as Linked Data – http://bit.ly/1dZ5i4Y
  • 20. En kort introduktion till W3C-rekommendationer relaterade till den semantiska webben
  • 23. Subject - Predicate - Object Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 24. Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 25. Flera källor + + Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 26. En graf... Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 27. Vad är vad? • Om två källor använder samma benämningar, avser de då samma ”sak”? • URI:er to the rescue! • En URI avser en specifik resurs.
  • 29. Ontologier – OWL • Kallas ofta vokabulärer i samband med länkade data • Används för att beskriva begrepp och relationer mellan begrepp i någon domän • Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data 29
  • 30. Exempel: Nobelpris Classes: NobelPrize LaureateAward Laureate Category PrizeFile AwardFile Objectproperties: nobelPrize (kopplar Laureate till NobelPrize) university (kopplar Laureate till universitet från DBPedia) .... Datatypeproperties: year motivation contribution ... http://www.nobelprize.org/nobel_organizations/nobelmedia/ nobelprize_org/developer/manual-linkeddata/terms.rdf
  • 31. dc syftar på ”namespace” http://purl.org/dc/elements/1.1/ http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/
  • 32. Simple Knowledge Organization System (SKOS) • RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier. ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals. ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology.
  • 33. SPARQL • SPARQL Protocol and RDF Query Language • En fråga består av en uppsättning trippelmönster (tripple patterns). • Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.
  • 35. Libris som länkade data Sedan 2008... Länkar till flera olika dataset, bl a DBPedia, Library of Congress För att leka med SPARQL: http://libris.kb.se/sparql
  • 36. PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX dbpedia: <http://dbpedia.org/ontology/> PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> select ?uri ?book ?title where { ?uri foaf:name "August Strindberg" . ?uri rdf:type foaf:Person . ?book dc:creator ?uri . ?book dc:title ?title . } http://libris.kb.se/sparql
  • 37. 37
  • 38. 38
  • 39. PREFIX owl: <http://www.w3.org/2002/07/owl#> PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX dbpedia: <http://dbpedia.org/ontology/> PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dc: <http://purl.org/dc/elements/1.1/> select ?book ?title ?author where { ?book dc:subject <http://libris.kb.se/resource/auth/150197> . ?book dc:title ?title . ?book dc:creator ?author . } limit 100
  • 40. 40
  • 41. • Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben. • Beskriver över 3,77 miljoner saker, varav 2,35 miljoner är klassificerade i en konsistent ontologi som innehåller 764.000 personer, 573.000 platser, 112.000 musikalbum, 72.000 filmer, 18.000 videospel, 192.000 organisationer, 202.000 arter och 5.500 sjukdomar.
  • 42. Möjliga frågor • DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipediaartiklar. • Till exempel...
  • 43. Personer födda i Köpenhamn innan år 1900. 43
  • 44. 44
  • 45. 45
  • 46. http://www.flickr.com/photos/nationaalarchief/4398562726/ DISKA Digitala semantiska kulturarvsauktoriteter ”väsentliga auktoritetslistor som länkbar, öppen data via webben” http://www.digisam.se/index.php/hem/tags/tag/diska 46 Exempel på poster: http://prezi.com/qdze6qvqmscr/ diska-ett-projekt-pa-digisam-i-samarbete-med-kth/