Presentation för bibliotekarier vid Lärosäten Syd,
Lund 7 oktober 203
1 of 48
Download to read offline
More Related Content
Öppna data & Länkade data
1. Öppna data &
länkade data
Presenterat för Lärosäten Syd
Lund 7 oktober 2013
Marie Gustafsson Friberger
marie.friberger@mah.se
twitter: mariegus
http://www.flickr.com/photos/thomasleuthard/5969305019/
6. Öppna data?
Data kan kallas öppna data om vem
som helst fritt får använda,
återanvända och distribuera dessa
med som största motprestation att
ange källa eller krav på att dela
data på samma sätt.
Översättning från Open Knowledge Foundation
http://opendatahandbook.org/en/what-is-open-data/index.html
7. Tekniskt öppen: maskinläsbart
format (minimum)
Juridiskt öppen: tydlig licens
som medger både kommerciell och
icke-kommerciell användning utan
restriktioner
14. ★ Tillgänglig på webben (oavsett format),
med en öppen licens
★★ Tillgänglig som maskinläsbar strukturerad
data (t ex Excel i stället för scannad tabell)
★★★ som (2) samt ickeproprietärt format
(t ex CSV i stället för Excel)
★★★★ Alla ovan, plus att använda W3C-standarder (RDF
och SPARQL) för beskriva saker
★★★★★ Alla ovan plus att länka din data till andras data
15. Principer för länkade data
1. Använd URI:er för att namnge saker
2. Använd HTTP URI:er så att dessa namn
kan användas för att få mer information
3. När någon kollar en URI, ge användbar
information genom standarder (RDF*,
SPARQL)
4. Inkludera länkar till andra URI:er så att fler
saker kan upptäckas
http://www.w3.org/DesignIssues/LinkedData.html
17. Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
18. Semantiska webben
• Data-webb (snarare än dokument-webb).
• Idag kontrollerar applikationer ofta sin egen
data och delar inte med sig av den.
• Visionen med den semantiska webben är
att göra det möjligt att kombinera data från
flera olika källor.
18
19. Why Linked Data
matters to libraries
Fix layout
”Although making a library catalogue available as Linked
Data is mostly a matter of technical details and
transformation of data, the implications are more
profound. Sharing data, especially with communities
outside the library sector, creates an interest in our work.
Using tools and techniques that are not unique to libraries
lets us communicate easier with professionals in other
areas.
Linked Data finally, truly, connects libraries to the web.”
Martin Malmsten, LIBRIS/KB
Exposing Library Data as Linked Data – http://bit.ly/1dZ5i4Y
20. En kort introduktion till
W3C-rekommendationer
relaterade till den
semantiska webben
29. Ontologier – OWL
• Kallas ofta vokabulärer i
samband med länkade data
• Används för att beskriva
begrepp och relationer mellan
begrepp i någon domän
• Kan innehålla allt från en enkel
vokabulär till komplexa
logiska uttryck för att dra
slutsatser baserat på data
29
31. dc syftar på ”namespace” http://purl.org/dc/elements/1.1/
http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/
32. Simple Knowledge
Organization System (SKOS)
• RDF vokabulär för att representera
semiformella knowledge organization systems
(KOSs), exempelvis thesauri o taxonomier.
ex:animals rdf:type skos:Concept;
skos:prefLabel "animals"@en;
skos:narrower ex:mammals.
ex:birds rdf:type skos:Concept;
skos:prefLabel "birds"@en;
skos:related ex:ornithology.
33. SPARQL
• SPARQL Protocol and RDF Query
Language
• En fråga består av en uppsättning trippelmönster (tripple patterns).
• Trippel-mönster är som RDF-tripplar
förutom att varje subjekt, predikat och
objekt kan vara en variabel.
35. Libris som länkade data
Sedan 2008...
Länkar till flera
olika dataset, bl a
DBPedia, Library
of Congress
För att leka med SPARQL: http://libris.kb.se/sparql
41. • Extraherar strukturerad information från
Wikipedia och tillgängliggör den via
webben.
• Beskriver över 3,77 miljoner saker, varav
2,35 miljoner är klassificerade i en
konsistent ontologi som innehåller 764.000
personer, 573.000 platser, 112.000
musikalbum, 72.000 filmer, 18.000
videospel, 192.000 organisationer, 202.000
arter och 5.500 sjukdomar.
42. Möjliga frågor
• DBPedia gör det möjligt att ställa frågor där
informationen som behövs för att svara
finns spridd över flera olika Wikipediaartiklar.
• Till exempel...