Min introduktion till länkad data från träffen om länkad data i Sverige: http://ldsv.eventbrite.com/
1 of 43
Download to read offline
More Related Content
Länkad data
1. Länkad data
Länkad data i Sverige, 17 april, 2012
Marie Gustafsson Friberger, Malmö högskola
marie.friberger@mah.se
twitter: mariegus
2. Översikt
• Länkade data och den semantiska webben
• En kort introduktion till SW-relaterad W3C
rekommendationer
• Några exempel
• Vill du tillgängliggöra data och/eller vokabulär?
• Vill du hitta data?
• Vill du bygga?
2
3. Hans Rosling
ٳٱ://ɷɷ.fli.dz/dzٴDz/2317645008/2663925153/
4. Hans Rosling
"The database hugging in public institutions
is hampering innovation."
Hans Rosling at OECD World Forum in Istanbul, 2007
http://www.viddler.com/explore/JesseRobbins/videos/4/
ٳٱ://ɷɷ.fli.dz/dzٴDz/2317645008/2663925153/
7. • Hur tillhandahålla data så att den går att
återanvända?
• Hur möjliggöra upptäckandet av relevanta
data bland alla dataset som finns tillgängliga?
• Hur möjliggöra att applikationer kan
integrera data från tidigare okända
datakällor?
7
8. ★ Tillgänglig på webben (oavsett format),
med en öppen licens
★★ Tillgänglig som maskinläsbar strukturerad
data (t ex Excel i stället för scannad tabell)
★★★ som (2) samt ickeproprietärt format
(t ex CSV i stället för Excel)
★★★★ Alla ovan, plus att använda W3C-standarder (RDF
och SPARQL) för beskriva saker
★★★★★ Alla ovan plus att länka din data till andras data
9. Principer för länkade data
1. Använd URI:er för att namnge saker
2. Använd HTTP URI:er så att dessa namn
kan användas för att få mer information
3. När någon kollar en URI, ge användbar
information genom standarder (RDF*,
SPARQL)
4. Inkludera länkar till andra URI:er så att fler
saker kan upptäckas
http://www.w3.org/DesignIssues/LinkedData.html
11. Linked data
11
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
12. Semantiska webben
• Data-webb (snarare än dokument-webb).
• Idag kontrollerar applikationer ofta sin egen
data och delar inte med sig av den.
• Visionen med den semantiska webben är
att göra det möjligt att kombinera data från
flera olika källor.
12
13. Main SW components
common formats for define the concepts
integration and and relationships used
combination of data drawn to describe and
from diverse sources represent an area of
concern
Linked Ontologies
RDF OWL
Data
Vocabularies
SPARQL SKOS
13
14. En kort introduktion till
W3C-rekommendationer
relaterade till den
semantiska webben
17. Subject - Predicate - Object
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
18. Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
19. Flera källor
+
+ Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
20. En graf...
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
21. Vad är vad?
• Om två källor använder samma
benämningar, avser de då samma ”sak”?
• URI:er to the rescue!
• Två noder avser samma sak om de
använder samma URI.
22. SPARQL
• SPARQL Protocol and RDF Query
Language
• En fråga består av en uppsättning trippel-
mönster (tripple patterns).
• Trippel-mönster är som RDF-tripplar
förutom att varje subjekt, predikat och
objekt kan vara en variabel.
23. Ontologier – OWL
• Kallas ofta vokabulärer i
samband med länkade data
• Används för att beskriva
begrepp och relationer mellan
begrepp I någon domän
• Kan innehålla allt från en enkel
vokabulär till komplexa
logiska uttryck för att dra
slutsatser baserat på data
23
24. Simple Knowledge
Organization System (SKOS)
• RDF vokabulär för att representera
semiformella knowledge organization systems
(KOSs), exempelvis thesauri o taxonomier.
ex:animals rdf:type skos:Concept;
skos:prefLabel "animals"@en;
skos:narrower ex:mammals.
ex:birds rdf:type skos:Concept;
skos:prefLabel "birds"@en;
skos:related ex:ornithology.
24
26. • Extraherar strukturerad information från
Wikipedia och tillgängliggör den via
webben.
• Beskriver över 3,4 miljoner saker, varav 1,5
miljoner är klassificerad i en konsistent
ontologi som innehåller 312.000 personer,
413.000 platser, 94.000 musik album, 49.000
filmer, 15.000 videospel, 140.000
organisationer, 146.000 arter och 4.600
sjukdomar.
27. Möjliga frågor
• DBPedia gör det möjligt att ställa frågor där
informationen som behövs för att svara
finns spridd över flera olika Wikipedia-
artiklar.
• Till exempel...
34. Vill du göra data och/
eller vokabulär
tillgängliga?
35. Välja vokabulär
• Hur många använder? Vilka?
• Underhåll och styrning
• Vilka koncept täcker den?
• Hur uttrycksfull är den?
Baserat på http://linkeddatabook.com/
35
36. Verktyg för att utveckla
vokabulär
Specifikt för SKOS:
• Protégé • PoolParty Thesaurus
• TopBraid Composer Manager
• NeOn Toolkit • VocBench (developed by
the FAO of the UN)
36
37. Recept för att publicera
länkade data
• Statiska RDF/XML-filer
• Som RDF inbäddad i HTML (RDFa)
• Genom egna server-side scripts
• Från relationsdatabaser
• Från RDF Triple Stores
• Genom att ”wrappa” existerande API:er
37 http://linkeddatabook.com/
43. Läs mer!
• Heath and Bizer (2011) Linked Data: Evolving the
Web into a Global Data Space
http://linkeddatabook.com/editions/1.0/
• Allemang and Hendler (2011) Semantic Web for
the Working Ontologist
http://workingontologist.org/
• http://www.w3.org/2001/sw/wiki/Tools