ݺߣ

ݺߣShare a Scribd company logo
Länkade data
Länkad data i Sverige, 16 april, 2013
Marie Gustafsson Friberger, Malmö högskola
marie.friberger@mah.se
twitter: mariegus
Översikt
• Länkade data och den semantiska webben
• En kort introduktion till SW-relaterad W3C
rekommendationer
• Några exempel
• Vill du tillgängliggöra data och/eller vokabulär?
• Vill du hitta data?
• Vill du bygga?
2
Hans Rosling
http://www.flickr.com/photos/23176450@N08/2663925153/
Hans Rosling
http://www.flickr.com/photos/23176450@N08/2663925153/
"The database hugging in public institutions
is hampering innovation."
Hans Rosling at OECD World Forum in Istanbul, 2007
http://www.viddler.com/explore/JesseRobbins/videos/4/
Länkade data – intro på LDSV 2013
6
• Hur tillhandahålla data så att den går att
återanvända?
• Hur möjliggöra upptäckandet av relevanta
data bland alla dataset som finns tillgängliga?
• Hur möjliggöra att applikationer kan
integrera data från tidigare okända
datakällor?
7
★ Tillgänglig på webben (oavsett format),
med en öppen licens
★★ Tillgänglig som maskinläsbar strukturerad
data (t ex Excel i stället för scannad tabell)
★★★ som (2) samt ickeproprietärt format
(t ex CSV i stället för Excel)
★★★★ Alla ovan, plus att använda W3C-standarder (RDF
och SPARQL) för beskriva saker
★★★★★ Alla ovan plus att länka din data till andras data
Principer för länkade data
1. Använd URI:er för att namnge saker
2. Använd HTTP URI:er så att dessa namn
kan användas för att få mer information
3. När någon kollar en URI, ge användbar
information genom standarder (RDF*,
SPARQL)
4. Inkludera länkar till andra URI:er så att fler
saker kan upptäckas
http://www.w3.org/DesignIssues/LinkedData.html
10
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
Semantiska webben
• Data-webb (snarare än dokument-webb).
• Idag kontrollerar applikationer ofta sin egen
data och delar inte med sig av den.
• Visionen med den semantiska webben är
att göra det möjligt att kombinera data från
flera olika källor.
12
define the concepts
and relationships used
to describe and
represent an area of
concern
13
Main SW components
RDF Linked
Data
OWL
SKOS
Vocabularies
Ontologies
common formats for
integration and
combination of data drawn
from diverse sources
SPARQL
En kort introduktion till
W3C-rekommendationer
relaterade till den
semantiska webben
Resource Description
Framework
“Description”?
Subject - Predicate - Object
Subject - Predicate - Object
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Flera källor
+
+ Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
En graf...
Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
Vad är vad?
• Om två källor använder samma
benämningar, avser de då samma ”sak”?
• URI:er to the rescue!
• Två noder avser samma sak om de
använder samma URI.
SPARQL
• SPARQL Protocol and RDF Query
Language
• En fråga består av en uppsättning trippel-
mönster (tripple patterns).
• Trippel-mönster är som RDF-tripplar
förutom att varje subjekt, predikat och
objekt kan vara en variabel.
Ontologier – OWL
• Kallas ofta vokabulärer i
samband med länkade data
• Används för att beskriva
begrepp och relationer mellan
begrepp i någon domän
• Kan innehålla allt från en enkel
vokabulär till komplexa
logiska uttryck för att dra
slutsatser baserat på data
23
Simple Knowledge
Organization System (SKOS)
• RDF vokabulär för att representera
semiformella knowledge organization systems
(KOSs), exempelvis thesauri o taxonomier.
24
ex:animals rdf:type skos:Concept;
skos:prefLabel "animals"@en;
skos:narrower ex:mammals.
ex:birds rdf:type skos:Concept;
skos:prefLabel "birds"@en;
skos:related ex:ornithology.
25
Exempel
DBpedia
NYTimes
• Extraherar strukturerad information från
Wikipedia och tillgängliggör den via
webben.
• Beskriver över 3,77 miljoner saker, varav
2,35 miljoner är klassificerade i en
konsistent ontologi som innehåller 764.000
personer, 573.000 platser, 112.000
musikalbum, 72.000 filmer, 18.000
videospel, 192.000 organisationer, 202.000
arter och 5.500 sjukdomar.
Möjliga frågor
• DBPedia gör det möjligt att ställa frågor där
informationen som behövs för att svara
finns spridd över flera olika Wikipedia-
artiklar.
• Till exempel...
28
Personer födda i
Köpenhamn innan år 1900.
29
30
NYTimes –
Linked Open Data
http://data.nytimes.com/
32
Example app:Who Went Where?
Vill du göra data och/
eller vokabulär
tillgängliga?
Välja vokabulär
• Hur många använder?Vilka?
• Underhåll och styrning
• Vilka koncept täcker den?
• Hur uttrycksfull är den?
35
Baserat på http://linkeddatabook.com/
Verktyg för att utveckla
vokabulär
• Protégé
• TopBraid Composer
36
Specifikt för SKOS:
• PoolParty Thesaurus
Manager
• VocBench (developed by
the FAO of the UN)
Recept för att publicera
länkade data
• Statiska RDF/XML-filer
• Som RDF inbäddad i HTML (RDFa)
• Genom egna server-side scripts
• Från relationsdatabaser
• Från RDFTriple Stores
• Genom att ”wrappa” existerande API:er
37 http://linkeddatabook.com/
Vill du hitta data?
39
40
Vill du bygga?
42
Läs mer!
• Heath and Bizer (2011) Linked Data: Evolving the
Web into a Global Data Space
http://linkeddatabook.com/editions/1.0/
• Allemang and Hendler (2011) Semantic Web for
the Working Ontologist
http://workingontologist.org/
• http://www.w3.org/2001/sw/wiki/Tools

More Related Content

Länkade data – intro på LDSV 2013

  • 1. Länkade data Länkad data i Sverige, 16 april, 2013 Marie Gustafsson Friberger, Malmö högskola marie.friberger@mah.se twitter: mariegus
  • 2. Översikt • Länkade data och den semantiska webben • En kort introduktion till SW-relaterad W3C rekommendationer • Några exempel • Vill du tillgängliggöra data och/eller vokabulär? • Vill du hitta data? • Vill du bygga? 2
  • 4. Hans Rosling http://www.flickr.com/photos/23176450@N08/2663925153/ "The database hugging in public institutions is hampering innovation." Hans Rosling at OECD World Forum in Istanbul, 2007 http://www.viddler.com/explore/JesseRobbins/videos/4/
  • 6. 6
  • 7. • Hur tillhandahålla data så att den går att återanvända? • Hur möjliggöra upptäckandet av relevanta data bland alla dataset som finns tillgängliga? • Hur möjliggöra att applikationer kan integrera data från tidigare okända datakällor? 7
  • 8. ★ Tillgänglig på webben (oavsett format), med en öppen licens ★★ Tillgänglig som maskinläsbar strukturerad data (t ex Excel i stället för scannad tabell) ★★★ som (2) samt ickeproprietärt format (t ex CSV i stället för Excel) ★★★★ Alla ovan, plus att använda W3C-standarder (RDF och SPARQL) för beskriva saker ★★★★★ Alla ovan plus att länka din data till andras data
  • 9. Principer för länkade data 1. Använd URI:er för att namnge saker 2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information 3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL) 4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas http://www.w3.org/DesignIssues/LinkedData.html
  • 10. 10
  • 11. Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
  • 12. Semantiska webben • Data-webb (snarare än dokument-webb). • Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den. • Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor. 12
  • 13. define the concepts and relationships used to describe and represent an area of concern 13 Main SW components RDF Linked Data OWL SKOS Vocabularies Ontologies common formats for integration and combination of data drawn from diverse sources SPARQL
  • 14. En kort introduktion till W3C-rekommendationer relaterade till den semantiska webben
  • 17. Subject - Predicate - Object Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 18. Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 19. Flera källor + + Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 20. En graf... Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.
  • 21. Vad är vad? • Om två källor använder samma benämningar, avser de då samma ”sak”? • URI:er to the rescue! • Två noder avser samma sak om de använder samma URI.
  • 22. SPARQL • SPARQL Protocol and RDF Query Language • En fråga består av en uppsättning trippel- mönster (tripple patterns). • Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.
  • 23. Ontologier – OWL • Kallas ofta vokabulärer i samband med länkade data • Används för att beskriva begrepp och relationer mellan begrepp i någon domän • Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data 23
  • 24. Simple Knowledge Organization System (SKOS) • RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier. 24 ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals. ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology.
  • 26. • Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben. • Beskriver över 3,77 miljoner saker, varav 2,35 miljoner är klassificerade i en konsistent ontologi som innehåller 764.000 personer, 573.000 platser, 112.000 musikalbum, 72.000 filmer, 18.000 videospel, 192.000 organisationer, 202.000 arter och 5.500 sjukdomar.
  • 27. Möjliga frågor • DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia- artiklar. • Till exempel...
  • 29. 29
  • 30. 30
  • 31. NYTimes – Linked Open Data http://data.nytimes.com/
  • 32. 32
  • 34. Vill du göra data och/ eller vokabulär tillgängliga?
  • 35. Välja vokabulär • Hur många använder?Vilka? • Underhåll och styrning • Vilka koncept täcker den? • Hur uttrycksfull är den? 35 Baserat på http://linkeddatabook.com/
  • 36. Verktyg för att utveckla vokabulär • Protégé • TopBraid Composer 36 Specifikt för SKOS: • PoolParty Thesaurus Manager • VocBench (developed by the FAO of the UN)
  • 37. Recept för att publicera länkade data • Statiska RDF/XML-filer • Som RDF inbäddad i HTML (RDFa) • Genom egna server-side scripts • Från relationsdatabaser • Från RDFTriple Stores • Genom att ”wrappa” existerande API:er 37 http://linkeddatabook.com/
  • 38. Vill du hitta data?
  • 39. 39
  • 40. 40
  • 42. 42
  • 43. Läs mer! • Heath and Bizer (2011) Linked Data: Evolving the Web into a Global Data Space http://linkeddatabook.com/editions/1.0/ • Allemang and Hendler (2011) Semantic Web for the Working Ontologist http://workingontologist.org/ • http://www.w3.org/2001/sw/wiki/Tools