際際滷

際際滷Share a Scribd company logo
Zoekplatform Openbare Bibliotheken




Beter content vinden met DBpedia
Wikimedia Conferentie, 9 november 2012

Gerard Kuys
Overzicht

1. Culturele content en internet:
   when are the twain going to meet?
2. Wat is DBpedia
3. Stappen naar een referentiesysteem
   voor het Nederlandstalig gebied
Lezers en schrijvers in Wikipedia
           (juni 2012)
   12000000



   10000000



    8000000



    6000000                                                             Series1bekeken per uur
                                                                         Keren
                                                                        Series2 artikelen
                                                                         Aantal

    4000000



    2000000



          0
              Engels   Duits   Frans   Nederlands   Spaans   Russisch
Van beschrijvingen naar Linked (Open) Data

 Er staan al best veel culturele beschrijvingen in Wikipedia:
  * Alles in de categorie Monumenten
  * Schilderijen en iconografie (http://nl.wikipedia.org/wiki/Iconografie )
  * Biografie谷n van bekende personen
Van beschrijvingen naar Linked (Open) Data
Maar die beschrijvingen:
 Zijn tekstgebaseerd, dus dingen zijn alleen vindbaar als je de juiste
  term ervoor weet
 Het is soms lastig begrippen eenduidig te identificeren
     Jan Janszen (1694-1751)
     Jan Janszen ( ? - 1751)
 Daarom is er in Wikipedia een systeem van verwijzingen
 Als je die verwijzingen leesbaar voor machines maakt, wordt het
  veel gemakkelijker om te navigeren over betekenissen
Linked Open Data




http://wiki.dbpedia.org/Interlinking
Waarom zijn Linked Data belangrijk?

 Dbpedia bouwt een ontologie op, d.w.z. een referentiesysteem dat over
  documentverzamelingen heen begrippen eenduidig definieert
 Referentiesystemen kunnen op een bepaalde, afwijkende manier
  opgebouwd zijn (vocabulaires), zolang ze het maar over hetzelfde hebben
 Edgar Allan Poe moet in het Engelse referentiesysteem naar hetzelfde
  (uniek ge誰dentificeerde) begrip verwijzen als in het Nederlandstalige
  referentiesysteem
 Dit helpt de vindbaarheid enorm, het is (bijna) de ultieme vorm van
  disambigueren
 Vindbaar maken, vindbaar niet op termen maar op inhoud
 En als je iets vindt, krijg je meteen ook alle informatie eromheen mee



                                                                        7
Wat is DBpedia?
 A community effort to extract information from Wikipedia and to
  make this information available on the web
 Christian Bizer, S旦ren Auer, Sebastian Hellmann, DBpedia  A
  Crystallization Point for the Web of Data (2009)
 Initiatief om alle informatie in de lemmas van Wikipedia als
  verzameling van concepten te zien, te extraheren en als 辿辿n
  samenhangend geheel aan te bieden
    Knowledge Extraction Framework
    Interlanguage Links
    Canonical URIs: Een gemeenschappelijke ontologie voor
       Personen, Plaatsen, Organisaties etc.
 Gepubliceerd als Linked Open Data (licentie: CC-BY-SA)
http:/wikipedia.org/wiki/DBpedia
Wat doet DBpedia
 Leest van lemmas de samenvatting uit (500 woorden)
 Leest de Infobox uit, als die er is
     De Infobox bepaalt het type object, de klasse in de ontologie
 Kijkt voor de gevonden termen of er een concept in de
  Dbpedia-ontologie mee correspondeert
       Persoonsgegevens
       Plaatsgegevens
       Afbeeldingen
       .
 De kwaliteit van het resultaat hangt sterk af van de consistentie
  waarmee termen in de samenvatting en in de velden van de
  Infobox zijn ingevuld
 Door het niet-heel-sterk-geplande karakter van de inhoud is
  ook de ontologie achter Wikipedia zwak gestructureerd
 Dit kan verbeterd worden door gestuurde mapping
Hoe werkt Dbpedia
Mappings, mappings, mappings
 Wikipedia heeft een structuur met Infoboxes en andere
  templates
 Als je die templates vult, weet je dus welke term correspondeert
  met welk concept in een achterliggende ordening / classificatie
 Die correspondentie kun je tot stand brengen:
    Met interlanguage links: deze term in het Engels verwijst naar
     hetzelfde concept als deze term in het Nederlands
    Langs geautomatiseerde weg
    Uit het publiek, met community mapping
Map mee met DBpedia!




http://nl.dbpedia.org/wiki/index.php/Welkom
Nederlandstaligen schrijven wel,
         maar mappen niet




                                   14
Mappings in DBpedia-Nederlands




                                 15
Hoe ziet een Infobox eruit




                             16
Hoe ziet een Infobox eruit



     {{Infobox auteur
     | naam        = Anna Roemers Visscher
     | afbeelding = Anna Visscher.jpg
     | onderschrift = Anna Roemers Visscher
     | citaat     =
     | volledige naam = Anna Roemers(dochter) Visscher
     | pseudoniem =
     | bijnaam      =
     | geboren       = [[2 februari]] (?) [[1583]]
     | overleden = [[6 december]] [[1651]]
     | land       = [[Nederland]]
     | beroep       = [[dichter]],[[graveerder]]
     | jaren-actief =
     | genre       =
     | stroming      =
     | invloeden =
     | bekende-werken =
     | uitgeverij =
     | dbnl       = viss001
     | handtekening =
     | website      =
     }}
                                                         17
Van infoboxveld naar Dbpedia property
              Agent (edit)
              Organisation (edit)
              Person (edit)
                        Ambassador (edit)
                        Architect (edit)
                        Artist (edit)
                                    Actor (edit)
                                               AdultActor (edit)
                                               VoiceActor (edit)
                                    Comedian (edit)
                                    ComicsCreator (edit)
                                    MusicalArtist (edit)
                                    Writer (edit)
                        Astronaut (edit)
                        Athlete (edit)
                        Celebrity (edit)
                        Cleric (edit)
                                    Cardinal (edit)
                                    ChristianBishop (edit)
                                    ChristianPatriarch (edit)
                                    Pope (edit)
                                    Priest (edit)
                                    Saint (edit)
                        CollegeCoach (edit)
                        Criminal (edit)
                        FictionalCharacter (edit)
                        Journalist (edit)
                        Judge (edit)
                        MilitaryPerson (edit)
                        Model (edit)
                        Monarch (edit)
                        OfficeHolder (edit)
                        OrganisationMember (edit)
                        Philosopher (edit)
                        PlayboyPlaymate (edit)
                        Politician (edit)
                        Referee (edit)
                        Royalty (edit)
                        SoccerManager (edit)


                                                                    18
Infobox mappen op DBpedia ontologie
 
                (1)
     {{Infobox persoon
    | naam        = Jeltje de Bosch Kemper
    | afbeelding =
    | onderschrift =
    | volledigenaam = jkvr. J. de Bosch Kemper
    | geboortedatum = [[28 april]] [[1836]]
    | geboorteplaats = [[Amsterdam]]
    | sterfdatum = [[16 februari]] [[1916]]
    | sterfplaats = [[Amsterdam]]
    | doodsoorzaak =
    | nationaliteit = [[Nederland]]se
    | beroep       =
    | bekendvan = [[Tesselschade-Arbeid Adelt|Algemeene Nederlandsche Vrouwenvereeniging 'Tesselschade']]
    | algemeennaam1 =
    | algemeennaam2 =
    | algemeen2 =
    | tijdvak1    =
    | functie1     =
    | partners     =
    | kinderen      =
    | religie    =
    | politieknaam =
    | politiek    =
    | politieknaam1 =
    | politiek1 =
    }}




                                                                                                             19
Infobox mappen op DBpedia ontologie
                (2)
    {{CanonicalNamespace
    "wgPageName":" Jeltje_de_Bosch_Kemper ","wgTitle":Jeltje de Bosch
    Kemper,"wgCurRevisionId":32911458,"wgArticleId":2940082,"wgIsArticle":true,
    {{TemplateMapping
    | mapToClass = Person
    | mappings =
                     {{PropertyMapping | templateProperty = naam | ontologyProperty = foaf:name}}
                     {{PropertyMapping | templateProperty = geboortedatum | ontologyProperty = birthDate }}
                     {{PropertyMapping | templateProperty = geboorteplaats | ontologyProperty = birthPlace }}
                     {{PropertyMapping | templateProperty = sterfdatum | ontologyProperty = deathDate }}
                     {{PropertyMapping | templateProperty = sterfplaats | ontologyProperty = deathPlace }}
                     {{PropertyMapping | templateProperty = website | ontologyProperty = foaf:homepage }}
                     {{PropertyMapping | templateProperty = religie | ontologyProperty = religion }}
                     {{PropertyMapping | templateProperty = beroep | ontologyProperty = occupation }}
                     {{PropertyMapping | templateProperty = partners | ontologyProperty = spouse }}
                     {{PropertyMapping | templateProperty = kinderen | ontologyProperty = child }}
                 {{PropertyMapping | templateProperty = nationaliteit | ontologyProperty = country }}
                     {{PropertyMapping | templateProperty = bekendvan | ontologyProperty = dbpedia-owl:concept }}
                     {{PropertyMapping | templateProperty = algemeennaam1 | ontologyProperty = foaf:name }}
                     {{PropertyMapping | templateProperty = algemeen1 | ontologyProperty = foaf: }}
                     {{PropertyMapping | templateProperty = functie1 | ontologyProperty = occupation }}
                     {{DataIntervalMapping | templateProperty = tijdvak1 | ontologyProperty = activeYearsStartYear
                                                               ontologyProperty = activeYearsEndYear }}
                     {{PropertyMapping | templateProperty = functie2 | ontologyProperty = occupation }}
                     {{DataIntervalMapping | templateProperty = tijdvak2 | ontologyProperty = activeYearsStartYear
                                                               ontologyProperty = activeYearsEndYear }}
    }}




                                                                                                                     20
Van losse collecties naar Linked (Open) Data


    De bibliotheken in Nederland zitten op een (virtuele)
     collectie van ca. 15 miljoen titels, met 60 miljoen
     exemplaren
    Wanneer deze schat aan informatie vermengd wordt
     met Linked Open Data is dit tot beider voordeel
    Bibliotheken kunnen helpen door de beschrijving van
     content systematischer aan te pakken, LOD-communities
     kunnen helpen door te linken en te mappen
Collecties koppelen aan onderwerpen

 Op dit moment zijn collectie-items van bibliotheken
  gekoppeld aan trefwoorden of termen uit een formele
  classificatie (Dewey, UDC enz.)
 Maar catalogiseren en classificeren kan geen gelijke
  tred houden met de toename van het (digitale)
  materiaal
 Niet het kind met het badwater weggooien
 En dus oude classificaties verbinden met nieuwe
  classificaties/ontologie谷n
 Dan stroomt het bibliotheek-aanbod door naar Linked
  Open Data (en omgekeerd)


                                                         22
Metadatastrategie bibliotheken
 Aansluiten bij initiatieven om bibliotheekclassificaties in SKOS te
  zetten (KB, Catch- en Stitch-projecten)
 Aansluiten bij Linked Open Data waar zinvol:
  * FOAF (http://www.foaf-project.org/)
  * Music Ontology (http://musicontology.com/)
  * Movie Ontology (http://www.movieontology.org/)
 Maar speerpunt ligt bij DBpedia: DBpedia-ontologie als verbindend
  systeem van onderwerpen
 Een Wikipedia-lemma is een vindplaats voor related terms
DBpedia en WikiData
 Nieuw initiatief van de Wikimedia Foundation, gesponsord door
  Google en Microsoft
 Springt in de discussie over Schema.org en RDFa voor
  semantische markup van internetpaginas
 Is aanvullend, niet concurrerend
      Doelgroep van WikiData zijn Wikipedia-redacteuren, DBpedia
       publiceert als Linked Open Data dus voor iedereen
      Mensen van DBpedia in Advisory Board Wikidata
      DBpedia gericht op extractie van data uit Infobox
      Wikidata gericht op datastructuren die kunnen worden aangevuld
       en geredigeerd op de manier van Wikipedia
      Wikidata levert in potentie betere data dan de Infoboxen die op
       dit moment komen zoals ze komen
 Zie http://meta.wikimedia.org/wiki/Wikidata/Essays/DBpedia_and_Wikidata
Samenwerking Bibliotheek.nl met
                    Leipzig
Hi Gerard,

ist this text ok for the announcement? We are also happy to see the number of the DBpedia language chapters rising.

Since the 3.7 DBpedia release we welcomed the French, Italian and Japanese Chapters.

What is more, we expect the release of the Dutch chapter during the following months (in cooperation with http://bibliotheek.nl/).
Therefore, you will be able to de-reference (among others) the 10 biggest Wikipedia / DBpedia language editions.
The following picture gives an overview of the current state of the Internationalization effort:

Sebastian Hellmann
Wat gaat nl.dbpedia.org concreet doen?
  Op dit moment worden de concepten achter Dbpedia
   vooral ge谷xtraheerd uit de Engelstalige paginas
     Sinds 1 jaar ook uit Duits, Frans, Grieks, Russisch en Koreaans
  Als we alleen naar het Engels kijken missen we concepten die in een
   Nederlands/Vlaamse context belangrijk zijn:
     Personen, (Sociale) Geografie, Geschiedenis en cultuur
     (Al hebben we nu al wel de Engelse kijk op: poffertjes)
  We moeten zorgen dat de begrippen in de Nederlandstalige paginas
   refereerbaar worden, en dat die begrippen worden gemapt op algemene
   Linked Data
  Aandringen op meer standaardisering Infoboxen
  Infoboxen toevoegen waar ze ontbreken
nl.dbpedia.org

   Dit jaar nog Nederlandstalig chapter DBpedia en DBpedia information
    extraction framework (DIEF)
   Volgend jaar aan de slag met Spotlight voor Named Entity Recognition
    (https://github.com/dbpedia-spotlight/dbpedia-spotlight)




                                                                           27
Samenwerking zoeken




Een interessante passage uit het document "Strategie 2013-2015" van Wikimedia Nederland:

" In eerste instantie gaan we verder met het uitbouwen van onze activiteiten op het gebied van culturele samenwerking
 en het verstevigen van de relaties met instellingen op dit terrein (GLAM: galleries, libraries, archives en museums).
 Door samen te werken ontstaat een maatschappelijke meerwaarde die de doelstellingen van zowel de Wikimedia-beweging
 als deze instellingen weerspiegelt. Verder gaan we verkennen of ook samenwerkingsverbanden met (hoger) onderwijs
 en de diverse overheidsinstellingen mogelijk zijn. Ook willen we blijven deelnemen in activiteiten die bijdragen aan
 innovatie en ontwikkeling."
O ja, en nog 辿辿n ding.

Als je  als in het Strategiedocument - de samenwerking zoekt met
    culturele instellingen, zie dan niet overal self promotion in:
   Er zijn verzamelingen van biografieen van personen die niet per se alleen
    maar de lof van de verzamelende instelling zingen
       Vrouwenlexicon Nederland
       Muziekcentrum Omroep
       De lijsten van rijks- en gemeentelijke monumenten
       
   Het mooie van mappen is, dat je diversiteit van content intact laat, maar
    intussen toch de gemeenschappelijke semantiek naar voren laat komen
   Map mee!!
Vragen?
Ad

Recommended

20150209 improving the_d_bpedia_ontology_v2
20150209 improving the_d_bpedia_ontology_v2
Gerard Kuys
20140130 metadata vocabularies_and_cultural_heritage_final
20140130 metadata vocabularies_and_cultural_heritage_final
Gerard Kuys
20121108 fobid
20121108 fobid
Gerard Kuys
What Apache Stanbol Can Do for You
What Apache Stanbol Can Do for You
Fabian Christ
The Near Future of CSS
The Near Future of CSS
Rachel Andrew
Classroom Management Tips for Kids and Adolescents
Classroom Management Tips for Kids and Adolescents
Shelly Sanchez Terrell
The Buyer's Journey - by Chris Lema
The Buyer's Journey - by Chris Lema
Chris Lema
2024 Trend Updates: What Really Works In SEO & Content Marketing
2024 Trend Updates: What Really Works In SEO & Content Marketing
Search Engine Journal
Storytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
Artificial Intelligence, Data and Competition SCHREPEL June 2024 OECD dis...
Artificial Intelligence, Data and Competition SCHREPEL June 2024 OECD dis...
OECD Directorate for Financial and Enterprise Affairs
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
2024 State of Marketing Report by Hubspot
2024 State of Marketing Report by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy

More Related Content

Featured (20)

Storytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
Artificial Intelligence, Data and Competition SCHREPEL June 2024 OECD dis...
Artificial Intelligence, Data and Competition SCHREPEL June 2024 OECD dis...
OECD Directorate for Financial and Enterprise Affairs
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
2024 State of Marketing Report by Hubspot
2024 State of Marketing Report by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Storytelling For The Web: Integrate Storytelling in your Design Process
Storytelling For The Web: Integrate Storytelling in your Design Process
Chiara Aliotta
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
How to Leverage AI to Boost Employee Wellness - Lydia Di Francesco - SocialHR...
SocialHRCamp
2024 State of Marketing Report by Hubspot
2024 State of Marketing Report by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray

20121109 wmc

  • 1. Zoekplatform Openbare Bibliotheken Beter content vinden met DBpedia Wikimedia Conferentie, 9 november 2012 Gerard Kuys
  • 2. Overzicht 1. Culturele content en internet: when are the twain going to meet? 2. Wat is DBpedia 3. Stappen naar een referentiesysteem voor het Nederlandstalig gebied
  • 3. Lezers en schrijvers in Wikipedia (juni 2012) 12000000 10000000 8000000 6000000 Series1bekeken per uur Keren Series2 artikelen Aantal 4000000 2000000 0 Engels Duits Frans Nederlands Spaans Russisch
  • 4. Van beschrijvingen naar Linked (Open) Data Er staan al best veel culturele beschrijvingen in Wikipedia: * Alles in de categorie Monumenten * Schilderijen en iconografie (http://nl.wikipedia.org/wiki/Iconografie ) * Biografie谷n van bekende personen
  • 5. Van beschrijvingen naar Linked (Open) Data Maar die beschrijvingen: Zijn tekstgebaseerd, dus dingen zijn alleen vindbaar als je de juiste term ervoor weet Het is soms lastig begrippen eenduidig te identificeren Jan Janszen (1694-1751) Jan Janszen ( ? - 1751) Daarom is er in Wikipedia een systeem van verwijzingen Als je die verwijzingen leesbaar voor machines maakt, wordt het veel gemakkelijker om te navigeren over betekenissen
  • 7. Waarom zijn Linked Data belangrijk? Dbpedia bouwt een ontologie op, d.w.z. een referentiesysteem dat over documentverzamelingen heen begrippen eenduidig definieert Referentiesystemen kunnen op een bepaalde, afwijkende manier opgebouwd zijn (vocabulaires), zolang ze het maar over hetzelfde hebben Edgar Allan Poe moet in het Engelse referentiesysteem naar hetzelfde (uniek ge誰dentificeerde) begrip verwijzen als in het Nederlandstalige referentiesysteem Dit helpt de vindbaarheid enorm, het is (bijna) de ultieme vorm van disambigueren Vindbaar maken, vindbaar niet op termen maar op inhoud En als je iets vindt, krijg je meteen ook alle informatie eromheen mee 7
  • 8. Wat is DBpedia? A community effort to extract information from Wikipedia and to make this information available on the web Christian Bizer, S旦ren Auer, Sebastian Hellmann, DBpedia A Crystallization Point for the Web of Data (2009) Initiatief om alle informatie in de lemmas van Wikipedia als verzameling van concepten te zien, te extraheren en als 辿辿n samenhangend geheel aan te bieden Knowledge Extraction Framework Interlanguage Links Canonical URIs: Een gemeenschappelijke ontologie voor Personen, Plaatsen, Organisaties etc. Gepubliceerd als Linked Open Data (licentie: CC-BY-SA)
  • 10. Wat doet DBpedia Leest van lemmas de samenvatting uit (500 woorden) Leest de Infobox uit, als die er is De Infobox bepaalt het type object, de klasse in de ontologie Kijkt voor de gevonden termen of er een concept in de Dbpedia-ontologie mee correspondeert Persoonsgegevens Plaatsgegevens Afbeeldingen . De kwaliteit van het resultaat hangt sterk af van de consistentie waarmee termen in de samenvatting en in de velden van de Infobox zijn ingevuld Door het niet-heel-sterk-geplande karakter van de inhoud is ook de ontologie achter Wikipedia zwak gestructureerd Dit kan verbeterd worden door gestuurde mapping
  • 12. Mappings, mappings, mappings Wikipedia heeft een structuur met Infoboxes en andere templates Als je die templates vult, weet je dus welke term correspondeert met welk concept in een achterliggende ordening / classificatie Die correspondentie kun je tot stand brengen: Met interlanguage links: deze term in het Engels verwijst naar hetzelfde concept als deze term in het Nederlands Langs geautomatiseerde weg Uit het publiek, met community mapping
  • 13. Map mee met DBpedia! http://nl.dbpedia.org/wiki/index.php/Welkom
  • 14. Nederlandstaligen schrijven wel, maar mappen niet 14
  • 16. Hoe ziet een Infobox eruit 16
  • 17. Hoe ziet een Infobox eruit {{Infobox auteur | naam = Anna Roemers Visscher | afbeelding = Anna Visscher.jpg | onderschrift = Anna Roemers Visscher | citaat = | volledige naam = Anna Roemers(dochter) Visscher | pseudoniem = | bijnaam = | geboren = [[2 februari]] (?) [[1583]] | overleden = [[6 december]] [[1651]] | land = [[Nederland]] | beroep = [[dichter]],[[graveerder]] | jaren-actief = | genre = | stroming = | invloeden = | bekende-werken = | uitgeverij = | dbnl = viss001 | handtekening = | website = }} 17
  • 18. Van infoboxveld naar Dbpedia property Agent (edit) Organisation (edit) Person (edit) Ambassador (edit) Architect (edit) Artist (edit) Actor (edit) AdultActor (edit) VoiceActor (edit) Comedian (edit) ComicsCreator (edit) MusicalArtist (edit) Writer (edit) Astronaut (edit) Athlete (edit) Celebrity (edit) Cleric (edit) Cardinal (edit) ChristianBishop (edit) ChristianPatriarch (edit) Pope (edit) Priest (edit) Saint (edit) CollegeCoach (edit) Criminal (edit) FictionalCharacter (edit) Journalist (edit) Judge (edit) MilitaryPerson (edit) Model (edit) Monarch (edit) OfficeHolder (edit) OrganisationMember (edit) Philosopher (edit) PlayboyPlaymate (edit) Politician (edit) Referee (edit) Royalty (edit) SoccerManager (edit) 18
  • 19. Infobox mappen op DBpedia ontologie (1) {{Infobox persoon | naam = Jeltje de Bosch Kemper | afbeelding = | onderschrift = | volledigenaam = jkvr. J. de Bosch Kemper | geboortedatum = [[28 april]] [[1836]] | geboorteplaats = [[Amsterdam]] | sterfdatum = [[16 februari]] [[1916]] | sterfplaats = [[Amsterdam]] | doodsoorzaak = | nationaliteit = [[Nederland]]se | beroep = | bekendvan = [[Tesselschade-Arbeid Adelt|Algemeene Nederlandsche Vrouwenvereeniging 'Tesselschade']] | algemeennaam1 = | algemeennaam2 = | algemeen2 = | tijdvak1 = | functie1 = | partners = | kinderen = | religie = | politieknaam = | politiek = | politieknaam1 = | politiek1 = }} 19
  • 20. Infobox mappen op DBpedia ontologie (2) {{CanonicalNamespace "wgPageName":" Jeltje_de_Bosch_Kemper ","wgTitle":Jeltje de Bosch Kemper,"wgCurRevisionId":32911458,"wgArticleId":2940082,"wgIsArticle":true, {{TemplateMapping | mapToClass = Person | mappings = {{PropertyMapping | templateProperty = naam | ontologyProperty = foaf:name}} {{PropertyMapping | templateProperty = geboortedatum | ontologyProperty = birthDate }} {{PropertyMapping | templateProperty = geboorteplaats | ontologyProperty = birthPlace }} {{PropertyMapping | templateProperty = sterfdatum | ontologyProperty = deathDate }} {{PropertyMapping | templateProperty = sterfplaats | ontologyProperty = deathPlace }} {{PropertyMapping | templateProperty = website | ontologyProperty = foaf:homepage }} {{PropertyMapping | templateProperty = religie | ontologyProperty = religion }} {{PropertyMapping | templateProperty = beroep | ontologyProperty = occupation }} {{PropertyMapping | templateProperty = partners | ontologyProperty = spouse }} {{PropertyMapping | templateProperty = kinderen | ontologyProperty = child }} {{PropertyMapping | templateProperty = nationaliteit | ontologyProperty = country }} {{PropertyMapping | templateProperty = bekendvan | ontologyProperty = dbpedia-owl:concept }} {{PropertyMapping | templateProperty = algemeennaam1 | ontologyProperty = foaf:name }} {{PropertyMapping | templateProperty = algemeen1 | ontologyProperty = foaf: }} {{PropertyMapping | templateProperty = functie1 | ontologyProperty = occupation }} {{DataIntervalMapping | templateProperty = tijdvak1 | ontologyProperty = activeYearsStartYear ontologyProperty = activeYearsEndYear }} {{PropertyMapping | templateProperty = functie2 | ontologyProperty = occupation }} {{DataIntervalMapping | templateProperty = tijdvak2 | ontologyProperty = activeYearsStartYear ontologyProperty = activeYearsEndYear }} }} 20
  • 21. Van losse collecties naar Linked (Open) Data De bibliotheken in Nederland zitten op een (virtuele) collectie van ca. 15 miljoen titels, met 60 miljoen exemplaren Wanneer deze schat aan informatie vermengd wordt met Linked Open Data is dit tot beider voordeel Bibliotheken kunnen helpen door de beschrijving van content systematischer aan te pakken, LOD-communities kunnen helpen door te linken en te mappen
  • 22. Collecties koppelen aan onderwerpen Op dit moment zijn collectie-items van bibliotheken gekoppeld aan trefwoorden of termen uit een formele classificatie (Dewey, UDC enz.) Maar catalogiseren en classificeren kan geen gelijke tred houden met de toename van het (digitale) materiaal Niet het kind met het badwater weggooien En dus oude classificaties verbinden met nieuwe classificaties/ontologie谷n Dan stroomt het bibliotheek-aanbod door naar Linked Open Data (en omgekeerd) 22
  • 23. Metadatastrategie bibliotheken Aansluiten bij initiatieven om bibliotheekclassificaties in SKOS te zetten (KB, Catch- en Stitch-projecten) Aansluiten bij Linked Open Data waar zinvol: * FOAF (http://www.foaf-project.org/) * Music Ontology (http://musicontology.com/) * Movie Ontology (http://www.movieontology.org/) Maar speerpunt ligt bij DBpedia: DBpedia-ontologie als verbindend systeem van onderwerpen Een Wikipedia-lemma is een vindplaats voor related terms
  • 24. DBpedia en WikiData Nieuw initiatief van de Wikimedia Foundation, gesponsord door Google en Microsoft Springt in de discussie over Schema.org en RDFa voor semantische markup van internetpaginas Is aanvullend, niet concurrerend Doelgroep van WikiData zijn Wikipedia-redacteuren, DBpedia publiceert als Linked Open Data dus voor iedereen Mensen van DBpedia in Advisory Board Wikidata DBpedia gericht op extractie van data uit Infobox Wikidata gericht op datastructuren die kunnen worden aangevuld en geredigeerd op de manier van Wikipedia Wikidata levert in potentie betere data dan de Infoboxen die op dit moment komen zoals ze komen Zie http://meta.wikimedia.org/wiki/Wikidata/Essays/DBpedia_and_Wikidata
  • 25. Samenwerking Bibliotheek.nl met Leipzig Hi Gerard, ist this text ok for the announcement? We are also happy to see the number of the DBpedia language chapters rising. Since the 3.7 DBpedia release we welcomed the French, Italian and Japanese Chapters. What is more, we expect the release of the Dutch chapter during the following months (in cooperation with http://bibliotheek.nl/). Therefore, you will be able to de-reference (among others) the 10 biggest Wikipedia / DBpedia language editions. The following picture gives an overview of the current state of the Internationalization effort: Sebastian Hellmann
  • 26. Wat gaat nl.dbpedia.org concreet doen? Op dit moment worden de concepten achter Dbpedia vooral ge谷xtraheerd uit de Engelstalige paginas Sinds 1 jaar ook uit Duits, Frans, Grieks, Russisch en Koreaans Als we alleen naar het Engels kijken missen we concepten die in een Nederlands/Vlaamse context belangrijk zijn: Personen, (Sociale) Geografie, Geschiedenis en cultuur (Al hebben we nu al wel de Engelse kijk op: poffertjes) We moeten zorgen dat de begrippen in de Nederlandstalige paginas refereerbaar worden, en dat die begrippen worden gemapt op algemene Linked Data Aandringen op meer standaardisering Infoboxen Infoboxen toevoegen waar ze ontbreken
  • 27. nl.dbpedia.org Dit jaar nog Nederlandstalig chapter DBpedia en DBpedia information extraction framework (DIEF) Volgend jaar aan de slag met Spotlight voor Named Entity Recognition (https://github.com/dbpedia-spotlight/dbpedia-spotlight) 27
  • 28. Samenwerking zoeken Een interessante passage uit het document "Strategie 2013-2015" van Wikimedia Nederland: " In eerste instantie gaan we verder met het uitbouwen van onze activiteiten op het gebied van culturele samenwerking en het verstevigen van de relaties met instellingen op dit terrein (GLAM: galleries, libraries, archives en museums). Door samen te werken ontstaat een maatschappelijke meerwaarde die de doelstellingen van zowel de Wikimedia-beweging als deze instellingen weerspiegelt. Verder gaan we verkennen of ook samenwerkingsverbanden met (hoger) onderwijs en de diverse overheidsinstellingen mogelijk zijn. Ook willen we blijven deelnemen in activiteiten die bijdragen aan innovatie en ontwikkeling."
  • 29. O ja, en nog 辿辿n ding. Als je als in het Strategiedocument - de samenwerking zoekt met culturele instellingen, zie dan niet overal self promotion in: Er zijn verzamelingen van biografieen van personen die niet per se alleen maar de lof van de verzamelende instelling zingen Vrouwenlexicon Nederland Muziekcentrum Omroep De lijsten van rijks- en gemeentelijke monumenten Het mooie van mappen is, dat je diversiteit van content intact laat, maar intussen toch de gemeenschappelijke semantiek naar voren laat komen Map mee!!