狠狠撸

狠狠撸Share a Scribd company logo
レビュー?
『Linked Data: Webをグローバ
ルなデータ空間にする仕組み』

小村 爱美(神戸大学)
? 自己紹介
??神戸大学附属図書館?所属
? 業務経験:サービス担当
??????リポジトリ?デジタルアーカイブ担当
?目録経験:なし
?コーディング?プログラミング??
?LODの理解:??????
技術的な解説はできない
?勉強中。LOD関連の情報紹介、疑問の共有など
できれば
?会場からも補足などいただきたい
本日のお話
1. 勉強会紹介
2. 『Linked Data: Webをグローバルな
データ空間にする仕組み』?紹介
????休憩
3. Linked Dataに関する + α
4. 質疑?ディスカッション
勉強会『Linked Data』輪読
? 2013年7月~?月1回ペース(全6回)
? 2~3ページずつ輪読
? 開催記録:
情報組織化研究グループ勉強会記録(2013年度)
http://josoken.digick.jp/study/
2013/2013.html#06
『Linked Data』?紹介
『Linked Data: Webをグローバルなデータ空間にす
る仕組み』?近代科学社,2013.1
!

原書:
『Linked Data: Evolving the Web into a Global Data
Space』 2011.1
著者:
Tom Heath (Head of Research / The Open Data
Institute / UK)
Christian Bizer (Freie Universit?t Berlin/ Germany)
『Linked Data』?紹介
? 1章?はじめに
? 2章?Linked Dataの基本原則
? 3章?データのWeb
? 4章?つながるデータをデザインしよう
? 5章?Linked Data公開のレシピ
? 6章?Linked Dataを利用する
? 7章?まとめと展望

!

?架空企業“BIG LYNX社”をシナリオにRDF記述例
?実際の公開データセットetc.紹介
?図書館のデータへの言及も(p.38 3.2.5)
1章?はじめに
??データの氾濫:Web企業?マスメディア?
?????????公的機関?研究団体etc. の
?????????データ公開?共有
????????????????

?データの大洪水

????第三者のビジネス? ?データへの需要
??Linked Dataの原理
???構造化データ:?
????定型的な構造=簡単に再利用
公開方法(既存):
?????microformats, Web API(XML, JSON)
????? ?それぞれに制約
1章?はじめに
?よりよいデータモデル:
?RDF(Resource Description Framework)
??異なるデータ源にあるデータ同士を
リンク可能
??データとデータの関係性を記述できる
2章?Linked Dataの基本原則
1. あらゆる事物にURIを付与すること。
2. 誰でも事物の内容が確認できるように、URIは
HTTP経由で参照できること。
3. URIを参照した時は、標準の技術(RDFやSPARQL等)
を使用して関係する有用な情報を利用できるよう
にすること。
4. より多くの事物を発見できるように他のURIへのリ
ンクを含めること。
2章?Linked Dataの基本原則
?Webの仕組みを構成する標準
??URI?HTTP?HTML?ハイパーリンク
?Linked Dataは、Webの構成をデータ共有に
?適用したもの。
?Webと異なるもの/Webに存在しなかった
?ものを新たに追加するものではない。
2章?Linked Dataの基本原則
原則1. あらゆる事物にURIを付与すること。
? ?記述するデータ?事物?概念などをURIで
同定
!
原則2. 誰でも事物の内容が確認できるように、??

???URIはHTTP経由で参照できること。
??HTTP:WebでHTML文書の同定に使用。
??Linked Dataでは記述する対象の同定に使用。
??
2章?Linked Dataの基本原則
原則3. URIを参照した時は、標準の技術(RDF
やSPARQL等)を使用して関係する有用
な情報を利用できるようにすること。
!

?構造化データの公開:RDFの使用を推奨
2章?Linked Dataの基本原則
原則3.
?RDFのシリアル化形式:
?RDF/XML
?RDFa
?Turtle
?N-Triples
?RDF/JSON
cf. DBpediaリソース“Raw 顿补迟补”(各形式のサンプル)
2章?Linked Dataの基本原則
原則4. より多くの事物を発見できるように他の
URIへのリンクを含めること。
?他のデータ源へのリンクを含める
??=データ源同士をつなぐ
?リンクの種類
?1. 関係リンク
?2. 同一性リンク
?3. 語彙リンク
2章?Linked Dataの基本原則
? Linked Data 公開の段階

☆4+
他のデータ源とリンク

汎用的な形式
機械可読の構造化形
式
オープンライセンス
(データ形式不問)

☆3+
RDFを使用
3章?データのWeb
?データのWeb? ?文書のWeb(従来のWeb)
?「何十億ものRDF文から成る巨大でグローバルな
グラフ」
?データのトピック:
地理情報?人物?企業?出版物?画像?音楽?
映像?化学物質?薬物?統計?コミュニティ???
→?あらゆる分野
3章?データのWeb

The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点
4章?つながるデータをデザインしよう
?URIを発行
?URIの例
?事物を表現する=3つのURIが必要(2.3.1項)
1. 事物そのものを表現するURI
2. 事物をHTMLによって記述した文書のURI
3. 事物をRDF/XMLによって記述したデータの
URI
4章?つながるデータをデザインしよう
?DBpediaの例
1.http://dbpedia.org/resource/Wildlife_photography

2.http://dbpedia.org/page/Wildlife_photography
3.http://dbpedia.org/data/Wildlife_photography
??※RDF形式とHTML形式の区別がつきにくい
?拡張子を付与するパターン(一般的)
1. http://biglinx.co.uk/people/dave-smith
2. http://biglinx.co.uk/people/dave-smith.html
3. http://biglinx.co.uk/people/dave-smith.rdf
DBpedia:Wikipediaの情報をLiked Dataへ変換

DBpedia Japanese
Wikipedia → DBpedia
infobox
DBpedia Japanese
DBpedia Japanese(RDF/XML)
4章?つながるデータをデザインしよう
?データセットの記述
?製作者?更新状況?適用ライセンス
??データの利用者にとって重要
?ライセンス?権利放棄の重要性
??ライセンスが明示されていない
??=?データの再利用を妨げる
??Web上の一般的なライセンス
??=?クリエイティブ?コモンズ?ライセンス
4章?つながるデータをデザインしよう
? データ記述の語彙
RDFS:基本。RDFSだけで十分なことも多い
OWL: sameAs 重要。2つのURIが同じ事物
を指していることを記述する時に使用。
cf. 2.5.2節(p.24)

"25
4章?つながるデータをデザインしよう
? 既存用語?語彙の再利用
? 既存用語を使う=データが使われやすくな
る
? 推奨語彙:
DCMI:Dublin Core Metadata Initiative
Metadata Terms Vocabulary
FOAF:Friend-of-a-friend Vocabulary
etc.

"26
5章?Linked Data公開のレシピ
?公開パターン
?リレーショナルデータベースから
ラッパを用いてRDF変換
代表的なラッパ:D2R Server
?静的な構造化データから
CSV, Excel, XML etc.
RDF化ツール 参照ページ:
ConverterToRdf, RDFizers
ConverterToRdf
RDFizers
5章?Linked Data公開のレシピ
? Linked Data公開時のチェック事項
? 他のデータセットにリンクしているか?
? 一次情報源データと由来のメタデータを提
供しているか?
? 普及している既存の語彙から用語を採って
いるか?
? データセットのメタデータを提供している
か?

"30
6章?Linked Dataを利用する
?既存のアプリケーション
?汎用的アプリケーション
? Linked Dataブラウザ
Disco Hyperdata Browser, Tabulator,
Marbles
? Linked Data検索エンジン
Sig.ma, Falcons, SWSE etc.
Google, Yahoo! etc. – リッチスニペット
6章?Linked Dataを利用する
?既存のアプリケーション
?分野に特化したアプリケーション
?政府データ関連のアプリケーションリスト
:data.gov, data.gov.uk?

?

サイト上にリスト
? DBpedia Mobile:スマートフォンのGPS情
報 × DBpediaの近隣情報
data.gov

"33
data.gov.uk

"34
?読み終えて…
?Linked Dataの概念はわかった
「データをより使いやすい形で公開?共
有する方法論」
?技術に関する部分はまだ難しい
?実際にデータを触りながら読んだ方が理解
が進む図書では
?勉強会:今後どう進める?
RDA、FRBR関連の文献輪読
BIBFRAME関係の文献輪読
文献リストのLOD化
などのアイデア
*会場?作業環境が課題?
?図書館のデータ:高度に構造化(3.2.5)
Linked Dataと親和性は高い
?VIAF (Virtual International Authority File)
?RDA (Resource Description and Access)
?国立国会図書館:Web NDL Authorities
?大学図書館:「NII 総合目録データベースの
データ公開に関するパブリックコメント募集」
http://www.nii.ac.jp/CAT-ILL/about/project/
od2013/
VIAF

"38
Web NDL Authorities

"39
Linked Dataに関する + α
?第2回 Linked Open Data(LOD)とオントロジー勉強会
??2013.8.5 (http://kokucheese.com/event/index/
101729/)
?情報組織化研究グループ月例研究会
??「Linked Open Dataの基礎とこれからの情報活用」
2013.9.21?(http://josoken.digick.jp/meeting/
2013/201309.html)
?第2回Linked Open Dataハッカソン関西 in 大阪
??2013.12.6 (http://peatix.com/event/23486)
Linked Dataに関する + α
? Linked Dataを使い始めるにあたって
公開ずみのデータを眺める
ex.) DBpedia Japanese, 日本語Wikipediaオントロ
ジー研究ページ,CKAN日本語
? Linked Data公開?活用支援

? LinkData.org:データをアップ→オープンデータ化??
?アプリケーションの作成も
"43
? OPEN Refine:数万件規模のデータをLinked Data化
DBpedia Japanese(RDF/XML)
"45
"46
"47
"48
"49
"50
"51
Linked Dataに関する + α
? 関連の研究会?イベントは増えている
ex.)LODチャレンジ
?インターナショナルオープンデータデイ
? 公的機関情報のオープンデータ化の加速
cf.) G8オープンデータ憲章?(2013.6)
??data.go.jp
? 図書館データのオープン化:大きくはこれら
の流れとつながる

"52
"53
"54
Linked Dataに関する + α
? 研究会参加で感じること
間口を広げ、より普及させよう
ex.) 公開?活用支援サイト
? 初期の関係者から、一般へと拡大
素人でも入っていきやすくなっている

"55
ご清聴ありがとうございました

"56

More Related Content

140201josoken linkeddata