狠狠撸

狠狠撸Share a Scribd company logo
Linked Open Data
山本 泰智
ライフサイエンス統合データベースセンター
@yayamamo
1. factual information (as measurements or statistics) used as a
basis for reasoning, discussion, or calculation
2. information output by a sensing device or organ that includes
both useful and irrelevant or redundant information and must
be processed to be meaningful
3. information in numerical form that can be digitally transmitted
or processed
--- Merriam-Webster
Data
データは素材 (原材料)
1. 推論や議論、または計算するための事実
2. 意味あるものとするために処理することが必須
データはどう保存される?
NASA Goddard Photo and Video
Gain a directory to ever-changing government information available on the Internet.
Government-related indexes, ?nding aids, path?nders, resource guides, and search engines are
identi?ed. Published by Bernan.
Now with more than 4,800 entries, including over
* 250 sites from international governmental organizations and other countries
* 150 U.S. state government sites
* 540 U.S. Congressional member sites and email address
* 1,400 individual government publications
URLs and content descriptions are veri?ed and updated for all entries.
The ?rst edition was included in “Selected Reference Books of 1997” in College and Research
Libraries, March 1998, p. 182.
http://www.notess.com/write/gioti/
“Because comparing sites on the Internet is dif?cult, this book
allows a user to identify and compare potential sites prior to even
going online...an excellent resource.”
— Journal of Government Information
2003年の話
1. factual information (as measurements or statistics) used as a
basis for reasoning, discussion, or calculation
2. information output by a sensing device or organ that includes
both useful and irrelevant or redundant information and must
be processed to be meaningful
3. information in numerical form that can be digitally
transmitted or processed
Data
3. デジタル送信や処理ができる数値化された情報
複製、加工がし易い
多元的なデータを用いた推論、議論、計算がし易い
デジタルデータの方が望ましい?
データ統合 (Data Integration / Mashup)
多くの情報源から得られたデータを統合して可視化
データ統合をし易い方がデータの価値を高められるの
ではないか?
http://forbesindia.com/blog/technology/data-deluge-needs-smarter-storage/
デジタルデータは膨大
散在するデジタルデータを効率良く見つけ
効率良くデータ統合をしたい
コンピューターを用いて
既に成功しているウェブに習い
データのウェブを実現しよう
ウェブ (World Wide Web)
インターネットを介してアクセスできる
リンクしたドキュメント群
http://www.
Mariano Real Pérez
データのウェブ
インターネットを介してアクセスできる
リンクしたデータ
Linked Data
リンクした (Linked)
<a href="http://www.ishikawa-
nct.ac.jp/blg/blg/20130529-1354.html">
ウェブの場合
Uniform Resource Locator (URL)
http://www.ishikawa-nct.ac.jp/blg/blg/20130529-1354.html
リンクする、
つまり、
ある文書から別の文書へ関連付ける
各文書をネット上で曖昧無く指し示せることが必要
ウェブを構成する技術標準
HyperText Transfer Protocol (HTTP)
HyperText Markup Language (HTML)
ウェブのリンクを表現するための記法
ネットを介したウェブを実現するための通信規約
Uniform Resource Locator (URL)
+
Linked Dataを構成する技術標準
HyperText Transfer Protocol (HTTP)
Resource Description Framework (RDF)
データのリンクを表現するための記法
ネットを介してリンクするデータを実現する
ための通信規約
Uniform Resource Identi?er (URI)
個々のデータを区別するための記法
Linked Data
Use URIs as names for things
Use HTTP URIs so that people can look up those names.
When someone looks up a URI, provide useful
information, using the standards (RDF*, SPARQL)
Include links to other URIs. so that they can discover more
things.
--- Tim Berners-Lee
http://www.w3.org/DesignIssues/LinkedData.html
複製、加工がし易いデジタルデータ
デジタルデータは二次利用がし易い
データ統合をし易い方がデータの価値
を高められるのではないか?
著作権の関係
二次利用を容易にできるとは限らない
二次利用を容易にする法的基盤
Open Data Commons Open Database License (ODbL)
オープンなデータ
Open Data
“A piece of data or content is open if anyone is free to
use, reuse, and redistribute it — subject only, at
most, to the requirement to attribute and/or share-alike.”
http://opende?nition.org/
誰もが自由に使い、再利用し、再配布できるならば、それはオープン
Data
Linked?
Open?
Yes
Yes
Linked Open Data
(LOD)
Open Data
Linked Data
Linked Open Data
Linked Data which is released under an open licence, which
does not impede its reuse for free.
--- Tim Berners-Lee
http://www.w3.org/DesignIssues/LinkedData.html
5 Star Linked Open Data mug
not just linked data, but linked *open* data
$13.19
http://www.cafepress.com/w3c_shop.597992118
LINKED DATA STANDARDS
ティム?バーナーズ=リーが示す次のウェブ (http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html) 中のプレゼン資料を見て筆者が作成
RDF
全てのデータを主語、述語、目的語の三つ組みで表現する
主語はURIか空白ノードで表現する
述語はURIで表現する
目的語はリテラルか空白ノードで表現する
http://ja.dbpedia.org/resource/東京都
%E6%9D%B1%E4%BA%AC%E9%83%BD
http://ja.dbpedia.org/ontology/country
http://ja.dbpedia.org/resource/日本
%E6%97%A5%E6%9C%AC
主語
述語
目的語
http://ja.dbpedia.org/property/name
東京都 目的語
述語
LODの基本的な仕組み
分野を跨いだオープンデータのリンクが容易にできる
dbpedia:Japan* dbpedia:Tokyo*
dbpedia/owl:capital*
dbpedia/owl:leaderName*
dbpedia:Shintarō_Ishihara*owl:sameAs*
h>p://data.nyAmes.com/59436095099277148161*
DBpedia
NYTimes
dbpedia:Naoki_Inose
語彙 (≒URIセット) の选択も自由
LODクラウド
分野を跨いでオープンデータをリンクすることで、多元的
なデータセットから成るLODクラウドが形成されている
RDF
RDF
RDF
DBpediaNYTimes
BBC
LODの特徴
だれでもWeb上でデータを公開できる
語彙を自由に選んでデータを表現できる
だれでもデータに情報を付加できる
データの選択や加工の自由度が高い
お互いにデータを公開し、共有することで、これら
の利便性が高まる
LOD構築にまつわる課題
URIの設計
既存語彙の検索と選択
既存語彙のライセンス
適切なデータモデルの選択
http://patterns.dataincubator.org/book/
RDFデータを構築し公開する際に
参考となる資料
搁顿贵データを利用する际に参考となる资料
LOD構築周辺
作る
良いエディタ
置く
良いレポジトリ
探す
良い検索サービス
使う
良いライセンス
散在するデジタルデータを効率良く見つけ
効率良くデータ統合をしたい
コンピューターを用いて
RDFを検索するための標準化された問合せ言語
SPARQL (スパークル)
SPARQL Protocol and RDF Query Language
LODの利用と公開
LODクラウド
(ウェブ空間)
LOD公開
LOD利用アプ
リケーション
検索エンジン
SPARQLエン
ドポイント
RDFダンプ
LOD公開ツール
RDFストア
既存データ
(RDB,CSV...)
RDFストア
RDF
ファイル
ユーザイン
ターフェース
などへ出力
C. Bizer, et. al(著), 萩野(訳), Linked Dataの仕組み, 情報処理,vol.52,no.3, 2011
参考文献
「Linked Open Dataとは」LODチャレンジ実行委員会
http://www.slideshare.net/lodjapan/linked-open-data-10164445
Q?

More Related Content

Linked Open Data