狠狠撸

狠狠撸Share a Scribd company logo
江上周作1,川村隆浩1,2,古崎晃司3,大須賀昭彦1
1電気通信大学 2科学技術振興機構 3大阪大学
1
LODチャレンジ2016 アイデア部门応募资料
アイデア
? Linked Data, Linked Open Data (LOD)を構築する際に,デー
タ構造(スキーマ)をどのように設計するかは重要な要
素である
? 特にデータの統一化や知識処理などの観点から,オント
ロジーに基づいたスキーマになっていることが望ましい
? LODスキーマを既存オントロジーに基いて設計する方法
を方法論としてまとめることで,誰でもこの手順でLOD
スキーマを設計できるようにする(今回は社会課題編)
2
LODスキーマ設計の方法論
1. 既存オントロジーの選択
2. キーワード抽出
3. グルーピング
4. クラス設計
5. インスタンス設計
3
1. 既存オントロジーの選択
対象課題をモデル化するために使用するオントロジーが決定し
ていない場合に行う
1. LODの利用目的から選択する場合
? 地理的分析?可視化?GeoNames Ontology等
? 時間的分析?可視化?Time Ontology等
? 因果関係分析?可視化?Event Ontology等
? (課題:利用目的と対応オントロジーの表を作る)
2. 使用単語から選択する場合
? LOV[1]からLOD中に使用する単語で検索
? 検索結果から使用するオントロジーを選択する
今回は社会課題の中でも放置自転車を例に説明
Event Ontologyを選択
4
[1] Linked Open Vocabularies: http://lov.okfn.org/dataset/lov/
[2] Event Ontology: http://motools.sourceforge.net/event/event.html
2. キーワード抽出
1. 選択したオントロジーの中で,対象とする課題の中心
クラスに対応するクラスを決める
? 例:放置自転車?event:Event
2. 1で選択したクラスと直接関係するプロパティ名を基に
日本語WordNetで日本語意味を複数取得
? この時プロパティの値が不明なもののみを対象とする(例:
event:factor)
3. 「課題名(スペース)プロパティの日本語意味」で検索エ
ンジンを用いて記事を検索する
? 例:「放置自転車 原因」
4. マッチした記事からプロパティの値に相当する単語or
文を抽出する
5
3. グルーピング
1. 取得した単語を基にJ-Global Knowledge[3]のシソーラス
からクラス,上位クラスを取得
2. クラスごとに単語,文を表形式にまとめる.グループ
が互いに素であるようにする.
3. 既存オントロジーに無い新たなプロパティを追加し
てもよい
6
プロパティ グループ(クラス) 単語 文
P1 G1 K1 S1
… … … …
Pn Gn Kn Sn
[3] J-Global Knowledge: https://stirdf.jglobal.jst.go.jp/
4. クラス設計
Gi
中心クラス
Pi
中心クラスから(抽出に使った)プロパティを使用して
グループを値に指定
プロパティ グループ(クラス) 単語 文
P1 G1 K1 S1
… … … …
Pn Gn Kn Sn
5. インスタンス設計(1)
Gi
中心クラス
Pi
Ki
中心
インスタンス
type type
1. 単語をグループのインスタンスとして中心インスタンス
からリンクさせる
2. 必要であればインスタンス(Ki)同士の関係も追加する
プロパティ グループ(クラス) 単語 文
P1 G1 K1 S1
… … … …
Pn Gn Kn Sn
5. インスタンス設計(2)
9
中心
インスタンス Si
Pi
Ki,subject Ki,predicate Ki,object
rdf:subject
rdf:predicate
rdf:object
rdf:Statement
type
原因など、単語だけでは説明が難しいものに関しては文を
プロパティの値とする

More Related Content

LODスキーマ設計の方法論 -社会課題編-