狠狠撸

狠狠撸Share a Scribd company logo
簡単LOD入門
?デジタル庁をデジタル
化する?
@takechan2000
デジタル庁のデジタル化
? デジタル庁スタート、ひとまず日本人を取り残
さないデジタル庁オープンデータを作る民間プ
ロジェクト開始
? https://fukuno.jig.jp/3325
? デジタル庁の情報をPDFから機械可読(machine-
readable)のデータにする。
デジタル庁のデジタル化
? 人事情報の変換
? https://cio.go.jp/sites/default/files/uploads/documents/
digital/20210901_news_01.pdf
? https://github.com/code4fukui/digital-agency-
jp/blob/main/デジタル庁人事.csv
デジタル庁のデジタル化
? 組織情報の変換
? https://cio.go.jp/sites/default/files/uploads/documents/
digital/20211011_org_structure_01.pdf
? https://github.com/code4fukui/digital-agency-
jp/blob/main/デジタル庁の組織体制.csv
Excel化したらデジタル化?
? 同じものが同じかどうかわからない
? 関係がよくわからない
? 外の情報とつながっていない
上の二つはRDBをちゃんと設計すれば解決できるが…
? そこまでする?
? 新たな情報をはいってくるとまたスキーマ設計
最後の一つは簡単ではない
RDF(Resource Description Framework)
? 情報をグラフ構造として書く仕組み
? 有向グラフです
? グラフのノード(頂点)は事物とか事柄、概念
とかなにか(エンティティ)を指し示すもの
? グラフのエッジ(辺)は
? エンティティ間の関係
? エンティティの属性を表現(属性のタイプがエッジ
でその終点は属性の値)
? グラフのノードもエッジもWebの世界でユニー
クの存在するもの
? URIとして書く
RDF model
? 文
? http://www-kasm.nii.ac.jp/~takeda の作者は “Hideaki Takeda”
? 構造
? Resource (主語): http://www-kasm.nii.ac.jp/~takeda
? Property (述語): “Creator”
? Value (目的後): “Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”
“Creator”
Resource Property Value
RDF model
? 文
? http://www-kasm.nii.ac.jp/~takeda の作者は “Hideaki Takeda”
? 構造
? Resource (主語): http://www-kasm.nii.ac.jp/~takeda
? Property (述語): “Creator”
? Value (目的後): “Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”
“Creator”
Resource Property Value
URI
リテラル(文字列)
RDF/Turtle
? http://www-kasm.nii.ac.jp/~takeda の作者は “Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”
“Creator”
Resource Property Value
<http://www-kasm.nii.ac.jp/~takeda> “Creator” "Hideaki Takeda" .
TurtleでのRDFの記述
[主語] [述語] [目的語] .
空白 空白 ピリオド
URIは < と > で囲む リテラル(文字列)は "と " で囲む
Dublin Core
? 書誌のように情報のあらましを書くための語彙
? https://www.dublincore.org/specifications/dublin-core/dcmi-terms/
? 15個の要素
? Title -> http://purl.org/dc/elements/1.1/title
? Creator -> http://purl.org/dc/elements/1.1/creator
? Subject -> http://purl.org/dc/elements/1.1/subject
? Description -> http://purl.org/dc/elements/1.1/description
? Publisher -> http://purl.org/dc/elements/1.1/publisher
? Contributor -> http://purl.org/dc/elements/1.1/contributor
? Date -> http://purl.org/dc/elements/1.1/date
? Type -> http://purl.org/dc/elements/1.1/type
? Format -> http://purl.org/dc/elements/1.1/format
? Identifier -> http://purl.org/dc/elements/1.1/identifier
? Source -> http://purl.org/dc/elements/1.1/source
? Language -> http://purl.org/dc/elements/1.1/language
? Relation -> http://purl.org/dc/elements/1.1/relation
? Coverage -> http://purl.org/dc/elements/1.1/coverage
? Rights -> http://purl.org/dc/elements/1.1/rights
RDF/Turtle
? http://www-kasm.nii.ac.jp/~takeda の作者は
“Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”
http://purl.org/dc/elements/1.1/creator
Resource Property Value
<http://www-kasm.nii.ac.jp/~takeda>
<http://purl.org/dc/elements/1.1/creator> "Hideaki Takeda" .
RDF/Turtle
? http://www-kasm.nii.ac.jp/~takeda の作者は
“Hideaki Takeda”
http://www-kasm.nii.ac.jp/~takeda “Hideaki Takeda”
dc: creator
Resource Property Value
@prefix dc: <http://purl.org/dc/elements/1.1/> .
<http://www-kasm.nii.ac.jp/~takeda> dc:Creator "Hideaki Takeda" .
RDF model
? http://www-kasm.nii.ac.jp/~takeda の作者は
http://www.nii.ac.jp/staffid/123456 で示され、その名前は
“Hideaki Takeda” で、emailアドレスは “takeda@nii.ac.jp” で
ある.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
dc:creator
http://www.nii.ac.jp/staffid/123456
“takeda@nii.ac.jp”
ex:name ex:email
RDF model
? http://www-kasm.nii.ac.jp/~takeda の作者の名前
は“Hideaki Takeda” で、emailアドレスは
“takeda@nii.ac.jp” である.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
dc:creator
“takeda@nii.ac.jp”
ex:name ex:email
RDF/Turtle
? http://www-kasm.nii.ac.jp/~takeda の作者は
http://www.nii.ac.jp/staffid/123456 で示され、その名前は“Hideaki Takeda” で、
emailアドレスは “takeda@nii.ac.jp” である.
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
dc:reator
http://www.nii.ac.jp/staffid/123456
“takeda@nii.ac.jp”
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix ex: <http://example.org/schema/> .
<http://www-kasm.nii.ac.jp/~takeda> dc:Creator
<http://www.nii.ac.jp/staffid/123456> .
<http://www.nii.ac.jp/staffid/123456> ex:name "Hideaki Takeda" .
<http://www.nii.ac.jp/staffid/123456> ex:email "takeda@nii.ac.jp" .
ex:name ex:email
RDF syntax
http://www-kasm.nii.ac.jp/~takeda の作者の名前は“Hideaki
Takeda” で、emailアドレスは “takeda@nii.ac.jp” である
http://www-kasm.nii.ac.jp/~takeda
“Hideaki Takeda”
dc:creator
“takeda@nii.ac.jp”
ex:name ex:email
@prefix dc: < http://purl.org/dc/elements/1.1/ > .
@prefix ex: <http://example.org/schema/> .
<http://www-kasm.nii.ac.jp/~takeda> dc:Creator [
ex:name "Hideaki Takeda" ;
ex:email "takeda@nii.ac.jp"
] .
“1955-06-08”
Linked Dataの記述
http://www-kasm.nii.ac.jp/
~takeda#me
http://southampton.rkbexplorer.com/
id/person-07113
foaf:knows
foaf:Person
rdfs:type
foaf:name foaf:gender
<http://dbpedia.org/resource/Tim_Berners-Lee>
owl:sameAs
dbpprop:birthDate
dbpprop:birthPlace
dbpprop:name
dbpedia:Computer_scientist
dbpprop:occupation
“武田英明” “male”
“London, England”
“Sir Tim Berners-Lee”
デジタル庁の組織図の再考
? リソース
? リソース(組織の要素、人)は明確
? でもURIはないので、独自に考えないといけない
? 語彙
? 組織の構成の表現や組織の中の関係の表現が必要
? “作者(creator)”はDublin Coreにあった。じゃあ、組
織のための語彙はあるか。
? Organization Ontology
? https://www.w3.org/TR/vocab-org/
デジタル庁の組織図のRDF化
? クラス:
? org:Post
? org:Organization
? foaf:Person
? プロパティ:
? org:subOrganizationOf: 下位組織 (Organization -> Organization)
? org:headOf: 組織の長の役職(Organization -> Post)
? org:postIn: 組織の中の役職(Organization -> Post)
? org:reportsTo: 報告系統(Post -> Post)
? org:purpose: 組織の目的(Organization -> Literal)
? org:holds 役職を担う人 (Post -> Person)
? foaf:name: 人の名前 (Person -> Literal)
? skos:prefLabel: 名称
? rdfs:comment: コメント
? owl:sameAs: 等価なリソース
RDFを書いてみる
? https://github.com/takechan2000/semantic-digital-
agency/
? https://github.com/takechan2000/semantic-digital-
agency/blob/main/digital-agency-organization3.ttl
? https://github.com/takechan2000/semantic-digital-
agency/blob/main/digital-agency-organization3link.ttl
RDFをチェックする
? https://www.w3.org/2015/03/ShExValidata/
? http://rdfvalidator.mybluemix.net/
? 変换もできる
RDFを可視化する
? https://www.kanzaki.com/works/2009/pub/graph-
draw
? 型付グラフ
RDFStore virtuosoを使う
? VirtuosoはRDFのデータベース
? Installの仕方はいろいろあります。
? Dockerで
? https://qiita.com/ir-shin1/items/86bc4bf0f9deda210b1a
? http://wiki.lifesciencedb.jp/mw/SPARQLthon75/virtuoso_dock
er
? Web UI
? ローカルに使う標準的なインストールなら
http://localhost:8890/
(技術面からみた)オープン
データへの5つのステップ
どんなフォーマットでよいからオープンラインセス
でデータ公開 例:PDF, jpg
コンピュータが処理可能なフォーマット
で公開 例:xls, doc
オープンに利用できるフォー
マットで公開 例:csv
RDF(とSPARQL)でデー
タ公開 例:RDFa, RDF
ストア
他へのリンクを入
れたデータを公開
ライセンスをつけずにデータをWebで公開
(技術面からみた)オープン
データへの5つのステップ
どんなフォーマットでよいからオープンラインセス
でデータ公開 例:PDF, jpg
コンピュータが処理可能なフォーマット
で公開 例:xls, doc
オープンに利用できるフォー
マットで公開 例:csv
RDF(とSPARQL)でデー
タ公開 例:RDFa, RDF
ストア
他へのリンクを入
れたデータを公開
ライセンスをつけずにデータをWebで公開
おしまい
? RDF
? https://github.com/takechan2000/semantic-digital-
agency
? このスライド

More Related Content

赵简単尝翱顿入门 ?テ?シ?タル庁をテ?シ?タル化する?