狠狠撸

狠狠撸Share a Scribd company logo
日本のヘルスケアICT戦略
に関するテキスト分析の試み
2016/6
須田泰司
sudays17@gmail.com
分析のねらい
IT戦略本部(高度情報通信ネットワーク戦略本部)各戦略内の医療分
野の情報化該当部分の記述は、比較して読むことで相違点をおおよそ
感覚的に把握できるが、テキスト情報定量化分析ツールのkh coder※1
を用いて視覚化することで、相違点を客観的に把握する。
具体的には、
①出現語数
②語数間の前後のつながり
③時系列での記述の変遷
を対象とした。
※1 http://khc.sourceforge.net/
1
分析対象としたIT情報戦略
● e-Japan戦略Ⅱ(2003):7ページ部分
● IT新改革戦略(2006):12~14ページ部分
● iジャパン戦略2015(2009):10~12ページ部分
● 新たな情報通信技術戦略(2010):6~7ページ部分
● 世界最先端IT国家創造宣言(2013):13~15ページ部分
● 世界最先端IT国家創造宣言_改定(2014):13~15ページ部分
● 世界最先端IT国家創造宣言_改定(2015):17~18ページ部分
● 世界最先端IT国家創造宣言_改定(2016):5、14~15、18ページ部分
総抽出後数:7,601語(272文、214段落※2)
※2句点で段落分けした。
2
分析(事前処理)
◆分析対象テキスト情報の加工
?各戦略名にタグ付けし、戦略単位で抽出できるようにした。
?原テキストの変更
ー世界最先端IT国家創造宣言_2016年改定にて年記述が元号(平成)
になっている部分は2015年以前の年記述である西暦表記に変更した。
ー( ○○)記述を_○○_に置き換えた。【】書きされた省庁名を削除した。
ー文中に参照先として項番がある部分は当該項番内の記述に置換した。
ー下記の単語は連結後として抽出するよう設定した。
“どこでもMY病院” ”ICカード” ”日本版EHR” ”e-Japan戦略II”
”イージャパン 戦略” ”iジャパン戦略2015” ”IT新改革戦略”
”新たな情報通信技術戦略” “世界最先端IT国家創造宣言”
3
分析結果?1 抽出後上位(数値は出現数)
医療(157) 整備(33) 効率(24) 踏まえる(18) 主体(14) 可能(12) 標準(11)
情報(96) 健康増進(32) 普及(24) 予防(18) 状況(14) 課題(12) 利用(11)
活用(80) 仕組み(32) システム(23) ?????(17) 審査(14) 寿命(12) ????????(10)
健康(80) 連携(32) 支援(23) 質(17) 展開(14) 収集(12) 基盤(10)
データ(57) 図る(30) 生活(23) 方策(17) 保険(14) 診療(12) 機関(10)
サービス(50) 提供(30) 患者(22) 確立(16) 2010年(13) 診療報酬(12) 業務(10)
介護(45) 向上(27) 適切(22) 全国(16) IT(13) 安心(11) 従事(10)
レセプト(41) 管理(26) 検討(21) 体制(16) 技術(13) 具体的(11) 内容(10)
医療機関(40) 効果(26) 電子(21) 導入(16) 高齢(13) 継続(11) ??????(9)
推進(40) 個人(25) 社会(20) 医師(15) 受ける(13) 自ら(11) 向ける(9)
地域(38) 行う(25) 安全(19) 各種(15) 促進(13) 診る(11) 資する(9)本人(9)
取組(34) 国民(25) 構築(19) 含む(15) 多様(13) 対応(11) 疾病(9)制度(9)
実現(33) 医療情報(24) 遠隔(18) 分野(15) 有効(13) 必要(11) 費用( 9)分析(9)
4
分析結果?1 抽出語上位
?最も出現回数の多いのは?医療?の157回。次に多いのは96回の?情報?。
??医療情報?は24回、?データ?は49回の出現数であった。
??医療?関連として?健康?が80回、?介護?が45回、?健康増進?が32回。
??実現?は33回出現しているが、?実現した?との達成済みを示す記述はゼロ。
??世界最先端IT国家創造宣言?2016年5月改訂版での、これまでの成果の記載
◆医療?健康情報等の各種データ(レセプトデータ、特定健診データ、がん登録データ等)の
蓄積や集約等、医療機関?保険者等による取組を推進中。
◆これらのデータの更なる利活用の推進により、国民の健康や医療サービスの質の向上等を期待。
をあげている。(下線赤字は筆者)
以上より、各種データのデジタル化、デジタルデータでの処理完結を目指す取組
は未完であり、また、その効果についても定量的な把握が行われていないことが
伺える。
5
情報化関連の用語に限定して出現状況をみると、
?前述した?情報?の他?データ?、?レセプト?、?システム?、?電子?、?オ
ンライン?、
?データベース?、?ネットワーク?が9件以上の出現回数となった。
??EHR?、?PHR?の出現回数はそれぞれ4件、1件であった。
??データヘルス?の出現回数は2件で、いずれも世界最先端IT国家創造宣言
_2016年改定におけるものであった。
??標準?の出現回数は11件あるが、レセプトコンピュータの標準化、健診
データの標準化、医療情報システムの標準化。医薬品データマスタの標準
化が対象となっている。
?このうち、医療情報システムの標準化との記述は?IT新改革戦略?(2006
年)から?世界最先端IT国家創造宣言?(2015年)まで10年間出現している。
??IT?の出現回数は13件。?ICT?での記述はゼロ。
分析結果?2 抽出語の全体的傾向 6
?最小出現数:10
?方法:Ward法
?距離:Jaccard
でクラスターを作成
分析結果?3 デンドログラム
?次ページへ続く
出現件数(ラインは40件)
?出現語の件数と、出現語間の距離(クラスター)を示した
ものがデンドログラムである。
① ② ③ ④ ⑤
7
?最小出現数:10
?方法:Ward法
?距離:Jaccard
でクラスターを作成
出現件数(ラインは40件)
分析結果?3 デンドログラム
⑧⑦⑥
?出現語の件数と、出現語間の距離(クラスター)を示した
ものがデンドログラムである。
?前ページより
8
記述の近さからわかること?原テキストで確認できたこと
①?医療情報??システム?の?全国展開??医療情報ネットワークは出現回数少で未
抽出
②?個人?が?自ら??管理??対象は?健康??医療??情報?
③?2010年??出現回数が13件。次に多い出現回数は5件(2011,2016,2018)
④?レセプト?の?オンライン??審査??世界最先端IT国家創造宣言では、審査以外
での利活用に言及
⑤?医療機関?の?効率?を?実現??対象は事務業務具体的には診療報酬審査。
⑥?介護??サービス?での?多様?な?主体?の?連携??2013年より出現。?地域包括
ケアシステムと連動??地域包括ケア?の出現回数は3件
⑦?遠隔??技術?で?高齢?(者)の?質?を?向上??遠隔医療技術による生活の質の向
上との記述はなし
⑧?健康増進?の?有効?を?踏まえる??有効な方策を確立しそれを踏まえると記述
分析結果?4 デンドログラムから見える傾向 9
分析結果?5 共起ネットワーク①
?最小出現数:10
?Jaccard係数:0.2以上
?描画数:60
?出現頻度をバブルプロットで表示
”記述語間の距離を表示”
A:「医療情報/健康情報?データの活用」へ
の言及が多い【分析結果-1の通り】
B:医療と介護サービスの連携は、記述が近い
が、予防?健康増進との記述は遠い(H)
C:個人による管理
?服薬情報を中心とした、電子医療?健康情報
D:仕組み、体制の構築/整備
?個人による管理、提供側の連携
E:レセプトオンライン
F:医療情報システムの導入/全国展開
G:地域-医師は、「地域の医師不足」のこと
H:健康増進-有効
?「2016年度までに有効な方策を確立」とな
っている
A
B
C
D
E
F
G
H
10
出現語には時系列で2グループ
にまとめられる。
e-Japan戦略II??IT新改革戦略
??iジャパン戦略2015??新たな
情報通信技術戦略のグループ
世界最先端IT国家創造宣言のグ
ループ(この中でも2013~
2015年と2016年で分かれる)
分析結果?6 共起ネットワーク②
II
2003年
2006年
2009年
2010年
2014年
2015年
2016年
2013年
最小出現数:10
Jaccard係数:0.2以上
描画数:60
出現頻度をバブルプロットで表示
”戦略別記述語間の距離を表示”
□表示が戦略名
は複数戦略での出現語
11
戦略別分析情報量のうち名称を除いた文字数
● e-Japan戦略Ⅱ(2003):1,116文字(8.3%)
● IT新改革戦略(2006):2,714文字(20.2%)
● iジャパン戦略2015(2009):2,536文字(18.9%)
● 新たな情報通信技術戦略(2010):1,109文字(8.3%)
● 世界最先端IT国家創造宣言(2013):1,680文字(12.5%)
● 世界最先端IT国家創造宣言_改定(2014):1,680文字(12.5%)
● 世界最先端IT国家創造宣言_改定(2015):1,736文字(12.9%)
● 世界最先端IT国家創造宣言_改定(2016):866文字(6.4%)
合計:13,437文字(100.0%)
内容は別として、
記述量が多い
12
まとめ
??医療情報/健康情報?データの活用?についての記述が多い【10ページ_A】
ただしその取組は推進中で、整備状況に関する具体的な記述はない【5ページ】
?設定タイムラインとしては2010年が最多【9ページ_③】
ただし設定タイムラインの達成状況の評価はない【原テキストより】
なお、これから設定されている主なタイムラインは2018年(医療情報利活用基盤
の全国展開)【原テキストより】
?レセプト、診療報酬はオンラインでの送信→審査→活用の3段階に分かれる
【9ページ_④】【原テキストより】
?データベース:レセプト、健康情報、両者を包含する医療情報データベースと
して記述されている【原テキストより】
基盤、ネットワークへの言及は少ない。合計出現回数は19件【4ページ】
?地域包括ケア:多様な主体間での情報共有?連携との記述はあるが、ICTを明
記していない【原テキストより】
13
おわりに?本分析の限界と展望?
◆テキスト情報を定量的に分析することで記述内容ー言葉の出現状況、
前後の出現状況ーについて、可視化して把握することができた。
なお、今回は全体で文字数が13,437(抽出語数で7,590。400字原稿用
紙で約30ページ相当)と少ないデータ量での分析。
戦略別でみると最多で2,714文字、最小で866文字、平均1,680文字。
?kh coderのチュートリアルでとりあげている文字数は100,000語超。
◆詳細な分析には原テキストに戻ることが不可欠となるが、概要把握
や詳細分析のあたりをつけるといった部分で、テキスト情報の定量分
析は有用と思われる。
◆今後は①コーディングによる傾向分析(“医療””予防””介護”等グループ
分けしての可視化)※3②審議会、研究会の議事録、報告書を対象とし
た分析(議事録と報告書間での共通点、相違点の可視化)での利用が考
えられる。
14
※3今回の分析では、データベースとデータベースシステムは別々に抽出。またナシ
ョナルデータベースはレセプトデータベースを指すためコーディングが可能。

More Related Content

日本のヘルスケア滨颁罢戦略に関するテキスト分析の试み