狠狠撸

狠狠撸Share a Scribd company logo
ライフサイエンス统合データベースセンター
文献情報関連サービスを活用する
ライフサイエンス统合データベースセンター
山本泰智 (@yayamamo)
ライフサイエンス统合データベースセンター
PubMed検索最新情報
インターフェースが変化し続けている
http://pubmed.gov/
ライフサイエンス统合データベースセンター
ライフサイエンス统合データベースセンター
ライフサイエンス统合データベースセンター
効率的な検索を可能にする機能
? 柔軟なフィルタ機能を検索結果ページに配置

? 発表年による絞り込みを容易にする対話的なグラフを配置

? より詳細な条件設定を可能にするフォームを配置

? RSSを用いた最新検索結果の自動配信機能を提供
ライフサイエンス统合データベースセンター
例: MERSで検索
ライフサイエンス统合データベースセンター
ライフサイエンス统合データベースセンター
Sort by Relevance
ライフサイエンス统合データベースセンター
個々の文献情報に対する付加情報
ライフサイエンス统合データベースセンター
MeSHタームを利用していますか?
ライフサイエンス统合データベースセンター
Middle East Respiratory Syndrome Coronavirus/isolation &
puri?cation*
ライフサイエンス统合データベースセンター
MeSH (Medical Subject Headings) ターム
? 概念階層関係を持つ統制語彙 (語彙数は約2万6千) で毎年更新される

? MEDLINE収録の全文献に対しNational Library of Medicine (NLM) の約100人の
専門スタッフがMeSHタームを用いた注釈付けを行う

? 全員が生命科学関係の学士以上の学位を有す

? PubMed検索時に利用することで効率良く目的の文献を見つけられる

? MEDLINEの代表的な特徴
ライフサイエンス统合データベースセンター
MeSHデータベースを利用したPubMed検索
参考: https://youtu.be/uyF8uQY9wys
ライフサイエンス统合データベースセンター
①
②
ライフサイエンス统合データベースセンター
①②
③
ライフサイエンス统合データベースセンター
ライフサイエンス统合データベースセンター
特定の検索目的に特化したPubMedの利用
ライフサイエンス统合データベースセンター
ライフサイエンス统合データベースセンター
予め設定されたPubMed検索テンプレート
Category Optimized For
Sensitive/
Speci?c
PubMed Equivalent
therapy
sensitive/broad 99%/70%
((clinical[Title/Abstract] AND trial[Title/Abstract]) OR clinical trials as topic[MeSH Terms] OR clinical
trial[Publication Type] OR random*[Title/Abstract] OR random allocation[MeSH Terms] OR therapeutic
use[MeSH Subheading])
speci?c/narrow 93%/97%
(randomized controlled trial[Publication Type] OR (randomized[Title/Abstract] AND controlled[Title/Abstract]
AND trial[Title/Abstract]))
diagnosis
sensitive/broad 98%/74%
(sensitiv*[Title/Abstract] OR sensitivity and speci?city[MeSH Terms] OR diagnose[Title/Abstract] OR
diagnosed[Title/Abstract] OR diagnoses[Title/Abstract] OR diagnosing[Title/Abstract] OR diagnosis[Title/
Abstract] OR diagnostic[Title/Abstract] OR diagnosis[MeSH:noexp] OR diagnostic * [MeSH:noexp] OR
diagnosis,di?erential[MeSH:noexp] OR diagnosis[Subheading:noexp])speci?c/narrow? 64%/98% (speci?city[Title/Abstract])
etiology
sensitive/broad 93%/63%
(risk*[Title/Abstract] OR risk*[MeSH:noexp] OR risk *[MeSH:noexp] OR cohort studies[MeSH Terms] OR
group[Text Word] OR groups[Text Word] OR grouped [Text Word])
speci?c/narrow 51%/95%
((relative[Title/Abstract] AND risk*[Title/Abstract]) OR (relative risk[Text Word]) OR risks[Text Word] OR cohort
studies[MeSH:noexp] OR (cohort[Title/Abstract] AND study[Title/Abstract]) OR (cohort[Title/Abstract] AND
studies[Title/Abstract]))
prognosis
sensitive/broad 90%/80%
(incidence[MeSH:noexp] OR mortality[MeSH Terms] OR follow up studies[MeSH:noexp] OR prognos*[Text
Word] OR predict*[Text Word] OR course*[Text Word])
speci?c/narrow 52%/94% (prognos*[Title/Abstract] OR (?rst[Title/Abstract] AND episode[Title/Abstract]) OR cohort[Title/Abstract])
clinical
prediction
guides
sensitive/broad 96%/79%
(predict*[tiab] OR predictive value of tests[mh] OR score[tiab] OR scores[tiab] OR scoring system[tiab] OR
scoring systems[tiab] OR observ*[tiab] OR observer variation[mh])
speci?c/narrow 54%/99% (validation[tiab] OR validate[tiab])
http://www.ncbi.nlm.nih.gov/books/NBK3827/#pubmedhelp.Clinical_Queries_Filters
ライフサイエンス统合データベースセンター
PubMedから直接BLASTを利用する
ライフサイエンス统合データベースセンター
PubMed検索の注意
? 複合語の検索は二重引用符()で囲むことで可能?
ただし、それがPubMedデータベースの索引に含まれていなければならな

? 例:?
○ Linked Open Data?
○ Open Data?
× Linked Open

? 最新の文献およびPubMedのみに含まれる文献はMeSHタームでは検索できない

1. 人手により付けられており、通常約3週間かかるため

2. MeSHタームはMEDLINEに書誌情報が収められる文献が対象?
PubMed検索対象はMEDLINE+α
ライフサイエンス统合データベースセンター
PMID: 25189709 [PubMed - indexed for MEDLINE]
ライフサイエンス统合データベースセンター
PMID: 25814886 [PubMed]
実習
iPS細胞に関する山中先生が著者
に含まれている論文を探す

(MeSH Databaseから検索)
ライフサイエンス统合データベースセンター
inMeXesAllie
Colil
文献で使われる英語
表現を検索
文献で使われる略語
を検索
引用情報の検索
随時更新
無料
ライフサイエンス统合データベースセンター
Allie (アリー)
文献で使われる略語とその展開形を検索
Allie
http://allie.dbcls.jp/
ライフサイエンス统合データベースセンター
danmachold
ライフサイエンス统合データベースセンター
生命科学分野の文献中には略語が多い
? 研究者により自由に略語が生み出されている?
発表文献数は増加の一途 (PubMedには2000報以上追加/日)

? 多くの多義語?類義語が存在

? 読み手に誤解と混乱を生じさせる?
PC: personal computer, primary care, prostate cancer, ...?
Alcoholic chronic pancreatitis: ACP, alcoholic CP, ...
Year 2015
6万8千略語
2500万件
(出現頻度10以上)
ライフサイエンス统合データベースセンター
生命科学系の略語を簡単に調べる方法はないか?
新たに作られた略語も含めて
ライフサイエンス统合データベースセンター
計算機を用いて自動的に抽出
complementary DNA - cDNA
ライフサイエンス统合データベースセンター
reactive oxygen species?
ROS
high-performance liquid
chromatography?
FTIR
superoxide dismutase?
SOD
約2500万件
約1560万ペア
MEDLINEに含まれる全文献情報を対象に抽出
(unique: 280万)
ライフサイエンス统合データベースセンター
Allie
? 日本語訳があれば提示?
reactive oxygen species / 活性酸素種, 反応性酸素生成物

? よく使われる分野を提示、絞り込みも可能?
Biochemistry / 生化学, 生物化学

? 出現文献情報を提示?
ROS - (1980) Evidence for both oxygen and non-oxygen dependent
mechanisms of antibody sensitized target cell lysis by human monocytes.

? 同じ文献で使われている他の略語 (共起略語) も提示?
ROS -SOD, NO, NAC, ...
ライフサイエンス统合データベースセンター
ペア出現頻度の経年変化
ライフサイエンス统合データベースセンター
発展的な利用
? ftpでデータベースのダウンロードが無料で可能

? 毎週更新

? APIにより利用者の開発したプログラムから検索可能

? SOAP / REST / SPARQL

? http://data.allie.dbcls.jp/
ライフサイエンス统合データベースセンター
AllieデータベースへのSPARQL検索結果例
頻度 略語 展開形 展開形の対訳
14629 HIV-1 human immunode?ciency virus type 1 ヒト免疫不全ウイルス1型
14186 EBV Epstein-Barr virus ((略)) EBウイルス, (DNA腫瘍ウイルス) エプスタイン?バーウイルス, Epstein-Barrウイルス
6371 HSV herpes simplex virus 単純ヘルペスウイルス, 単純疱疹ウイルス
6356 RT reverse transcriptase 逆転写酵素
5579 HSV-1 herpes simplex virus type 1 単純ヘルペスウイルス1型
4581 HA hemagglutinin ヘマグルチニン, 血球凝集素, 赤血球凝集素
4176 ORFs open reading frames
(DNA上でタンパク質をコードする範囲) 翻訳領域, オープンリーディングフレ
ーム, 読み取り枠, 読み枠
4108 HCMV human cytomegalovirus ヒトサイトメガロウイルス
3290 VZV varicella-zoster virus 水痘?帯状疱疹ウイルス, 水痘帯状疱疹ウイルス
2798 LTR long terminal repeat 末端反復配列
研究分野がVirologyである文献中に出現する略語
ライフサイエンス统合データベースセンター
http://allie.dbcls.jp/
検索略語のアリー
ライフサイエンス统合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20100831.html#p01
実習
? 略語MERSの展開形を検索

? 共起略語をみて、MERSよりも
MERS-CoVとして使われている
文献が多いことを確認する

? 目的の展開形について、詳細情
報として実際に利用されている
表現や文献リストを確認する
ライフサイエンス统合データベースセンター
inMeXes (インメクセズ)
文献中に書かれている英語表現を検索
inMeXes
http://docman.dbcls.jp/im/
ライフサイエンス统合データベースセンター
英作文をしていると出くわす悩み
? is associated に続く前置詞は何だったっけ?

? リン酸化に対応する英単語、phosの続きはどう綴ったかな?

? associated with を修飾する副詞、文献でよく使われているものは何だろう?

? thermodynamic parameters には the が付くことが多い??
付いている場合の実際の文章は?
is	 associated	 ...
ライフサイエンス统合データベースセンター
inMeXes にお任せください!
ライフサイエンス统合データベースセンター
inMeXes
? 高速?
MEDLINEに含まれる全ての題目、要旨中の表現を高速に検索

? 軽快?
4文字以上入力すると、キーを叩く毎に検索結果を表示

? 便利?
結果は頻度順、気になる表現をクリックすると関連情報を表示
ライフサイエンス统合データベースセンター
やや高度な使い方: 正規表現フィルタ
? 例: was _ correlated withの_にはどのような表現があるかを知りたい
ライフサイエンス统合データベースセンター
発展的な利用
? API (JSONP) による検索が可能

? ご自身のブログやホームページに検索サービスを埋め込めます

? API Keyなどの認証は不要
ライフサイエンス统合データベースセンター
http://docman.dbcls.jp/im/
検索インメクセズ
ライフサイエンス统合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20091216.html#p01
実習
? contributeと入力して続く前置
詞を確認する

? informationと入力して下記の表
現の利用頻度をみる

? information of

? information on

? information about

? 以上の表現について、実際の文
章を確認する
ライフサイエンス统合データベースセンター
Colil (コリル)
文献の引用情報を検索
http://colil.dbcls.jp/
ライフサイエンス统合データベースセンター
ある文献に関する第三者からの視点
? ある文献について、当該文献の著者ではない研究者による評価はどうだろう?

? ある文献について、共によく引用されている文献はあるだろうか?

? 引用する文献について、文中で引用するさいの適切な記述例はないだろうか?
Colilがお答えします
ライフサイエンス统合データベースセンター
Colil (Comments on literature in literature)
? 特定の論文について、その引用記述を検索します

? 特定の論文について、他の論文から共に引用されている論文を表示します?
(共引用情報)

? 対象はPMIDが付けられているPMC OA (Open Access)サブセットです?
(約74万件、PubMed全体の3%強)

? 現バージョンは2015年2月時点取得時のものです

? 約618万件のPMID付き文献がPMC OAサブセットから引用されています?
(PubMed全体の1/4強)
ライフサイエンス统合データベースセンター
PubMed ID or PubMed検索語を入力
①
②
PubMed ID
PubMed検索語
もしくは
ライフサイエンス统合データベースセンター
発展的な使い方
? ftpでデータベースのダウンロードが無料で可能

? APIにより利用者の開発したプログラムから検索可能

? REST / SPARQL

? http://colil.dbcls.jp/
ライフサイエンス统合データベースセンター
SPARQLクエリ例
ライフサイエンス统合データベースセンター
http://colil.dbcls.jp/
検索colil
ライフサイエンス统合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20150207.html#p01
実習
? PDBの文献(PMID: 10592235)に
対し、他の文献中でどのように
触れられているのか概観する。

? 関連文献にはどのような研究課
題があるのかを確認する。

? EMBL-EBIのバイオインフォ解
析ツールに関する文献(PMID:
20439314)についてはどうか。

More Related Content

AJACS54 PubMed Allie inMeXes Colil