狠狠撸

狠狠撸Share a Scribd company logo
2014年8月20日 
Japanese Genotype-phenotype Archive へのデータ登録 
児玉 悠一 
Kodama Yuichi, Ph.D 
DDBJ センター、アノテータ 
DDBJ center, annotator 新学術「ゲノム支援」拡大班会議 神戸
2014年8月20日 
DDBJ と NBDC の役割分担 新学術「ゲノム支援」拡大班会議 神戸 
? 
利用制限が必要な個人ゲノムデータを受入?保存?提供 
? 
匿名化されたメタデータのみ受付 
? 
NBDC ヒトデータ共有ガイドラインに従い、データの登録と利用を審査
2014年8月20日 
アクセス制限データベース 新学術「ゲノム支援」拡大班会議 神戸 
dbGaP 
Database of Genotype and Phenotype 
JGA Japanese Genotype-phenotype Archive 
EGA European Genome-phenome Archive 
? 
JGA と EGA は SRA をベースにした同様のデータモデルを使用 
? 
dbGaP と EGA はサマリー情報を交換 
? 
INSDC ではない
2014年8月20日 
JGA データモデル 新学術「ゲノム支援」拡大班会議 神戸
2014年8月20日 
JGA データモデル 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study JGAS 
Experiment 
JGAX 
Sample 
JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
アクセッション番号プレフィックス 
? 
SRA データモデルにオブジェクトを追加
2014年8月20日 
JGA Submission 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study JGAS 
Experiment 
JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
登録のためだけのオブジェクト 
? 
名前や連絡先などの登録者情報、提供開始日
2014年8月20日 
JGA Study 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
トップレベルのオブジェクトで研究内容?研究費?論文情報を含む 
? 
データ提供開始後、研究概要を示すために一般に公開される
2014年8月20日 
JGA Experiment 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
実験手順、質問票、ライブラリー情報やシークエンサなど 
? 
1つの Sample と複数の Data オブジェクトを連結
2014年8月20日 
JGA Sample 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
Sample ≒ 個人 
? 
表現型情報 (gender, age etc) や匿名化された donor ID
2014年8月20日 
JGA Data 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
個人に対応する (生) データファイル (fastq, bam, アレイデータ) を格納
2014年8月20日 
JGA Analysis 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
複数の Data もしくは Sample を解析したデータを格納 例: 変異データ (vcf) や表現型情報をまとめた表
2014年8月20日 
JGA Dataset 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
Policy が適用される Data と Analysis をまとめる (データ提供の単位) 
? 
データ提供開始後、含まれているデータの種類を示すために一般に公開される
2014年8月20日 
JGA Policy 新学術「ゲノム支援」拡大班会議 神戸 
Data set 
JGAD 
Policy 
JGAP 
Data set 1 
Policy 1 
Study 
Data 1 
Analysis 1 
Experiment 1 
Sample 1 
Submission JGA 
Study 
JGAS 
Experiment JGAX 
Sample JGAN 
Data 
JGAR 
Analysis 
JGAZ 
Data 2 
Experiment 2 
Sample 2 
Analysis 2 
? 
Dataset に適用される利用制限事項 独自の利用制限事項 (例: 特定の研究のみ) を NBDC ガイドラインに追加したい場合に作成
2014年8月20日 
JGA データ構成の例 新学術「ゲノム支援」拡大班会議 神戸
2014年8月20日 新学術「ゲノム支援」拡大班会議 神戸 
JGA データ 例1: シンプルなケース 
? 
Experiment – Sample – Data セットが「個人」に対応 
? 
Data: 生データ、Analysis: 解析したデータ 
NBDC ガイドラインのみが 
適用される場合、作成する必要はない
2014年8月20日 新学術「ゲノム支援」拡大班会議 神戸 
JGA データ 例2: NGS とアレイデータ
2014年8月20日 
NBDC ガイドライン 新学術「ゲノム支援」拡大班会議 神戸 
JGA データ 例3: 異なる利用制限事項 
? 
患者由来の個人データに対して、特定の研究目的に利用を制限する場合 NBDC ガイドライン + 独自の利用制限事項 
特定の研究目的に利用を制限 
健常者 
患者
2014年8月20日 
JGA へのデータ登録 新学術「ゲノム支援」拡大班会議 神戸
2014年8月20日 
JGA へのデータ登録 新学術「ゲノム支援」拡大班会議 神戸 
? 
NBDC にデータ提供を申請 
? 
承認されるとアップロードアカウントが発行される 
? 
メタデータは登録用エクセルに記入、JGA で XML を作成(メールでのやり取り) 
http://trace.ddbj.nig.ac.jp/jga/submission.html
2014年8月20日 
JGA へのデータアップロード 新学術「ゲノム支援」拡大班会議 神戸 
メタデータ XML と 
データファイルを選択 
JGA 登録を選択 
アップロードアカウント 
にログイン 
Encrypt & Upload で 暗号化 & アップロード 
? 
JGA 専用ツールでログイン 
? 
メタデータ XML とデータファイルを暗号化し SSH でサーバにアップロード 
? 
メタデータの整合性、データファイルの存在と md5 値がチェックされる 
データファイル 
メタデータ XML
2014年8月20日 
JGA アクセッション番号 新学術「ゲノム支援」拡大班会議 神戸 
プレフィックス 
メタデータオブジェクト 
数字の桁数 
例 
JGA 
Submission 
11 
JGA00000000001 
JGAS 
Study 
11 
JGAS00000000001 
JGAN 
Sample 
11 
JGAN00000000001 
JGAX 
Experiment 
11 
JGAX00000000001 
JGAR 
Data 
11 
JGAR00000000001 
JGAZ 
Analysis 
11 
JGAZ00000000001 
JGAD 
Data set 
11 
JGAD00000000001 
JGAP 
Policy 
11 
JGAP00000000001 
? 
JGA メタデータオブジェクトに対してアクセッション番号を発行
2014年8月20日 
JGA データの利用 新学術「ゲノム支援」拡大班会議 神戸
2014年8月20日 
利用可能な JGA データ一覧 新学術「ゲノム支援」拡大班会議 神戸 
http://humandbs.biosciencedbc.jp/data-use/all-researches-jp 
https://ddbj.nig.ac.jp/jga/viewer/view/studies
2014年8月20日 
JGA データの利用 新学術「ゲノム支援」拡大班会議 神戸 
? 
NBDC にデータ利用を申請 
? 
承認されると有効期限付きのダウンロードアカウントが発行される 
http://trace.ddbj.nig.ac.jp/jga/submission.html
2014年8月20日 
JGA データのダウンロード 新学術「ゲノム支援」拡大班会議 神戸 
ローカルの保存場所を選択 
JGA データセットを選択 
ダウンロードアカウント 
にログイン 
Download をクリックし、 ダウンロード & 復号化 
? 
JGA 専用ツールでログイン 
? 
ダウンロード権限が付与されている Data set をリストから選択 
? 
ダウンロードされ、復号化される 
? 
メタデータはウェブサイトにログインして閲覧 
https://ddbj.nig.ac.jp/jga/viewer/view/studies
2014年8月20日 
JGA ウェブサイト 新学術「ゲノム支援」拡大班会議 神戸 
http://trace.ddbj.nig.ac.jp/contact.html?db=jga 
http://trace.ddbj.nig.ac.jp/jga/submission.html 
? 
マニュアルを整備中 
? 
問い合わせページ

More Related Content

Japanese Genotype-phenotype Archive へのデータ登録

  • 1. 2014年8月20日 Japanese Genotype-phenotype Archive へのデータ登録 児玉 悠一 Kodama Yuichi, Ph.D DDBJ センター、アノテータ DDBJ center, annotator 新学術「ゲノム支援」拡大班会議 神戸
  • 2. 2014年8月20日 DDBJ と NBDC の役割分担 新学術「ゲノム支援」拡大班会議 神戸 ? 利用制限が必要な個人ゲノムデータを受入?保存?提供 ? 匿名化されたメタデータのみ受付 ? NBDC ヒトデータ共有ガイドラインに従い、データの登録と利用を審査
  • 3. 2014年8月20日 アクセス制限データベース 新学術「ゲノム支援」拡大班会議 神戸 dbGaP Database of Genotype and Phenotype JGA Japanese Genotype-phenotype Archive EGA European Genome-phenome Archive ? JGA と EGA は SRA をベースにした同様のデータモデルを使用 ? dbGaP と EGA はサマリー情報を交換 ? INSDC ではない
  • 4. 2014年8月20日 JGA データモデル 新学術「ゲノム支援」拡大班会議 神戸
  • 5. 2014年8月20日 JGA データモデル 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 アクセッション番号プレフィックス ? SRA データモデルにオブジェクトを追加
  • 6. 2014年8月20日 JGA Submission 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? 登録のためだけのオブジェクト ? 名前や連絡先などの登録者情報、提供開始日
  • 7. 2014年8月20日 JGA Study 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? トップレベルのオブジェクトで研究内容?研究費?論文情報を含む ? データ提供開始後、研究概要を示すために一般に公開される
  • 8. 2014年8月20日 JGA Experiment 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? 実験手順、質問票、ライブラリー情報やシークエンサなど ? 1つの Sample と複数の Data オブジェクトを連結
  • 9. 2014年8月20日 JGA Sample 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? Sample ≒ 個人 ? 表現型情報 (gender, age etc) や匿名化された donor ID
  • 10. 2014年8月20日 JGA Data 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? 個人に対応する (生) データファイル (fastq, bam, アレイデータ) を格納
  • 11. 2014年8月20日 JGA Analysis 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? 複数の Data もしくは Sample を解析したデータを格納 例: 変異データ (vcf) や表現型情報をまとめた表
  • 12. 2014年8月20日 JGA Dataset 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? Policy が適用される Data と Analysis をまとめる (データ提供の単位) ? データ提供開始後、含まれているデータの種類を示すために一般に公開される
  • 13. 2014年8月20日 JGA Policy 新学術「ゲノム支援」拡大班会議 神戸 Data set JGAD Policy JGAP Data set 1 Policy 1 Study Data 1 Analysis 1 Experiment 1 Sample 1 Submission JGA Study JGAS Experiment JGAX Sample JGAN Data JGAR Analysis JGAZ Data 2 Experiment 2 Sample 2 Analysis 2 ? Dataset に適用される利用制限事項 独自の利用制限事項 (例: 特定の研究のみ) を NBDC ガイドラインに追加したい場合に作成
  • 14. 2014年8月20日 JGA データ構成の例 新学術「ゲノム支援」拡大班会議 神戸
  • 15. 2014年8月20日 新学術「ゲノム支援」拡大班会議 神戸 JGA データ 例1: シンプルなケース ? Experiment – Sample – Data セットが「個人」に対応 ? Data: 生データ、Analysis: 解析したデータ NBDC ガイドラインのみが 適用される場合、作成する必要はない
  • 16. 2014年8月20日 新学術「ゲノム支援」拡大班会議 神戸 JGA データ 例2: NGS とアレイデータ
  • 17. 2014年8月20日 NBDC ガイドライン 新学術「ゲノム支援」拡大班会議 神戸 JGA データ 例3: 異なる利用制限事項 ? 患者由来の個人データに対して、特定の研究目的に利用を制限する場合 NBDC ガイドライン + 独自の利用制限事項 特定の研究目的に利用を制限 健常者 患者
  • 18. 2014年8月20日 JGA へのデータ登録 新学術「ゲノム支援」拡大班会議 神戸
  • 19. 2014年8月20日 JGA へのデータ登録 新学術「ゲノム支援」拡大班会議 神戸 ? NBDC にデータ提供を申請 ? 承認されるとアップロードアカウントが発行される ? メタデータは登録用エクセルに記入、JGA で XML を作成(メールでのやり取り) http://trace.ddbj.nig.ac.jp/jga/submission.html
  • 20. 2014年8月20日 JGA へのデータアップロード 新学術「ゲノム支援」拡大班会議 神戸 メタデータ XML と データファイルを選択 JGA 登録を選択 アップロードアカウント にログイン Encrypt & Upload で 暗号化 & アップロード ? JGA 専用ツールでログイン ? メタデータ XML とデータファイルを暗号化し SSH でサーバにアップロード ? メタデータの整合性、データファイルの存在と md5 値がチェックされる データファイル メタデータ XML
  • 21. 2014年8月20日 JGA アクセッション番号 新学術「ゲノム支援」拡大班会議 神戸 プレフィックス メタデータオブジェクト 数字の桁数 例 JGA Submission 11 JGA00000000001 JGAS Study 11 JGAS00000000001 JGAN Sample 11 JGAN00000000001 JGAX Experiment 11 JGAX00000000001 JGAR Data 11 JGAR00000000001 JGAZ Analysis 11 JGAZ00000000001 JGAD Data set 11 JGAD00000000001 JGAP Policy 11 JGAP00000000001 ? JGA メタデータオブジェクトに対してアクセッション番号を発行
  • 22. 2014年8月20日 JGA データの利用 新学術「ゲノム支援」拡大班会議 神戸
  • 23. 2014年8月20日 利用可能な JGA データ一覧 新学術「ゲノム支援」拡大班会議 神戸 http://humandbs.biosciencedbc.jp/data-use/all-researches-jp https://ddbj.nig.ac.jp/jga/viewer/view/studies
  • 24. 2014年8月20日 JGA データの利用 新学術「ゲノム支援」拡大班会議 神戸 ? NBDC にデータ利用を申請 ? 承認されると有効期限付きのダウンロードアカウントが発行される http://trace.ddbj.nig.ac.jp/jga/submission.html
  • 25. 2014年8月20日 JGA データのダウンロード 新学術「ゲノム支援」拡大班会議 神戸 ローカルの保存場所を選択 JGA データセットを選択 ダウンロードアカウント にログイン Download をクリックし、 ダウンロード & 復号化 ? JGA 専用ツールでログイン ? ダウンロード権限が付与されている Data set をリストから選択 ? ダウンロードされ、復号化される ? メタデータはウェブサイトにログインして閲覧 https://ddbj.nig.ac.jp/jga/viewer/view/studies
  • 26. 2014年8月20日 JGA ウェブサイト 新学術「ゲノム支援」拡大班会議 神戸 http://trace.ddbj.nig.ac.jp/contact.html?db=jga http://trace.ddbj.nig.ac.jp/jga/submission.html ? マニュアルを整備中 ? 問い合わせページ