狠狠撸

狠狠撸Share a Scribd company logo
2019年度
第5回バイオインフォマティクス実習
先端医科学研究センター バイオインフォマティクス解析室
中林潤
カバー率 = (N × L) / G : 1塩基当りの断片数
リード数 : N
リード数 : L
ゲノム長 : G
…AGGTGCATGCCGCATCGATCGAGC…
AGGTGCATG
GCATGCCGCAT
GCATCGATCGAGC
paired end
single end
ゲノム
リード
Next Generation Sequencer (NGS)
DNAを断片化して配列を読む→参照ゲノムにマッピング→配列を再構成する
カバー率が十分でないと正確な配列情報が得られない。
? Exon : 1~2% of the genome
? SureSelectXT Human All Exon Kit V6 (Agilent)
Whole-Exome Sequencing (WES) 解析
Agilent ?
https://www.pathologyoutlines.com/topic/lungtumormicropapillary.html
papillary tufts without fibrovascular core
Micropapillary Predominant Adenocarcinoma (MPA)
Tumor
Normal
Tissue
Micropapillary type
Non-
micropapillary type
laser microdissection
82y female non-smoker
frozen specimen
total DNA
(ng)
normal 153.7
non-micropapillary 10.3
micropapillary 195.7
Whole
Exome
Sequencing
10ng
Sample preparation
Total Reads
(100bp paired end)
Overall Mapping Rate Coverage
Normal 58,037,525 98.13% 193×
Non- Micropapillary 62,830,751 97.69% 207×
Micropapillary 64,318,300 97.47% 210×
Coverage = mapped read counts × 2 × 100 / (3,000,000,000 × 0.02)
Mapping
? VarScan2
VarScan 2: Somatic mutation and copy number alteration
discovery in cancer by exome sequencing.
Koboldt, D., et al. Genome Res. 2012 22:568-576
http://varscan.sourceforge.net/
Estimation of the Somatic Mutations
A strategy for estimation of the somatic mutations
VarScan 2: Somatic mutation and copy number alteration discovery in cancer by exome
sequencing.
Koboldt, D., et al.Genome Res. 2012 22:568-576
Normal vs Non-micropapillary
Normal vs MPA
Whole-Exome Sequencing (WES) 解析
ATGC
EGFR deletion
正常組織
非微小乳頭がん
微小乳頭がん
pileup format
ARID1A snp
正常組織
非微小乳頭がん
微小乳頭がん
HHEX snp
Pileup format
正常組織
非微小乳頭がん
微小乳頭がん
微小乳頭がん特異的体細胞変異
Variant Call Format (VCF)
#CHROM POS ID REF ALT QUAL FILTER
chr1 14930 2 A G 0.042602 PASS
chr1 1455924 3 T C 0.067266 PASS
chr1 2059684 4 G A 0.05858 PASS
chr1 6554475 5 G A 0.035576 PASS
chr1 10413139 6 C T 0.055485 PASS
chr1 11668837 7 G A 0.024802 PASS
chr1 16058680 8 G A 0.067123 PASS
chr1 16563946 9 C T 0.04199 PASS
Variant Effect Predictor
https://asia.ensemble.org/Tools/VEP
Variant Effect Predictor
? TEST.vcfファイルをデスクトップにドラッグアンドドロップしてコピー
? Variant Effect Predictorのファイルを選択ボタンでTEST.vcfを選択し,
VEPにアップロード
? Runボタンをクリック
COSMIC
https://cancer.sanger.ac.uk/cosmic
アンケートにご協力ください
第5回分アンケートのQRコード
最終アンケートのQRコード
バイオインフォマティクス解析室HP
https://www.yokohamacu.ac.jp/amedrc/section/support/bioinfomatics2.html

More Related Content

What's hot (15)

PDF
尘颈搁狈础データ解析入门冲第23回勉强会资料
Amelieff
?
PDF
フリーソフトて?はし?める狈骋厂融合遗伝子解析入门
Amelieff
?
PDF
狈骋厂现场の会第2回冲アメリエフ株式会社冲搁狈础蝉别辩解析
Amelieff
?
PDF
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
Amelieff
?
PDF
フナコシニュース2017年2月1日号
fu7koshi
?
PDF
贰虫辞尘别解析入门
Amelieff
?
PPTX
緑色蛍光蛋白质骋贵笔を用いた骋笔颁搁様制御系蛋白质の局在解析
裕士郎 鈴木
?
PDF
コスモバイオニュース No.164 (2020年5月)
removed_76de688259b1d349764e5216b72529b3
?
PDF
遗伝子のアノテーション付加
弘毅 露崎
?
PDF
颁叠滨学会2013チュートリアル 狈骋厂データ解析入门(実験条件编) 配布资料
Genaris Omics, Inc.
?
PDF
コスモバイオニュース No.167 (2020年10月)
removed_76de688259b1d349764e5216b72529b3
?
PDF
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
pinmarch_t Tada
?
PDF
Alternatives to antibiotics -a pipeline portfolio review
Lilli-Line
?
PDF
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
弘毅 露崎
?
PDF
狈骋厂现场の会第2回冲アメリエフ株式会社冲がん贰虫辞尘别解析
Amelieff
?
尘颈搁狈础データ解析入门冲第23回勉强会资料
Amelieff
?
フリーソフトて?はし?める狈骋厂融合遗伝子解析入门
Amelieff
?
狈骋厂现场の会第2回冲アメリエフ株式会社冲搁狈础蝉别辩解析
Amelieff
?
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
Amelieff
?
フナコシニュース2017年2月1日号
fu7koshi
?
贰虫辞尘别解析入门
Amelieff
?
緑色蛍光蛋白质骋贵笔を用いた骋笔颁搁様制御系蛋白质の局在解析
裕士郎 鈴木
?
コスモバイオニュース No.164 (2020年5月)
removed_76de688259b1d349764e5216b72529b3
?
遗伝子のアノテーション付加
弘毅 露崎
?
颁叠滨学会2013チュートリアル 狈骋厂データ解析入门(実験条件编) 配布资料
Genaris Omics, Inc.
?
コスモバイオニュース No.167 (2020年10月)
removed_76de688259b1d349764e5216b72529b3
?
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
pinmarch_t Tada
?
Alternatives to antibiotics -a pipeline portfolio review
Lilli-Line
?
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
弘毅 露崎
?
狈骋厂现场の会第2回冲アメリエフ株式会社冲がん贰虫辞尘别解析
Amelieff
?

More from Jun Nakabayashi (20)

PPTX
2019bioinformaticsstudyno3
Jun Nakabayashi
?
PPTX
2014年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2014年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2014年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2014年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2014年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2015年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2015年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2016年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2016年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2016年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2016年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2016年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2017年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2017年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2017年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2017年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2017年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2018年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
PPTX
2018年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
2019bioinformaticsstudyno3
Jun Nakabayashi
?
2014年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
2014年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
2014年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
2014年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
2014年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
2015年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
2015年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
2016年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
2016年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
2016年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
2016年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
2016年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
2017年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
2017年度 第4回バイオインフォマティクス実习
Jun Nakabayashi
?
2017年度 第3回バイオインフォマティクス実习
Jun Nakabayashi
?
2017年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
2017年度 第1回バイオインフォマティクス実习
Jun Nakabayashi
?
2018年度 第5回バイオインフォマティクス実习
Jun Nakabayashi
?
2018年度 第2回バイオインフォマティクス実习
Jun Nakabayashi
?
Ad

2019第5回バイオインフォマティクス実习

Editor's Notes

  • #3: 次世代シーケンサーでは従来のシーケンサーと异なり、顿狈础を断片化して配列を読むのが特徴である。この断片の配列を参照とするゲノム上に割り当てて、元の塩基配列を再构成する。この作业をマッピングと呼ぶ。このとき问题となるのがカバー率である。断片の量と多様性が不十分だとゲノム全体をカバーすることができない。
  • #4: エクソンはゲノム全体の1-2%を占めるだけの極一部の領域であるが、この領域に起こる変異はタンパク質を構成するアミノ酸に変異を起こす可能性があり、疾患に関与する遺伝子を探索する際に最も注目すべき領域と考えられる。そのため疾患関連遺伝子の探索において、全エクソンシーケンス(Whole Exome Sequencing WES)は全ゲノムシーケンス(Whole Genome Sequencing WGS)と比較して費用対効果の高い遺伝子解析手法と言える。SMON研究においても遺伝子解析の第一選択としてWESを考慮するのが良いと考えている。
  • #8: The somatic mutations are estimated using varscan2 released from Koboldt et al.
  • #9: This illustration indicates the estimation-strategy of varscan2. Single nucleotide variations are compared between normal and tumor cell. When probability of mutation in tumor cell is significantly higher than that in normal cell, it is estimated as the somatic mutation. The somatic mutations in non maicropapillary and micropapillary tumor are estimated by using varscan2.
  • #10: 配列の断片を参照ゲノムにマッピングしたものをIntegrative Genomics Viewer(IGV)で可視化した。積み上げられた灰色のバーが断片を示している。一番下のレーンがゲノムで、青い四角形がエクソン、線がイントロンを表す。エクソン領域が濃縮され配列が読まれていることが解る。ACGT各塩基は色分けされてしましてある。リファレンスの塩基は灰色で、突然範囲は色で表示している。EGFR遺伝子領域を示している。画面中央に見える緑色のラインはG→Aの変異を示していて、正常組織、がん組織の両方で見られる変異である。このような変異はgermline変異と考えられる。
  • #14: ensemblが提供しているweb toolのvariant effect predictorを使って、検出されたSNPのアノテーション情報を取得することができる。SNPのゲノム上の位置情報を記したVCFフォーマットの情報をアップロードすると、アノテーション情報を取得することが出来る。