狠狠撸

狠狠撸Share a Scribd company logo
鈴木 脩司
Twitter: @shu65
皆で集まってGTEx論文を一気に輪読する会
2018/01/24
1
概要
GWASの問題点
? 1つのSNP、または複数のSNPの組み合わせと形質との
association testでは検定を実行する回数が多いため、多重検定
補正によって限定的な関係しか見つけられていない
? 1つのSNPでは5-10 millionの検定が実行される
解決手段
? SNPから遺伝子の発現量を予測し、予測した発現量(imputed
gene expression)と形質とのassociation testを実行する
PrediXcanという手法を開発
? 最大20,000 million 回の検定まで減らせる
2
PrediXcan
? Reference
Transcriptomeをもと
に以下のような学習
器を作る
? 入力:予測したい遺
伝子周辺のSNPs
? 出力:発現量
? この学習器を使って
予測した発現量と
形質とのassociation
testを実行する
3
PrediXcanの特徴
? 1つのSNPと形質とのassociation testと比較して、検定回数が
減らせる
? 5-10分の1程度まで減らせる
? 機能単位によるグループ化はSNP単位で解析するよりも直感
的
? SNPから発現量を予測するため、発現量のデータを取得する
必要がない
? SNPと形質との関係情報が登録されている既存の大規模なデー
タセット(dbGaPなど)を使って研究ができる
? などなど???
4
技術や知見の新しい点
? SNPからある程度発現量を予測できることを示した
? 予測した発現量よって病気と、その病気と関係のある既
知の遺伝子との関係をちゃんと検出できることを示した
5
SNPから発現量の予測モデルの構築
6
DGN whole-
blood cohort
から取得
学習モデルには
elastic net(一般化
線形モデルの回帰
に正則化項を加味
するモデル)を利用
うまく予測できた遺伝子の例
7
WTCCCのデータを利用して既存の遺伝
子との関係を見つけられるか確認
8
どう使えるか
? SNPと形質とのassociation testで見つけられなかった関
係が、遺伝子と形質とのassociation testで見つけられる
? 発現量データを取得しなくても、SNPから発現量データを
予測することができる
9

More Related Content

A gene-based association method for mapping traits using reference transcriptome data@皆で集まってGTEx論文を一気に輪読する会