狠狠撸

狠狠撸Share a Scribd company logo
離散と連続の入り混じった相互情報量を推定して、
SNP と遺伝子発現量の因果関係をさぐる
Joe Suzuki
(prof-joe)
応用数理学会 2016年度 年会
2016年9月14日
鈴木譲 (大阪大学)
研究の目的と貢献
2015年8月13日-17日
International Journal of Approximate Reasoning
Joe Suzuki
A novel Chow–Liu algorithm and its application to gene
differential analysis
Pages 1-18 (Volume 80)
(2016年7月27日に採択が決定)
? 離散でも連続でも適用できる相互情報量の推定方法を提案
? メリットといえる性能を数学的に証明する
? 遺伝子発現量、SNPの間の因果関係を見出す
ロードマップ
1. 相互情報量の推定(離散)
2. 既存研究の紹介
3. 相互情報量の推定(連続、一般)
4. 因果を表現する森を生成する
5. 遺伝子発現量の森の生成
6. 遺伝子発現量とSNPの森の生成
6. まとめ
Chow-Liuアルゴリズム
ループができない限り、相互情報量が大きい順に辺を結んでいく
分布既知 真の分布とのK-L情報量最小の近似
分布未知 サンプルから、尤度最大の木を生成
変数が独立なのに辺を結んでよいの? (Suzuki ‘93)
X,Yが独立でも、
正の値をとってしまう
これが正解
(木ではなく森)
独立性が検出
できていない
離散と連続の入り混じった相互情報量を推定して、SNP と遺伝子発現量の因果関係をさぐる
離散の相互情報量の推定 (Suzuki 93)
MDL原理に基づく
MDL(minimum description length)
適合性 + 簡潔性 → 最適
(-1) x 尤度 + ペナルティ項 → 最小
ニュートン
運動の3法則
マクセル
方程式
記述長が最小のモデルを選ぶ
情報量基準
最尤法は、大きくなりがち(过学习)
離散と連続の入り混じった相互情報量を推定して、SNP と遺伝子発現量の因果関係をさぐる
最尤法
MDL (Suzuki, 93)
bnlearn パッケージAsiaで、 Chow-Liu アルゴリズム
既存研究: X,Yが連続のとき正規分布を仮定 (Edwards, 2010)
遺伝子発現量、およびその対数は、正規分布にはしたがわない
既存研究: Xが連続、Yが離散のとき
混合正規分布を仮定 (Edwards, 2010)
非対称性ゆえ、一般の森を生成できない
相互情報量を推定できても、
確率モデルに矛盾
離散 正規 離散正規
離散 正規 離散
離散 正規 離散
衝突
離散 正規 離散
離散 正規 離散
離散 正規 離散
は、以下のいずれか
記述長や尤度の計算は、
条件付き独立性を仮定して、一方向
根
根から葉に向かって合計していく (根の選び方によらない)
既存研究の問題点:離散と離散の間に正規変数を含まない森の構築
離散変数
正規変数
(Edwards, 2010)
SNP
(一塩基多型)
遺伝子の発現量
提案方式: 離散や連続を仮定しない
XY平面をメッシュで区切り、離散の相互情報量を計算し、その最大値をとる
(データのパーセンタイル)
n=1000, 8x8のメッシュの場合
Xの頻度
Yの頻度
(X, Y) の同时频度
連続でも、離散でもよい
u,v=1,2,…,sについて、
クラスタ内のサンプルを前半と後半にわけていく
(分ける前後で値が同じ場合、そこの分割は避ける)
数学的に証明できたこと
? 最適なメッシュの上限が、サンプル数nに対して
? 独立であることと、相互情報量の推定値が0であることが、同値
実験から、正しいと予想されること
大きなnで、相互情報量の推定値が真の値に収束する
メッシュへの近似と、ビンの中のサンプル数とのバランス
(MDL原理)
実験1: 乳がん患者の遺伝子発現量
? p53 遺伝子突然変異をもつ(58サンプル)、もたない(192サンプル)
? 1000個の遺伝子の 発現量
遺伝子どうしの関係をみないで、B補正や、FDRを適用するだけでよいのか
ほとんどの遗伝子で、発现量の正规性が弃却
case/controlノードは、1遺伝子としか結合しない
108 (CDC20),209 (GPR19),213 (CENPA),554 (C10orf3) ,
739 (CDCA5)がcase/controlから距離3以内
1000遺伝子の発現量と
case/controlの変量
(1001ノード)
p値の小さい変数は、
森でもハブになっている。
実験2: 遺伝子発現200, SNP 200の400変数
? Utah州の住民で、北西欧州に起源をもつ90名のSNP (HapMap)
? R library (BioConductor) GGData
ftp://ftp.sanger.ac.uk/pub/genevar/CEU_parents_norm_march2007.zip
離散変数
正規変数
(Edwards, 2010)
SNP
(一塩基多型)
遺伝子の発現量3値
青: 遺伝子発現量
赤: SNP
遺伝子発現とSNPが
分離されていない
まとめ
? 相互情報量の推定 (離散と連続を区別しない)
? Chow-Liuアルゴリズムへの適用
? 変異解析 (実験1)
? SNPと遺伝子発現量が混在したグラフィカルモデルの定式化
今後の課題
? eQTLの既存の方法との比較
? 医学的な解釈を参照して、極めて行く
謝辞
鈴木貴教授 (大阪大学基礎工学部)
岡田髄象教授 (大阪大学医学部)
井元清哉教授 (東京大学医科学研究所)
植野真臣教授 (電気通信大学)
Prof. Cassio P. de Campos(Queen's University Belfast, United Kingdom)
Bing Zhang, Ph.D. and Qi Liu, Ph.D. (Vanderbilt University)
文科省 研究拠点形成事業A (代表: 鈴木貴)

More Related Content

What's hot (20)

PDF
データ解析10 因子分析の基礎
Hirotaka Hachiya
?
PDF
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
Deep Learning JP
?
PDF
4 データ間の距離と類似度
Seiichi Uchida
?
PDF
机械学习の未解决课题
Hiroyuki Masuda
?
PDF
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
?
PPTX
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP
?
PDF
渐近理论をスライド1枚で(フォローアッププログラムクラス讲义07132016)
Hideo Hirose
?
PDF
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
?
PDF
統計的因果推論への招待 -因果構造探索を中心に-
Shiga University, RIKEN
?
PPTX
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
?
PPTX
データサイエンス概論第一=2-1 データ間の距離と類似度
Seiichi Uchida
?
PDF
贰尝叠翱型痴础贰のダメなところ
KCS Keio Computer Society
?
PPTX
5分で分かる自己组织化マップ
Daisuke Takai
?
PDF
Transformer メタサーベイ
cvpaper. challenge
?
PDF
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
PDF
MIRU2016 チュートリアル
Shunsuke Ono
?
PDF
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
?
PPTX
搁によるベイジアンネットワーク入门
Okamoto Laboratory, The University of Electro-Communications
?
PDF
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
ddnpaa
?
PDF
13 分類とパターン認識
Seiichi Uchida
?
データ解析10 因子分析の基礎
Hirotaka Hachiya
?
[DL輪読会]Wasserstein GAN/Towards Principled Methods for Training Generative Adv...
Deep Learning JP
?
4 データ間の距離と類似度
Seiichi Uchida
?
机械学习の未解决课题
Hiroyuki Masuda
?
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
?
[DL輪読会]Flow-based Deep Generative Models
Deep Learning JP
?
渐近理论をスライド1枚で(フォローアッププログラムクラス讲义07132016)
Hideo Hirose
?
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
?
統計的因果推論への招待 -因果構造探索を中心に-
Shiga University, RIKEN
?
【DL輪読会】SimCSE: Simple Contrastive Learning of Sentence Embeddings (EMNLP 2021)
Deep Learning JP
?
データサイエンス概論第一=2-1 データ間の距離と類似度
Seiichi Uchida
?
贰尝叠翱型痴础贰のダメなところ
KCS Keio Computer Society
?
5分で分かる自己组织化マップ
Daisuke Takai
?
Transformer メタサーベイ
cvpaper. challenge
?
変分推论法(変分ベイズ法)(笔搁惭尝第10章)
Takao Yamanaka
?
MIRU2016 チュートリアル
Shunsuke Ono
?
最近のDeep Learning (NLP) 界隈におけるAttention事情
Yuta Kikuchi
?
搁によるベイジアンネットワーク入门
Okamoto Laboratory, The University of Electro-Communications
?
【論文紹介】 Spatial Temporal Graph Convolutional Networks for Skeleton-Based Acti...
ddnpaa
?
13 分類とパターン認識
Seiichi Uchida
?

Viewers also liked (12)

PDF
闯别蹿蹿谤别测蝉の事前确率と叠顿别耻の一致性に関する比较
Joe Suzuki
?
PPTX
Jeffreys' and BDeu Priors for Model Selection
Joe Suzuki
?
PDF
ガイダンス
Joe Suzuki
?
PDF
2014 9-26
Joe Suzuki
?
PDF
2014 12-9
Joe Suzuki
?
PDF
相互情报量を用いた独立性の検定
Joe Suzuki
?
PDF
基本概念
Joe Suzuki
?
PPTX
MaCaulay2 Miuraパッケージの開発と今後
Joe Suzuki
?
PDF
OMNI-Prop: Seamless Node Classification on Arbitrary Label Correlation
Yuto Yamaguchi
?
PDF
Online User Location Inference Exploiting Spatiotemporal Correlations in Soci...
Yuto Yamaguchi
?
PDF
Minimax optimal alternating minimization \\ for kernel nonparametric tensor l...
Taiji Suzuki
?
PDF
関西狈滨笔厂+読み会発表スライド
Yuchi Matsuoka
?
闯别蹿蹿谤别测蝉の事前确率と叠顿别耻の一致性に関する比较
Joe Suzuki
?
Jeffreys' and BDeu Priors for Model Selection
Joe Suzuki
?
ガイダンス
Joe Suzuki
?
2014 9-26
Joe Suzuki
?
2014 12-9
Joe Suzuki
?
相互情报量を用いた独立性の検定
Joe Suzuki
?
基本概念
Joe Suzuki
?
MaCaulay2 Miuraパッケージの開発と今後
Joe Suzuki
?
OMNI-Prop: Seamless Node Classification on Arbitrary Label Correlation
Yuto Yamaguchi
?
Online User Location Inference Exploiting Spatiotemporal Correlations in Soci...
Yuto Yamaguchi
?
Minimax optimal alternating minimization \\ for kernel nonparametric tensor l...
Taiji Suzuki
?
関西狈滨笔厂+読み会発表スライド
Yuchi Matsuoka
?
Ad

More from Joe Suzuki (20)

PPTX
搁と笔测迟丑辞苍を比较する
Joe Suzuki
?
PPTX
搁集会蔼统数研
Joe Suzuki
?
PPTX
E-learning Development of Statistics and in Duex: Practical Approaches and Th...
Joe Suzuki
?
PPTX
分枝限定法でモデル选択の计算量を低减する
Joe Suzuki
?
PPTX
连続変量を含む条件付相互情报量の推定
Joe Suzuki
?
PPTX
E-learning Design and Development for Data Science in Osaka University
Joe Suzuki
?
PPTX
UAI 2017
Joe Suzuki
?
PPTX
AMBN2017 サテライトワークショップ
Joe Suzuki
?
PPTX
CRAN Rパッケージ BNSLの概要
Joe Suzuki
?
PPTX
Forest Learning from Data
Joe Suzuki
?
PPTX
A Bayesian Approach to Data Compression
Joe Suzuki
?
PDF
A Conjecture on Strongly Consistent Learning
Joe Suzuki
?
PDF
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
Joe Suzuki
?
PDF
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
Joe Suzuki
?
PPTX
研究绍介(学生向け)
Joe Suzuki
?
PDF
Bayesian Criteria based on Universal Measures
Joe Suzuki
?
PDF
MDL/Bayesian Criteria based on Universal Coding/Measure
Joe Suzuki
?
PDF
The Universal Measure for General Sources and its Application to MDL/Bayesian...
Joe Suzuki
?
PDF
Universal Prediction without assuming either Discrete or Continuous
Joe Suzuki
?
PDF
Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Joe Suzuki
?
搁と笔测迟丑辞苍を比较する
Joe Suzuki
?
搁集会蔼统数研
Joe Suzuki
?
E-learning Development of Statistics and in Duex: Practical Approaches and Th...
Joe Suzuki
?
分枝限定法でモデル选択の计算量を低减する
Joe Suzuki
?
连続変量を含む条件付相互情报量の推定
Joe Suzuki
?
E-learning Design and Development for Data Science in Osaka University
Joe Suzuki
?
UAI 2017
Joe Suzuki
?
AMBN2017 サテライトワークショップ
Joe Suzuki
?
CRAN Rパッケージ BNSLの概要
Joe Suzuki
?
Forest Learning from Data
Joe Suzuki
?
A Bayesian Approach to Data Compression
Joe Suzuki
?
A Conjecture on Strongly Consistent Learning
Joe Suzuki
?
A Generalization of the Chow-Liu Algorithm and its Applications to Artificial...
Joe Suzuki
?
A Generalization of Nonparametric Estimation and On-Line Prediction for Stati...
Joe Suzuki
?
研究绍介(学生向け)
Joe Suzuki
?
Bayesian Criteria based on Universal Measures
Joe Suzuki
?
MDL/Bayesian Criteria based on Universal Coding/Measure
Joe Suzuki
?
The Universal Measure for General Sources and its Application to MDL/Bayesian...
Joe Suzuki
?
Universal Prediction without assuming either Discrete or Continuous
Joe Suzuki
?
Bayesian network structure estimation based on the Bayesian/MDL criteria when...
Joe Suzuki
?
Ad

離散と連続の入り混じった相互情報量を推定して、 SNP と遺伝子発現量の因果関係をさぐる