狠狠撸

研究紹介 (学生向け)
鈴木譲
2017年4月7日

ロードマップ
1. 系列に確率を割当てる
2. 独立性
3. グラフィカルモデル
4. グラフィカルモデルのデータからの学習
5. 計算量の低減
6. モデル選択としての解析
7. 連続変数を含む場合の概要
8. 応用:独立性検定、ゲノム解析
9. 近況 (Rパッケージ、英単行本出版)
10. まとめ

若い顷に提案した推定量

は過学習、は確率1で正しい結論

ベイジアンネットワーク

マルコフネットワーク
確率分布との関係は、初回(4/10(月))の講義で説明します。

ベイジアンネットワークも、マルコフネットワークも
変数間の条件付き独立性を表現

データフレーム
それぞれに事前確率をかけたものを比較する 3変数ではなく、p変数に拡張可能

森: ループをもたない無向グラフ
ベイジアンネットワークにもなる

森への近似の場合
最大化

データフレームから出発

モデル選択の誤り率
生じやすい
生じにくい
ｎとともに指数的に0

pに対して指数的な計算量
深さ優先探索: 分枝限定法で不要な計算量を削減
Alarm
(p=37)
Insurance
(p=26)

連続量を含む相互情報量の推定
提案の手順
1. X軸、Y軸とも、順序によって、サンプルが等しい個数になるように、メッシュに区切る
2. 色々な幅のメッシュで区切り、その量子化(離散化)されたデータから相互情報量を推定する
3. 得られた相互情报量の中の最大値を、相互情报量の推定値とする。

独立性検定への応用
Arthur Gretton教授

応用: ゲノム解析
1000遺伝子の発現量と
case/controlの変量
(1001ノード)
p値の小さい変数は、
森でもハブになっている。

青: 遺伝子発現量
赤: SNP
Int. J. Approximate
Reasoning に掲載(2016)

Rパッケージ BNSL
(Bayesian Network Structure Learning)
2017年3月5日公開
提案アルゴリズムの他、
ベイジアンネットワーク
の自動生成など
鈴木譲 (阪大)
川原純(NAIST)

Foundations of Probabilistic Graphical Models (Springer)
「既存のテキストの
問題点を改善する」
ということで、
Springerと契約した
1. Introduction;
2. Graphical Models;
3. Probabilistic Graphical Models;
4. Learning Bayesian Networks;
5. Learning Markov Networks;
6. Model selection with Information Criteria;
7.Probabilistic Inference with Graphical

まとめ
グラフィカルモデルの構造学習というくくりで、研究内容を紹介した
? 連続変量を含む場合のベイジアンネットワークの構造学習
? ゲノム解析で、マイクロアレイではなく、RNAシーケンスの場合
? サンプル数nを固定した場合に、pに対して多項式になるか
? マルコフネットワークの構造学習
今後の課題

狠狠撸

研究绍介(学生向け)

Recommended

More Related Content

What's hot (20)

More from Joe Suzuki (20)

研究绍介(学生向け)