狠狠撸
Submit Search
落合 Wba hackathon2_成果報告_最終版
?
Download as PPTX, PDF
?
1 like
?
521 views
K
koji ochiai
Follow
第2回全脳アーキテクチャ?ハッカソン「みんなで作る認知アーキテクチャ」最終発表 http://wba-initiative.org/1705/
Read less
Read more
1 of 56
Download now
Download to read offline
More Related Content
落合 Wba hackathon2_成果報告_最終版
1.
Attention Control 第2回WBA hackathon 落合、都築
2.
やったこと
3.
やったこと Free Energy Principleの ニューラルネットによる実装
4.
Free Energy Principle
?
5.
Free Energy Principle
by K.Friston
6.
Free Energy=精度 +
複雑度 = ?? ?(?|?)[log ? ? ? ? ] + ? ??[?(?|?)||? ? ? ]? ?, ? ? ? ? :Hidden or external states :Sensory states :Internal states(ex. zの平均、分散) 精度 複雑度
7.
Internal state ? =
arg min ?(?, ?) 予測誤差を最小化するよう 内部パラメータを学習 (通常の生成モデル学習) ?
8.
Internal state Action(Attention) ? =
arg min ?(?, ?) ? = arg min ?(?, ?) 予測誤差を最小化するよう 内部パラメータを学習 (通常の生成モデル学習) 予測誤差を最小化する行動 を生成 予測=注目 (Active Inference) ? ?
9.
実装
10.
Free Energy Principle
= Variational Autoencoder ? Variational Autoencoder(VAE)は変分ベイズをニューラルネッ トで表現したもの ? 変分ベイズではFree Energyを最小化している ? Free Energyを内部パラメータ調節で最小化するNetwork =Variational Autoencoder ? 今回の目標:Active InferenceをVAEに追加 ? Active Inference=Free Energyを最小化する動きを生成す ること
11.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic
12.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic 今回作成範囲
13.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic Variational Autoencoder
14.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic Action
15.
学习环境
16.
環境 エージェント MNIST画像を並べた 56x56ピクセルの空間 (トーラス状に回り込み) 着目領域 28x28ピクセル 着目領域内の画像 着目領域の 相対移動方向 ?? ? ? ? ?? FC ? ?′ dx
= -1 or 1, dy=-1 or 1 ピクセル単位の移動
17.
结果
18.
Step 0~100 予測画像 軌跡 スタート
19.
Step 4000~4100 予測画像 軌跡 スタート
20.
Step 4000~4100 予測画像 軌跡 スタート
21.
Step 8000~8100 予測画像 軌跡 スタート
22.
Step 8000~8100 予測画像 軌跡 スタート
23.
Step 12000~12100 予測画像 軌跡 スタート
24.
Step 16000~16100 予測画像 軌跡 スタート
25.
Step 20000~20100 予測画像 軌跡 スタート
26.
loss Epoch(1Epoch = 100Step)
27.
LSTMを追加:Step 16000~16100 予測画像 軌跡 スタート
28.
LSTMを追加:Step 16000~16100 予測画像 軌跡 スタート
29.
LSTMを追加:Step 16000~16100 予測画像 軌跡 スタート
30.
考察 ? 予測誤差を最小化するため一箇所で振動 ? 理由 ?
環境が固定、かつ行動の外乱なし ? 予測誤差は最小化ではなく一定の値になるよう行動を決 めるべき? ? 予測誤差が少なすぎる?退屈 ? 予測誤差が高すぎる?不安 ? 報酬、トップダウン信号が必要
31.
?すごい: Free Energy
Principleを大規模化可能な 形で実装 ?おもろい:制御への応用可能性(後述) ?脳っぽい:Free Energy Principleは脳の実験 データによる裏付けも出始めている
32.
Future Work
33.
?探索行動の継続を矯正 ?多層化 ?トップダウンでの行動生成
34.
?探索行動の継続を矯正 ?多層化 ?トップダウンでの行動生成
35.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic 作成予定範囲
36.
柔軟な行動生成 ?マップ上でのナビゲーション課題 ←こいつを探したい ある特定の画像を,マップ上で探し出す
37.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic 探索対象の画像を入力、ボトムアップ計算
38.
?? ? ? ? ?? FC ? ?? ? ? ? ?? FC ? ?′
?′ ?? ? ?? FC ?′ ?? ?? ? ?? FC ?′ ?? t=0 t=1 layer=0 layer=1 Active Inference Network ? ? ? FC ?? ?? ?′ Action Hidden state State(Bottom up) State(expect) Action Network Encoder Network Decoder Network Probabilistic 上位層のzを固定し、ボトムアップとトップダウン信号を流す
39.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor ゴム紐
40.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
41.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
42.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
43.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
44.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
45.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
46.
Active Inference Networkのイメージ layer0 layer1 layer2 layer3 In
Brain World sensor
47.
END
48.
以降付録
49.
キーワード ? Free Energy
Principle ? Predictive Coding ? Policy Gradient(action の強化学習で使用) ? Variational Autoencoder ? 変分ベイズ ? 変分下界 ? エントロピー
50.
環境、ライブラリ ? Python 2.7 ?
Chainer 1.15.0.1
51.
Variational Autoencoderの式 参考:http://qiita.com/skitaoka/items/64eab1d6c09a189d5841 log ?
? ? = log ?(?|?) ? ?(?, ?) ?(?|?) ?? = ? ? ? log ? ?(?, ?) ?(?|?) ?? + ? ??[?(?|?)||? ? ? ? ] ? ?(?|?) :真の潜在変数の事後分布 ?(?|?) :? ?(?|?)の近似分布(Neural Networkで表現) log ? ? ? :対数尤度。これを最大化する?を見つけ出したい 下界 = ?(?) 真の分布と近似誤差の差 ? ? = ? ? ? log ? ? ?, ? ? ? ? ?? = ? ?(?|?)[log ? ? ? ? ] ? ? ??[?(?|?)||? ? ? ] ???①
52.
Free Energyの式 = ??
?(?|?)[log ? ? ? ? ] + ? ??[?(?|?)||? ? ? ] ? ?, ? = ? ?(?|?)[? log ? ?(?, ?)] ? ?[?(?|?)] 参考:https://en.wikipedia.org/wiki/Free_energy_principle Energy Entropy ???② ? ? ? :Hidden or external states :Sensory states :Internal states ? ? ? ? World In Brain
53.
両者は同じもの ? ? =
? ?(?|?)[log ? ? ? ? ] ? ? ??[?(?|?)||? ? ? ] ①より ②より ?(?, ?) = ?? ?(?|?)[log ? ? ? ? + ? ??[?(?|?)||? ? ? ] ?? ? = ?? ? ? ? [log ? ? ? ? ] + ? ??[?(?|?)||? ? ? ] ?? ? = ?? ? ? ? [log ? ? ? ? ] + ? ??[?(?|?)||? ? ? ] 観測された値でInternal statesを代用 正規分布と仮定 ? Free Energy ?(?, ?)は最小化、変分下界?(?)は最大化。? ?, ? = ??(?)よりやっていることも同じ。 ? ?(?)の確率関数はニューラルネットによる近似
54.
Free Energy Principle
= Variational Autoencoder ? Variational Autoencoder(VAE)は変分ベイズをニューラルネットで表現 したもの( http://www.asahi-net.or.jp/~fb8t-ysok/docs/vae/ ) ? 変分ベイズではFree Energyを最小化している ( http://nktmemoja.github.io/jekyll/update/2016/08/20/variational- bayes.html ) ? Free Energyを内部パラメータ調節で最小化するNetwork =Variational Autoencoder ? 今回の目標:Active InferenceをVAEに追加 ? Active Inference=Free Energyを最小化する動きを生成すること
55.
1枚ものスライド
56.
Free Energy Principle
by Friston implement “Active Inference Network” ?ある状態を実現するための,行動を生成するネットワークの提案 Test ?マップ上でのナビゲーション課題 ←こいつを探したい ある特定の画像を,マップ上で探し出す
Download