狠狠撸

狠狠撸Share a Scribd company logo
Area attention
@UMU____
20181028
arXiv:1810.10126
Significance
? Attentionのfocusを「single-item方式」から「隣
接しているmulti-itemを一括で参照する方式に
変えることで,SOTAを達成
Background: Attention
? 辞書のようなNNを構成し,クエリで(辞書を)引く
? ?
(クエリ側)
? ?
(辞書側) (??, ??)
?
??(?)
??,?(?)
??:?と??の類似度のようなもの
総和が1(Attention)
Attenttion出力
イメージ:ki=qであればviが出てくる辞書を微分可能にした
Background: Attention
? ???? ?, ? について
[Luong et al., 2015]
???? ?, ? = ? ? ?
[Bahdanau et al., 2014]
???? ?, ? = ?1 ? + ?2 ? + ? ?, ? ?????????
Background: Problem of Attention
? 普通のAttentionの問題点:single item focus
? 複数のitemにattentionできないので表現力が制限
? ?
(クエリ側)
? ?
(辞書側) (??, ??)
?
??(?)
??,?(?)
クエリがq一つ:single item focus
Background: Problem of Attention
? 普通のAttentionの問題点:single item focus
→multi item focusにする
[Vaswani et al., 2017] Multi head attention
? ?
(クエリ側)
? ?
(辞書側) (??, ??)
?
??(?)
??,?(?)
? ?
(クエリ側)
? ?
(辞書側) (??, ??)
?
??(?)
??,?(?)
? ?
(クエリ側)
? ?
(辞書側) (??, ??)
?
??(?)
??,?(?)
Background: Problem of Attention
? 普通のAttentionの問題点:single item focus
→multi item focusにする
[Pedersoli et al., 2016] areas of attention
画像の部分的な箇所をfocusするattention
Method (本論文)
Multi item focusを導入
? Single item focus: 要素ひとつひとつが辞書の要素
? Multi item focus: 要素ひとつひとつ+2つづつ+3つづつ…
? ?
(辞書側)
h1 h2 h3 hN…
? ?
(辞書側)
h1 h2 h3 hN…
h1と
h2
h2と
h3
h1と
h2と
h3
…
…
? Nつづつ?実際には
キーの計算:
バリューの計算:
?または,
キーとして,平均だけでなく分散やArea面積を
入れたものを用いることもできる.
Method 詳細
単に該当するitemのキーと
バリューを平均するだけ
Experiments: Neural Machine
Translation(vs Transformer)
BLEU (character level)
BLEU (token level)
Experiments: Neural Machine
Translation(vs LSTM)
Negative Log likelihood (character level)
Experiments: Image captioning
Test acculary

More Related Content

More from KCS Keio Computer Society (20)

文章生成の未解决问题
文章生成の未解决问题文章生成の未解决问题
文章生成の未解决问题
KCS Keio Computer Society
?
Word2vec alpha
Word2vec alphaWord2vec alpha
Word2vec alpha
KCS Keio Computer Society
?
テンソル代数
テンソル代数テンソル代数
テンソル代数
KCS Keio Computer Society
?
Hindsight experience replay
Hindsight experience replayHindsight experience replay
Hindsight experience replay
KCS Keio Computer Society
?
Kml 輪読514
Kml 輪読514Kml 輪読514
Kml 輪読514
KCS Keio Computer Society
?
ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読ゼロから作るDeepLearning 5章 輪読
ゼロから作るDeepLearning 5章 輪読
KCS Keio Computer Society
?
贰尝叠翱型痴础贰のダメなところ
贰尝叠翱型痴础贰のダメなところ贰尝叠翱型痴础贰のダメなところ
贰尝叠翱型痴础贰のダメなところ
KCS Keio Computer Society
?
ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読ゼロから作るDeepLearning 2~3章 輪読
ゼロから作るDeepLearning 2~3章 輪読
KCS Keio Computer Society
?
ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読ゼロから作るDeepLearning 4章 輪読
ゼロから作るDeepLearning 4章 輪読
KCS Keio Computer Society
?
Soft Actor Critic 解説
Soft Actor Critic 解説Soft Actor Critic 解説
Soft Actor Critic 解説
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
KCS Keio Computer Society
?
Graph Convolutional Network 概説
Graph Convolutional Network 概説Graph Convolutional Network 概説
Graph Convolutional Network 概説
KCS Keio Computer Society
?
础滨を作ることと理解すること
础滨を作ることと理解すること础滨を作ることと理解すること
础滨を作ることと理解すること
KCS Keio Computer Society
?
Random forest の解説
Random forest の解説Random forest の解説
Random forest の解説
KCS Keio Computer Society
?
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
KCS Keio Computer Society
?
ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明
KCS Keio Computer Society
?
础滨班ハードウェア领域
础滨班ハードウェア领域础滨班ハードウェア领域
础滨班ハードウェア领域
KCS Keio Computer Society
?
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
KCS Keio Computer Society
?
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
KCS Keio Computer Society
?
ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読ゼロから作るDeepLearning 3.3~3.6章 輪読
ゼロから作るDeepLearning 3.3~3.6章 輪読
KCS Keio Computer Society
?
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
[論文略説]Stochastic Thermodynamics Interpretation of Information Geometry
KCS Keio Computer Society
?
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
Outrageously Large Neural Networks:The Sparsely-Gated Mixture-of-Experts Laye...
KCS Keio Computer Society
?
ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明ハミルトニアンモンテカルロ法についての説明
ハミルトニアンモンテカルロ法についての説明
KCS Keio Computer Society
?
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
Phonetic Posteriorgrams for Many-to-One Voice Conversion without Parallel Dat...
KCS Keio Computer Society
?
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
U-Net: Convolutional Networks for Biomedical Image Segmentationの紹介
KCS Keio Computer Society
?

機械学習ゼミ: Area attenttion