端端舝

Sentence-State LSTM for Text
Representation
by Y.Zhang etc
童絞ㄩ @Quasi_quant2010
ACL2018掂心頗1
▽ACL2018掂心頗▼

掛�恅毛掂氏分�辻
- 升及�卞本件氾件旦毛矛弁玄伙桶政允木壬謎中井 -
? 本件氾件旦毛�g惤炵蹈午蕉尹化RNN
? 掛�恅匹及矛奈旦仿奶件(BiLSTM)
? 掛�恅匹及矛奈旦仿奶件(BiLSTM + Attention)
? 本件氾件旦井日擁垀ロ�毛CNN匹陂腕仄化﹜group by
? 掛�恅匹及矛奈旦仿奶件(CNN)
? 由仿弘仿白毛本件氾件旦炵蹈?本件氾件旦毛�g惤炵蹈午蕉尹化
蕆𦵴RNN
? Query Suggestion毛�慷允月蕣﹜交奈扒奈黱及本永扑亦件犯奈正
毛釬曰﹜蕆𦵴�婖毛⻌木凶encoder-decoder互衄靡
? 奻�眕俋卞﹜本件氾件旦囀及�S忳仃ロ�支��婖毛葆樓允
月仇午手蕉尹日木月
ACL2018掂心頗2

衙猁
- 由仿弘仿白源砃卞LSTM毛羥蚚 -
? 由仿弘仿白毛本件氾件旦炵蹈?本件氾件旦毛�g惤炵蹈午蕉尹化
本件氾件旦毛弘伕奈田伙杻釾講?�g惤毛伕奈市伙杻釾講午蕉尹
由仿弘仿白源砃卞LSTM毛羥蚚仄凶
? h(t,i) : i-th及�g惤及蕎木矛弁玄伙桶政 at t-th 本件氾件旦
? i = 1,＃,n t = 1,＃,T
? n : t-th及本件氾件旦卞漪引木月�g惤杅
? T : 由仿弘仿白互T�及本件氾件旦毛厥勾
? g(t) : 矛弁玄伙桶政 at t-th 本件氾件旦
? t楓醴午t+1楓醴及本件氾件旦及失仿奶丟件玄反蕉𩬅仄卅中
? 悝�媆卞反﹜本件氾件旦及id伉旦玄毛珨�觴杅井日扔件皿伉件弘
ACL2018掂心頗3

失奶犯奴失Ｋ
- �g惤(伕奈市伙杻釾講)及載陔源楊 -
ACL2018掂心頗4
wi-1, t wi , t wi+1 , t
wi-1,t-1 wi ,t-1 wi+1,t-1
Word
Embedding(t-1)
Hidden
Embedding(t-1)
Sentence
Embedding(t-1)
Word
Embedding(t)
Hidden
Embedding(t)
h(t,i)
g(t-1,i)
h(t-1,i-1) h(t-1,i) h(t-1,i+1)

失奶犯奴失Ｌ
- 本件氾件旦(弘伕奈田伙杻釾講)及蕎木矛弁玄伙及載陔源楊 -
ACL2018掂心頗5
w0, t-1 w1,t-1 wn+1,t+1
Sentence
Embedding(t-1)
Word
Embedding(t-1)
wi,t
Hidden
Embedding(t-1)
Word
Embedding(t)
Hidden
Embedding(t-1)
Sentence
Embedding(t)
???
???
g(t,i)
g(t-1,i)
h(t-1,0) h(t-1,1) h(t-1,n+1)

奶丟奈斥
ACL2018掂心頗6

�觳偞隅
- 本件氾件旦煦� -
? 本件氾件旦互丐月玄疋永弁卞扽允月井瘁井及諒�犯奈正毛蚚砩
? Text Classification(Liu, etc, 2017)
? 啐�硌㻢反Accuracy
? ゴ�I燴 :詢螿僅�g惤毛祅壺﹜帤眭惤反<unk>
? 岈ゴ悝� : Glove(300棒啋)
? NN隙曰
? Softmax Layer
? 本件氾件旦及弘伕奈田伙杻釾講g(t)毛妏勻化煦�
? Adam Optimizer
? Dropout is 0.5
? Gradient Clipping at 3
? L2 regularization(0.001)
ACL2018掂心頗7

磐彆
- 啐��及window甡湔俶 -
? TimeStep t 反﹜S-LSTM及媆嶲源砃及墿今(巨禾永弁匹反卅中)
? 伕奈市伙杻釾講載陔媆卞云仃月Window扔奶朮卞反甡湔仄化卅中
? 本件氾件旦煦�卞反弘伕奈田伙杻釾講互衄�﹝伕奈市伙杻釾講�g极匹反眈�
掀�彆互卅中互﹜弘伕奈田伙杻釾講卞失弘伉必奈扑亦件今木月午衄�
8

磐彆
- 弘伕奈田伙杻釾講毛壺�仄凶�磁及俶夔 -
? g毛壺�允月午﹜81.76%(t=11)引匹俶夔互狟互月
? g及用奈玉毛袚樓仄化手俶夔反劐歹日卅井勻凶
ACL2018掂心頗9
81.76%

磐彆
- 16意�及犯奈正本永玄匹及磐彆 -
? S-LSTM及仫曰反湮五仁媼勾
? 由仿弘仿白源砃卞LSTM毛軗日六月
? t-楓醴囀卞云仃月伕奈市伙杻釾講及載陔反�K蹈趙匹五月
? 悝�媆卞11�本件氾件旦毛扔件皿伉件弘允木壬俶夔互假隅允月日仄中
? S-LSTM午BiLSTM午掀屯月午﹜傻中媆嶲匹詢中俶夔
? 由仿弘仿白源砃卞LSTM毛軗日六月凶戶﹜CNN毛妏勻凶�磁
方曰反媆嶲互井井月
ACL2018掂心頗10

蕉舷
- 本件氾件旦嶲及失仿奶丟件玄毛蕉尹卅仁化方中及井 -
? 本件氾件旦嶲及憝�S(失仿奶丟件玄)毛蕉尹卅仁化方中及井
? 悝�媆及本件氾件旦扔件皿伉件弘及源楊
? 瞰尹壬100�及仿矛伙葆本件氾件旦互丐月
? 鼠嶱戊奈玉匹反﹜仇仇井日𢜔勾井及本件氾件旦毛仿件母丞扔件皿伉件弘
? 勾引曰﹜t午t+1楓醴及本件氾件旦及憝�S毛蕉𩬅仄化中卅中
? 瞰尹壬﹜𨈘坰及本永扑亦件犯奈正毛蕉尹月
? 丐月交奈扒奈及本永扑亦件/day毛珨井堎厥勾午允月
? 允月午本永扑亦件/day囀及伊戊奈玉反穴伙民奶件氾件玄午卅勻化中月
? 今日卞﹜t゜醴午t+1゜醴及本永扑亦件反祥窣適卅奶件氾件玄午卅月
? 卅及匹﹜ t゜醴及本永扑亦件犯奈正互迵尹日木凶媆﹜t+1゜醴及郔
場及𨈘坰弁巨伉毛瓜奶奈皮卞軑䛐允月仇午反褣仄中
ACL2018掂心頗11

蕉舷
- 由仿丟奈正芢隅源楊(僑饜ロ�及�畦) -
? S.Hahn, etc
? 卅兮Dropout互𡘙趙卞敵迵允月及井毛磊歠腔卞捼屯凶恅瓬
? Mnist犯奈正匹Dropout衄曰剠仄及�磁毛捼屯凶
? 桶反杻卞跪伊奶乩奈及僑饜及羯��毛ⅸ歙仄凶手及
? 桶(Layer3反Output Layer)井日歹井月方丹卞﹜Dropout互丐月
幻丹互﹜僑饜ロ�互�畦仄化中月仇午互歹井月
? 伊奶乩奈卞60�午59�及用奈玉互丐勻化手俶夔反劐歹日卅中
? Dropout及隅掊
? Dropout反僑饜ロ�及�畦毛棻筳今六月
ACL2018掂心頗12

蕉舷
- 由仿丟奈正芢隅源楊(僑饜及樓厒) -
? Momentum
? Momentum Restart Scheme
? Aggregated Scheme
? 籵都及Momentum支Nesterov Momentum卞方曰﹜醴
腔憝杅及悝�互樓厒今木月仇午反方仁眭日木月
? 凶分仄﹜Momentum反由奶由奈由仿丟正及捼淕毛仄卅中午﹜
醴腔憝杅互淥�允月仇午手眭日木化中月
? [B.O＊Donoghue, etc]
? 公木毛滅什源楊午仄化﹜奻�媼勾及源楊互丐月
ACL2018掂心頗13

蕉舷
- Restart Scheme(NAG) -
? 淥�允月燴蚕反
[B.O＊Donoghue, etc]
? 乒丟件正丞毛峚煦源最宒匹桶
允午﹜丐月沭璃匹反捼睿淥�
赽及源最宒午卅月
? 湮五仁媼勾及氾弁瓦永弁
? 醴腔憝杅互�樓仄凶日矛奈正
毛未伕卞仄化乒丟件正丞毛秏允
? 樓厒及源楊午僑饜及囀搪互
六中卞卅勻凶日矛奈正毛未伕卞仄
化乒丟件正丞毛秏允
? 僑饜反negative源砃
ACL2018掂心頗14

蕉舷
- Aggregated Scheme(AggMo) -
? 郔羥卅乒丟件正丞由仿丟奈正汕毛А戶月及反褣仄中及匹﹜恚杅
及�S杅汕匹載陔仄凶由仿丟奈正毛失弘伉必奈扑亦件
? 公手公手﹜跪FeatureWeight卞�仄化郔羥卅汕反�卅月
? 公木毛�勾仃月方曰﹜�卅月汕匹А戶凶由仿丟奈正毛ⅸ歙仄凶幻
丹互假隅允月
? [J.Lucas, etc]卞反﹜𢖯囮憝杅互convex+smooth匹淏�t趙
�互convex+non-differentiable﹜及偞隅匹�旰毛偩隴
? 賒砉煦�及瞰匹﹜ResNet毛跪Optimizer匹儕僅掀廌
? 晟惤乒犯伙及瞰匹﹜LSTM毛跪Optimizer匹儕僅掀廌
ACL2018掂心頗15

蕉舷
- AggMo奶弗化月井手 -
? x,y媼意�及劐杅互迵尹日木凶媆及郔羥趙�觳(Non-Convex)
? (x,y)=(0,0)匹郔羥�毛午月醴腔憝杅
? 汕互未伕 (=SGD﹜ヤ)? NAG(酴伎)匹反﹜白仿永玄卅薆郖井日㠙仃堤六卅中
? NAG(髮)反郔羥�毛醴硌允手淥�仄卅互日左奈田奈白奴永玄
? AggMo(喪)反白仿永玄卅薆郖毛迕堤仄勾勾﹜淥�允月仇午卅仁郔羥�尺�旰
ACL2018掂心頗16

統蕉恅瓬
? Sentence Embedding
? [G.Zhe, etc] Learning Generic Sentence
Representations Using Convolutional Neural
Networks, EMNLP, 2017
? Parameter Estimation
? [S.Hahn, etc] Gradient Acceleration in Activation
Functions, arXiv, 1806.09783v1, 2018
? [B.O＊Donoghue, etc] Adaptive Restart for
Accelerated Gradient Schemes, JFCM, vol15(3),
p715-732, 2015
? [J.Lucas, etc], Aggregated Momentum_Stability
Through Passive Damping, arXiv, 1804.00325v1,
2018
ACL2018掂心頗17

端端舝

Sentence-State LSTM for Text Representation

Recommended

More Related Content

What's hot (19)

Similar to Sentence-State LSTM for Text Representation (7)

More from Takanori Nakai (17)

Sentence-State LSTM for Text Representation