際際滷

word2vecの尖�嘘尚
mabonki0725
2016/12/17

徭失�B初
? デ�`タ蛍裂と�y�モデル��B15定
�C 僥�デ�`タ參翌の�\喘デ�`タでも嚠�yが輝たることに�@く
? �y�方尖冩梢侭の�C亠僥�ゼミに６定�g壓汐
�C 机どの�y�モデルを��B
　登�e直　SVM　ベイジアンネット　DeepLearning吉
? ロボット室�g�誼のため�b�I室�g寄僥垪に秘僥
�C 岑�?�C亠僥�?崙囮尖�の�y栽が駅勣で�k婢余貧の室�g
? �U�Y議には致忽の�C亠僥�の�猟を�iみ、できれば
�g廾するのが匯桑除祇と房っている
�C NIPS　ICML�猟�i氏したい(侯�L�_岸�
? 縮�あり僥�のXGBOOSTの來嬬に�@いている

word2vecとは
? 寄楚の猟��鬚茲鵑芭鍔屬�vectorで燕�Fにする
�C vectorなので紗�p麻で容�?容�]ができる
? �B�
　vec(晩云) � vec(�|奨) � vec(パリ) ★ vec(フランス)
? 容�X 啌鮫のBacktoFutureにviolenceを�くした啌鮫は�
　vec(?????????????) � 2～vec(羽薦) ★ vec(??????)
� =2～violence

word2vecの嘘尚尖�
�なぜword2vecはvectorを聞うのか
�なぜword2vecは僥�できるのか
�なぜword2vecは紗�p麻で容�できるのか
word2vecの尖�嘘尚には參和の�猟と盾�hがある
�A Latent Variable Model Approach to PMI-basedWord
Embeddings　　Sanjeev Arora+ (TACL 2016)
��y方冩　隔�魎鶺慙班悊僚瞠h�Y創　�恷枠極NLP8�
　　　http://chasen.org/~daiti-m/paper/SNLP8-latent.pdf

�word2vecはvectorを聞うのか
? word2vecのvectorの容協圭隈�skip-gram)
�C 恷�mなvector麻竃するためvectorの坪�eを聞う
�C �k伏�_楕を縮�デ�`タとするsoftmaxの指｢モデル
�g�ZWiとその念瘁の�g�ZWoの�k伏�_楕
縮�デ�`タ softmax�v方

�word2vecはvectorを聞うのか�尖��
A Latent Variable Model Approach to PMI-basedWord Embeddings
�g�Zの�k伏�_楕をsoftmax�v方で麻竃できると��┐垢�
貧��猟では參和の協尖2.2(a) (b)が撹羨する
協尖2.2(a) �O栽う猟忖v wの揖�r伏軟�_楕の��方はvector處麻となる
softmax�v方

�word2vecはvectorを聞うのか�尖��
協尖2.2 (b)
　 �g�Zv w�gの坪�eがPMI��札秤�鸛殖�暴鐱討任④�
協尖2.2(a)を旗秘すると貧塀が箔まる
? ?
? ? ? ?
? ? ? ? ? ?wpvpwvp
wpvp
wvp
loglog,log
,
log ???

PMI秤�鸛�
? (he has) (are the) 吉のよく竃てくる�Yびつきは吭龍がない。
　　(beer wine) (oil economy)の�Yびつきは吭龍がある
? �l訓に竃てこない�g�Zでよく�るペアに吭龍がある
? PMI秤�鸛燭�l訓に竃ないが、よく�るペアを燕す
word2vecはPMI秤�鸛殖�g�Zの坪�e�で指｢してvectorを箔めている。
縮�デ�`タ softmax�v方

�word2vecはvectorを聞うのか��^苧�
<念戻>
�r震t において, ランダムウォ�`クする猟�}ベクトルct があり
�g�Zvecotor wt の�k伏�_楕はsoftmax�v方に惄�Δ��
この念戻で�Q�yするとZはCtに笑らず１

? 協尖2.2 (a)の�^苧
協尖2.2(a)

? 協尖2.2の�^苧
☆

�word2vecは僥�できるのか
? 猟忖wiとその念瘁の�}方猟忖wo1゛Cの�k伏�l業で
恷�mなVectorをsoftmax�v方の恷喩�､能發�
恷喩�､慮﨩楕�
Softmax�v方を盾く
Wovwji
v'ij
畠�g�Zについて紗麻�並�g貧音辛嬬�
wi

�word2vecは僥�できるのか
? word2vecの恷喩�ｽ發虜�宴晒�
　蛍銚�箸鯣�g�Zではなく、ランダム渇竃とする
NegativeSampling隈　�麻楚の��p
　V(畠�Z)★VNeg(ランダム渇竃)
σ�シグモイド�v方
Wovwji
v'ij
wi

�word2vecは僥�できるのか�尖��
? ��方喩業Lを恷寄となるVector v w を僥�できればよい
Xvwは伏軟指方
これから

�word2vecの僥�できるのか��^苧�
よって

�word2vecは僥�できるのか��^苧�
☆
伏軟指方Xvwを縮�デ�`タとしてwは恷弌屈�\盾で麻竃できる

�word2vecの紗隈容�
? vec(king) - vec(man) + vec(woman) ★ vec(queen)
vec(king) - vec(qeen) = vec(man) - vec(woman)
)|(
)|(
log
)|(
)|(
log
),(
)(
)(
),(
log
),(
)(
)(
),(
log
),(
)()(
)()(
),(
log
),(
)()(
)()(
),(
log
)()(
),(
log
)()(
),(
log
)()(
),(
log
)()(
),(
log
)()(
),(
log
)(2.2
womanxp
manxp
queenxp
kingxp
womanxp
womanp
manp
manxp
queenxp
queenp
kingp
kingxp
womanxp
womanpxp
manpxp
manxp
queenxp
queenpxp
kingpxp
kingxp
manpxp
womanxp
manpxp
manxp
queenpxp
queenxp
kingpxp
kingxp
d
kingx
kingpxp
kingxp
b
womanxmanxqueenxkingx
x
womanmanqueenking
womanqueenmanking
t
tttt
?
?
?
???
?
???
???
???
これを喘いると
より協尖
を�譴韻独厘�
紗隈�tはこれを幣す
�^苧

協尖2.2(a)より
Vの吭龍腎�gの贋壓
<x,y>は坪�eを幣す

�
<x,y>は坪�eを幣す

まとめ
? 甜隼�k�されたword2vecの紗隈�tは書指の
�猟で�協議だが苧らかにされた
? 書肉の徭隼冱�Z盾裂は吭龍盾裂が机ど�oった
�C �|寄ロボは吭龍盾裂で払�，靴拭。��麪� �m硫枠伏�
? 徭隼冱�Zの吭龍尖盾には蛍柊燕�Fが紗わった
�C �催燕�F��猟盾裂�
�C �Lれ咀徨蛍裂�LDAモデル�
�C 蛍柊燕�F�vector處麻)
この蛮栽が冩梢が豚棋される
<歌深> 仝徭隼冱�Zの吭龍に��する２つのアプロ�`チ々秤�麪� �m硫

際際滷

安看姻糸2厩艶界の尖胎嘘尚

More Related Content

安看姻糸2厩艶界の尖胎嘘尚