狠狠撸

狠狠撸Share a Scribd company logo
N-gram

                  2011/09/22
         NLP   ?手     6


                       ,      ?大
          {unno, hillbig}@prefered.jp
l??   N
          ?行行

l??


l??             ?見見      ?行行

l??       ?日          ?行行
?文             ?用


           ?大


                ?大

                ?大



l??                       ?入
l??        ?飛
l??


l??   ?一?方             ?高
l??
      l??    ?言   ?文
?大


l??
      l??
      l??
l??
      l??
      l??




l??   N
??長

l??                   ?文        ?一

l??


l??          ?用
      l??   ?大 ?骨     ?骨
      l??

l??         ?用
      l??

      l??                  ?大
l??
      l??           ?大?雨
      l??
Eisner                                      [Eisner96]


                           A           B       C       D            E       root




                                                       =
 A          D   +     B            D       +       B       C        +   D      root   +   D   E


l??                  ?木 T                                      S(T)

l??   S(T) = ∑(m, h)           T   s(m, h)
      l??   (m, h)     T                                       ?非
l??   S(T)           ?大                    Topt                         O(n3)
Google N-gram                              ?自?己
 PMI




l??   Google?日       N                      ?用
      l??   #(mh) m, h
      l??   #(m) m
l??   Eisner        ?足           s(m, h)          T
      ?一                 const
?大   ?骨          ?骨




            ?大




          ?大?雨
1.?         ?自
      l??

      l??



2.?
      l??

      l??   ?大

3.?                ?自
      l??                ?自
      l??           ?大
             l??   ?大         ?自
1.          ?自




l??
l??


l??         ?自
l??                       ?高        PMI
      l??        580K?    117M?           72K
      l??        580K?    13.4M?           20.5K
2.



                            ?大



l??         ?大

l??
      l??        542M? ?大    114M?       ?大   68K
      l??        542M?         1.66M?               77
l??         ?大
3.         ?自



           ?大



l??   ?大        ?文


l??
l??
1 ?高

l??   PMI          ?言




l??
1   ?文

                         ?大

                    ?大

                                         2


l??                           ?入   ?大

l??   ?木                            ? 
2



                            ?大?雨




                ?大?雨


l??        ?木
l??                    ?           ?方

l??   ?文        ?用
[?工 05][             +06]? 

              	
         	
   	
     	
       	
   	
   	
   	
     	
     	
     	
(1)  1    0    1    1    0    1    0    1    0    0    0    1
(2) 0.95 0.05 0.95 0.95 0.05 0.95 0.05 0.95 0.05 0.05 0.05 0.95
(3) 0.99 0.01 0.99 0.89 0.18 0.85 0.19 0.95                   0.0    0.0    0.0   0.99

                   (1)                    ? (2)     SSC ( =0.95) (3)


      l??
            ?力力
      l??
      l??
?大          PMI               ?用 [Zhou+11]

l??           PMI                  ?入
l??   PMI            Google         ?用
l??                 +1 ~ 2
?文

l?? [Eisner96] J. M. Eisner. Three New Probabilistic Models for
    Dependency Parsing: An Exploration. COLING ‘96.
l?? [?工 05] ?工     .                  ?用                 ?一
        ?用. ?言                ?大 ’05.
l?? [      +06]        ?大 , ?工     ,       .                 ?用
                                          ?用. NLP ?手
         ‘06.
l?? [Zhou+11] G. Zhou, J. Zhao, K. Liu, L. Cai. Exploiting Web-
    Derived Selectional Preference to Improve Statistical
    Dependency Parsing. ACL ’11.

More Related Content

Viewers also liked (20)

PDF
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
Yuya Unno
?
PDF
Efficient Top-k Algorithms for Fuzzy Search in String Collections
rvernica
?
PDF
自然言语処理蔼春の情报処理祭
Yuya Unno
?
PDF
???贵滨の研究开発现场
Yuya Unno
?
PDF
N-gram IDF: A Global Term Weighting Scheme Based on Information Distance (WWW...
Masumi Shirakawa
?
PDF
Information Extraction from Web-Scale N-Gram Data
Gerard de Melo
?
PDF
ウェーブレット木の世界
Preferred Networks
?
PDF
公司における自然言语処理技术利用の最先端
Yuya Unno
?
PPTX
SAS University Edition - Getting Started
Craig Trim
?
PPTX
Text categorization
KU Leuven
?
PDF
Statistical Semantic入門 ~分布仮説からword2vecまで~
Yuya Unno
?
PDF
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
Yuya Unno
?
PDF
bigdata2012ml okanohara
Preferred Networks
?
PDF
Extreme Extraction - Machine Reading in a Week
Shuyo Nakatani
?
PDF
「知識」のDeep Learning
Yuya Unno
?
PDF
bigdata2012nlp okanohara
Preferred Networks
?
PDF
Short Text Language Detection with Infinity-Gram
Shuyo Nakatani
?
PPTX
Semantic Search for Sourcing and Recruiting
Glen Cathey
?
PDF
Deep Learningと自然言語処理
Preferred Networks
?
PDF
DeNAの機械学習?深層学習活用した 体験提供の挑戦
Koichi Hamada
?
闯耻产补迟耻蝉の绍介蔼第6回さくさくテキストマイニング
Yuya Unno
?
Efficient Top-k Algorithms for Fuzzy Search in String Collections
rvernica
?
自然言语処理蔼春の情报処理祭
Yuya Unno
?
???贵滨の研究开発现场
Yuya Unno
?
N-gram IDF: A Global Term Weighting Scheme Based on Information Distance (WWW...
Masumi Shirakawa
?
Information Extraction from Web-Scale N-Gram Data
Gerard de Melo
?
ウェーブレット木の世界
Preferred Networks
?
公司における自然言语処理技术利用の最先端
Yuya Unno
?
SAS University Edition - Getting Started
Craig Trim
?
Text categorization
KU Leuven
?
Statistical Semantic入門 ~分布仮説からword2vecまで~
Yuya Unno
?
公司における自然言语処理技术の活用の现场(情报処理学会东海支部主催讲演会蔼名古屋大学)
Yuya Unno
?
bigdata2012ml okanohara
Preferred Networks
?
Extreme Extraction - Machine Reading in a Week
Shuyo Nakatani
?
「知識」のDeep Learning
Yuya Unno
?
bigdata2012nlp okanohara
Preferred Networks
?
Short Text Language Detection with Infinity-Gram
Shuyo Nakatani
?
Semantic Search for Sourcing and Recruiting
Glen Cathey
?
Deep Learningと自然言語処理
Preferred Networks
?
DeNAの機械学習?深層学習活用した 体験提供の挑戦
Koichi Hamada
?

Similar to N-gram統計量からの係り受け情報の復元 (YANS2011) (12)

PDF
Windows Azure復習編
Saori Ando
?
PDF
【セミナー資料】Kloutスコアの高い企業は、何がちがうのか? 20110720
Takashi Yano
?
PDF
补辫辫濒颈尘+开催概要(辫诲蹿)
applim
?
PDF
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
Hiroko Onari
?
PPTX
5.20 How to design the teaching tools
elainehsu27
?
PDF
Tips and Tricks for remembering Chinese characters
Shaz Lawrence
?
PDF
自動化テスト VS 手動テスト
Ryutaro YOSHIBA
?
PDF
础颁搁滨最新通信ダイジェスト
Toru MOCHIDA
?
PDF
お品书き&补尘辫;诸注意
Saori Ando
?
PPTX
Vim 神技
hotoo
?
PDF
Grace's 0425 教學實習教案
Grace Yeh
?
PPTX
Vim+神技 (1)
Ailsa126
?
Windows Azure復習編
Saori Ando
?
【セミナー資料】Kloutスコアの高い企業は、何がちがうのか? 20110720
Takashi Yano
?
补辫辫濒颈尘+开催概要(辫诲蹿)
applim
?
複雑ネットワーク勉強会 第2章ネットワークの特徴量(後半) 20120215
Hiroko Onari
?
5.20 How to design the teaching tools
elainehsu27
?
Tips and Tricks for remembering Chinese characters
Shaz Lawrence
?
自動化テスト VS 手動テスト
Ryutaro YOSHIBA
?
础颁搁滨最新通信ダイジェスト
Toru MOCHIDA
?
お品书き&补尘辫;诸注意
Saori Ando
?
Vim 神技
hotoo
?
Grace's 0425 教學實習教案
Grace Yeh
?
Vim+神技 (1)
Ailsa126
?
Ad

More from Yuya Unno (20)

PDF
深层学习で切り拓くパーソナルロボットの未来
Yuya Unno
?
PDF
深層学習時代の 自然言語処理ビジネス
Yuya Unno
?
PDF
ベンチャー公司で言叶を扱うロボットの研究开発をする
Yuya Unno
?
PDF
PFNにおける セミナー活動
Yuya Unno
?
PDF
深層学習フレームワーク Chainerとその進化
Yuya Unno
?
PDF
进化する颁丑补颈苍别谤
Yuya Unno
?
PDF
予测型戦略を知るための机械学习チュートリアル
Yuya Unno
?
PDF
深层学习による机械とのコミュニケーション
Yuya Unno
?
PDF
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
Yuya Unno
?
PDF
Chainer, Cupy入門
Yuya Unno
?
PDF
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
Yuya Unno
?
PDF
深层学习フレームワーク颁丑补颈苍别谤の特徴
Yuya Unno
?
PDF
子供の言语获得と机械の言语获得
Yuya Unno
?
PDF
NIP2015読み会「End-To-End Memory Networks」
Yuya Unno
?
PDF
颁丑补颈苍别谤入门と最近の机能
Yuya Unno
?
PDF
Chainerの使い方と 自然言語処理への応用
Yuya Unno
?
PDF
骋笔鲍上での狈尝笔向け深层学习の実装について
Yuya Unno
?
PDF
深层学习时代の自然言语処理
Yuya Unno
?
PDF
大規模データ時代に求められる自然言語処理 -言語情報から世界を捉える-
Yuya Unno
?
PDF
ACL読み会@PFI “How to make words with vectors: Phrase generation in distributio...
Yuya Unno
?
深层学习で切り拓くパーソナルロボットの未来
Yuya Unno
?
深層学習時代の 自然言語処理ビジネス
Yuya Unno
?
ベンチャー公司で言叶を扱うロボットの研究开発をする
Yuya Unno
?
PFNにおける セミナー活動
Yuya Unno
?
深層学習フレームワーク Chainerとその進化
Yuya Unno
?
进化する颁丑补颈苍别谤
Yuya Unno
?
予测型戦略を知るための机械学习チュートリアル
Yuya Unno
?
深层学习による机械とのコミュニケーション
Yuya Unno
?
最先端NLP勉強会 “Learning Language Games through Interaction” Sida I. Wang, Percy L...
Yuya Unno
?
Chainer, Cupy入門
Yuya Unno
?
颁丑补颈苍别谤のテスト环境と顿辞肠办别谤での颁鲍顿础の利用
Yuya Unno
?
深层学习フレームワーク颁丑补颈苍别谤の特徴
Yuya Unno
?
子供の言语获得と机械の言语获得
Yuya Unno
?
NIP2015読み会「End-To-End Memory Networks」
Yuya Unno
?
颁丑补颈苍别谤入门と最近の机能
Yuya Unno
?
Chainerの使い方と 自然言語処理への応用
Yuya Unno
?
骋笔鲍上での狈尝笔向け深层学习の実装について
Yuya Unno
?
深层学习时代の自然言语処理
Yuya Unno
?
大規模データ時代に求められる自然言語処理 -言語情報から世界を捉える-
Yuya Unno
?
ACL読み会@PFI “How to make words with vectors: Phrase generation in distributio...
Yuya Unno
?
Ad

N-gram統計量からの係り受け情報の復元 (YANS2011)

  • 1. N-gram 2011/09/22 NLP ?手 6 , ?大 {unno, hillbig}@prefered.jp
  • 2. l?? N ?行行 l?? l?? ?見見 ?行行 l?? ?日 ?行行
  • 3. ?文 ?用 ?大 ?大 ?大 l?? ?入 l?? ?飛
  • 4. l?? l?? ?一?方 ?高 l?? l?? ?言 ?文
  • 5. ?大 l?? l?? l?? l?? l?? l?? l?? N
  • 6. ??長 l?? ?文 ?一 l?? l?? ?用 l?? ?大 ?骨 ?骨 l?? l?? ?用 l?? l?? ?大 l?? l?? ?大?雨 l??
  • 7. Eisner [Eisner96] A B C D E root = A D + B D + B C + D root + D E l?? ?木 T S(T) l?? S(T) = ∑(m, h) T s(m, h) l?? (m, h) T ?非 l?? S(T) ?大 Topt O(n3)
  • 8. Google N-gram ?自?己 PMI l?? Google?日 N ?用 l?? #(mh) m, h l?? #(m) m l?? Eisner ?足 s(m, h) T ?一 const
  • 9. ?大 ?骨 ?骨 ?大 ?大?雨
  • 10. 1.? ?自 l?? l?? 2.? l?? l?? ?大 3.? ?自 l?? ?自 l?? ?大 l?? ?大 ?自
  • 11. 1. ?自 l?? l?? l?? ?自 l?? ?高 PMI l?? 580K?  117M?  72K l?? 580K?  13.4M?  20.5K
  • 12. 2. ?大 l?? ?大 l?? l?? 542M? ?大 114M?  ?大 68K l?? 542M?  1.66M?  77 l?? ?大
  • 13. 3. ?自 ?大 l?? ?大 ?文 l?? l??
  • 14. 1 ?高 l?? PMI ?言 l??
  • 15. 1 ?文 ?大 ?大 2 l?? ?入 ?大 l?? ?木 ? 
  • 16. 2 ?大?雨 ?大?雨 l?? ?木 l?? ?  ?方 l?? ?文 ?用
  • 17. [?工 05][ +06]?  (1) 1 0 1 1 0 1 0 1 0 0 0 1 (2) 0.95 0.05 0.95 0.95 0.05 0.95 0.05 0.95 0.05 0.05 0.05 0.95 (3) 0.99 0.01 0.99 0.89 0.18 0.85 0.19 0.95 0.0 0.0 0.0 0.99 (1) ? (2) SSC ( =0.95) (3) l?? ?力力 l?? l??
  • 18. ?大 PMI ?用 [Zhou+11] l?? PMI ?入 l?? PMI Google ?用 l?? +1 ~ 2
  • 19. ?文 l?? [Eisner96] J. M. Eisner. Three New Probabilistic Models for Dependency Parsing: An Exploration. COLING ‘96. l?? [?工 05] ?工 . ?用 ?一 ?用. ?言 ?大 ’05. l?? [ +06] ?大 , ?工 , . ?用 ?用. NLP ?手 ‘06. l?? [Zhou+11] G. Zhou, J. Zhao, K. Liu, L. Cai. Exploiting Web- Derived Selectional Preference to Improve Statistical Dependency Parsing. ACL ’11.