狠狠撸

狠狠撸Share a Scribd company logo
最近の機械学習テクノロジーと
ビジネスの応用先
古川 朋裕
ー自然言語処理を中心にー
自己紹介
<名前> 古川 朋裕
普段はNextremerという会社で
機械学習エンジニアをしています
取組分野:画像処理?自然言語処理など
<注意>
 ?主観が多分に含まれています
 ?正確さについて保証しておりません
現在の自然言語処理技術の
  得意分野は関連付けや分類
 不得意分野は文章の意味を想像すること
→そこでどんなビジネスに応用できるのか?
概要
<ニュース>
“IBMのWatson、
わずか10分で難症例患者の
正しい病名を見抜く”
得意:関連付け?分類
http://blog.fashionsealhealthcare.com/sites/
default/files/styles/blog_image_display/publi
c/field/image/blogs/ibm_watson.png?
itok=KfjKZapuより引用
参考文献:http://japanese.engadget.com/2016/08/07/ibm-watson-10/
?2000万件以上の癌に関する
論文を学習
Watsonの基本理念
情報や知識を備え、専門家に複数の選択肢を提示
≒文章の関連付けを行う
<Watsonの中身> (予想)
得意:関連付け?分類
http://blog.fashionsealhealthcare.com/sites/
default/files/styles/blog_image_display/publi
c/field/image/blogs/ibm_watson.png?
itok=KfjKZapuより引用
主に予め記述した知識に従って
原因?結論などを予測
基礎技術:推論エンジン
“Mike ate bread.”
(Person) (eat) (food)
(Person) (be) (hungry)
一般化
推論
パンを食べた原因は
「空腹であった」と推論
David Ferrucci???開発主要エンジニアが推論の専門家
“1994 with a Ph.D. degree in computer science specializing in knowledge representation and reasoning”(wikipediaより)
“text understanding from scratch” Xiang Zhang et al. 2015
得意:関連付け?分類
「Amazonレビュー分析」
例:カメラのレビュー
“すごい画質が綺麗でした。
???性能も良いと思います。”
機械学習
肯定的か?
否定的か?
判定
94%の精度で肯定?否定を判定可能
(skip-thought vector?paragraph vectorなど多数関連技術あり)
(http://commonsensereasoning.org/winograd.htmlより引用)
不得意:文章の意味を想像
The trophy would not fit in the brown suitcase
because it was too big
文章の意味を想像することが正しい回答に必要
問題:“it”は何を指すでしょうか?
上記のような問題を集めたコンテスト
<Winograd Schema Challenge 2016>
最優秀チームのスコア = 58%
(http://www.cs.nyu.edu/faculty/davise/papers/WinogradSchemas/WS.html)
「trophyが大きすぎてsuitcaseに入らない」という
(http://commonsensereasoning.org/winograd.htmlより引用)
不得意:文章の意味を想像
The trophy would not fit in the brown suitcase
because it was too big
解決案:推論エンジンにヒント?
fitにはsizeがenoughである必要という知識を利用
size (attribute-of) suitcase
size → enough → can fit
→ not enough → can not fit
知識を全部記述したシステムを作るべきか?
 →網羅は困難だし、効率も悪い
 →知識をどう扱うかは大きな問題
ビジネスの応用先
?webページなど情報の構造化
得意?不得意を把握した上で何ができるのか?
?士業全般のサポート?自動化
ビジネスの応用先
https://www.diffbot.com/
DIFFBOT???webページの構造化サービス
ビジネスの応用先
DIFFBOT???webページの構造化サービス
YAH! ニュース
先のロサンゼルス五輪
において、女子柔道は
金メダル1つ、銀メダル3
つ、銅メダル1つでメダ
ルを獲得するも???
柔道金メダル獲得
2016/9/20
webページ 構造化=項目ごとに分類
<title>
柔道金メダル獲得
<date>
2016/9/20
<text>
先のロサンゼルス五輪
において、女子柔道???
他、商品情報を抽出したり
画像や顔を探すこと可能
ビジネスの応用先 DIFFBOT
webページの構造化
?大量のwebページの一括自動処理が可能
YAH! ニュース
先のロサンゼルス五輪
において、女子柔道は
金メダル1つ、銀メダル3
つ、銅メダル1つでメダ
ルを獲得するも???
柔道金メダル獲得
2016/9/20
価格?レビューなどの
商品情報一括取得
  ???etc
ニュース報道の
トレンド分析
ビジネスの応用先
弁護士???法律調査 Ross Intelligence社
税理士???自動仕分けによる会計 freee社
士業全般のサポート?自動化
IBM Watsonをベースとして
破産法関連の質問に回答できるシステム
他、弁理士でも中小企業診断士でも
文章を扱う専門家なら少なくともサポートはできそう
参考:“エストニアの電子政府実現で税理士や会計士の職は消滅した”
http://www.excite.co.jp/News/economy_g/20160823/Postseven_440295.html
現在の自然言語処理技術の
  得意分野は関連付けや分類
 不得意分野は文章の意味を想像すること
ビジネスの応用先:webページの構造化
        士業のサポート?自動化
          などが有望と考える
まとめ
ドローン 機械学習?
Precision Hawk
番外編
Precision Hawk
ドローン 機械学習?
(2010年創業、カナダ)
ドローンを使ったデータ収集?分析
https://techcrunch.com/2016/04/20/precisionhawk-raises-18-million-to-bring-drones-safely-into-u-s-airspace/より引用
農業用土壌ヒートマップ
?3Dなどマップ作成
→データ分析
?ドローンによる
リアルタイム監視
ドローン 機械学習?
<応用例>
CEO Bob Young (元red hat CEO) 
  “ドローンを売ることではなく
   データのプラットフォームで収益化”
農業???収穫予測、肥料、水やりなど最適化
エネルギー???石油パイプライン保守
       鉱物発掘調査など
Precision Hawk
<戦略>
→分析技術など含むソフトで価値を出す
ドローン 機械学習?
<技術>(予想)
ヒートマップ???教師データさえあれば
       ディープラーニングなどで作成可能
       (例)乾いている、枯れている度合
Precision Hawk
自律飛行 ???強化学習 or ルールベース
参考:機械学習でドローンを自律飛行させようという研究も行われている
“Associative-memory-recall-based control system for learning hovering manoeuvres”
Huang Pei-Hua et al. 2015
→個人的な所感では、
 強化学習させると
 行動決定の根拠がわからないため
 ルールを決めたプログラミングの方が実用的
ドローン 機械学習? Precision Hawk
→日本でローカライズすれば事業として成立?
<これからできるビジネス>
農業:コメなど作物を特化、台風の予測など
   日本特有のデータを収集
エアロリンク???ソニーとZMPの合弁会社もある
→安全な自律飛行の実現
機械学習による詳細な状況判断の実現
データ分析による飛行マップの作成

More Related Content

最近の机械学习テクノロジーとビジネスの応用先 自然言语処理を中心に