狠狠撸

狠狠撸Share a Scribd company logo
第17回 Machine Learning 15minutes!(2017/10/28)
ビジネスの出会いを科学する
R&D Group 研究員:高橋 寛治@kanji250tr
法人向け名刺管理サービス 個人向け名刺アプリ
Sansanは2つの名刺サービスを提供しています
? 名刺のデータ化
? 名刺による人脈の管理
? 人手による正確なデータ化
名刺を企業の資産に変える
2
名刺は人と人との出会いの証である接点情報
→ 誰と誰が、いつ出会ったかを記録したビジネスデータベースとなる
データ化およびビジネスデータベースからの価値創出がR&Dの課題
ビジネスの出会いを科学するために必要な2つの領域
3
名刺データ化の自動化 データ活用
年間数億枚の名刺を99.9%の精度でデータ化
4
人力入力に比べ、名刺1枚あたりの入力コストを
機械学習を適用することで約80%削減
名刺画像の読取 名刺情報の入力 ビジネスデータベース
人力×機械学習など
データ活用一例:キーワードによる属性の付与
5
企業の特徴や属性を表すキーワードを付与する
業種分類
Sansan株式会社:情報処理サービス / パッケージソフト業
生きた情報(トレンド)も含めたい
IoT, ディープラーニング, ビットコイン, AI, Fintech
名詞の連接を計算しキーワードを抽出
6
キーワード抽出
? 形態素解析や不用語削除など前処理
を適用
? 会社単位でキーワード候補を抽出
? TermExtractによりスコアリング
? Top Nをキーワードとして抽出
1. トップページを取得 2. 形態素解析
クラウド 名詞
名刺管理 名詞
サービス 名詞
を 助詞
提供 名詞
する 動詞
3. キーワード候補抽出4. キーワード抽出
クラウド 名詞
名刺管理 名詞
サービス 名詞
提供 名詞
クラウド名刺管理
??? ?? = ? ?? × ?? ??
?? ?? = ?
?=1
?
?? ?? + 1 ?? ?? + 1
1
2?
出会いの
精査
意図した
複数の
出会い
出会いへの
アプローチ
ミッション
目的
成果
偶然の
複数の
出会い
ミッション
目的との
マッチング
出会う
べき人
名刺DB
?成果の理解
?人物特徴の分析
?リコメンド
Sansan
レコメンドエンジン
データ活用の今後

More Related Content

Similar to 第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する (7)

採用プラットフォームサービス『転职ナビ』
採用プラットフォームサービス『転职ナビ』採用プラットフォームサービス『転职ナビ』
採用プラットフォームサービス『転职ナビ』
akitakatanaka
?
【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?
Masanori Saito
?
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
Takahiro Kubo
?
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
Masanori Saito
?
量子コンピュータ
量子コンピュータ量子コンピュータ
量子コンピュータ
Masanori Saito
?
Tech summit2018 PR02
Tech summit2018 PR02Tech summit2018 PR02
Tech summit2018 PR02
Minoru Kobayashi
?
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Yotaro Fujii
?
採用プラットフォームサービス『転职ナビ』
採用プラットフォームサービス『転职ナビ』採用プラットフォームサービス『転职ナビ』
採用プラットフォームサービス『転职ナビ』
akitakatanaka
?
【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?【講演資料】アテにされる / どういうこと?どすればいいの?
【講演資料】アテにされる / どういうこと?どすればいいの?
Masanori Saito
?
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
机械学习を活用するための、3本の柱词教育型の机械学习ツールの必要性词
Takahiro Kubo
?
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Sansan ~ ハッカーズチャンプルー2017 スポンサーセッション ~
Yotaro Fujii
?

More from Kanji Takahashi (20)

20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
Kanji Takahashi
?
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
Kanji Takahashi
?
論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information
Kanji Takahashi
?
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
Kanji Takahashi
?
言语処理学会第23回年次大会参加报告
言语処理学会第23回年次大会参加报告言语処理学会第23回年次大会参加报告
言语処理学会第23回年次大会参加报告
Kanji Takahashi
?
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
Kanji Takahashi
?
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
Kanji Takahashi
?
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
Kanji Takahashi
?
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
Kanji Takahashi
?
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Kanji Takahashi
?
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
Kanji Takahashi
?
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
Kanji Takahashi
?
狈濒辫2016参加报告(高桥)
狈濒辫2016参加报告(高桥)狈濒辫2016参加报告(高桥)
狈濒辫2016参加报告(高桥)
Kanji Takahashi
?
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
Kanji Takahashi
?
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Kanji Takahashi
?
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
Kanji Takahashi
?
日本语机能表现の自动検出と统计的係り受け解析への応用
日本语机能表现の自动検出と统计的係り受け解析への応用日本语机能表现の自动検出と统计的係り受け解析への応用
日本语机能表现の自动検出と统计的係り受け解析への応用
Kanji Takahashi
?
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
Kanji Takahashi
?
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
Kanji Takahashi
?
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
Kanji Takahashi
?
20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
20180718贰颈驳丑迟ニュースフィード活性化のための自然言语処理の取り组み
Kanji Takahashi
?
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
論文読み会 Creating Speech and Language Data With Amazon’s Mechanical Turk
Kanji Takahashi
?
論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information論文読み会 Enriching Word Vectors with Subword Information
論文読み会 Enriching Word Vectors with Subword Information
Kanji Takahashi
?
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
Kanji Takahashi
?
言语処理学会第23回年次大会参加报告
言语処理学会第23回年次大会参加报告言语処理学会第23回年次大会参加报告
言语処理学会第23回年次大会参加报告
Kanji Takahashi
?
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
Kanji Takahashi
?
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
Kanji Takahashi
?
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
Kanji Takahashi
?
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
Kanji Takahashi
?
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Kanji Takahashi
?
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
Kanji Takahashi
?
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
Kanji Takahashi
?
狈濒辫2016参加报告(高桥)
狈濒辫2016参加报告(高桥)狈濒辫2016参加报告(高桥)
狈濒辫2016参加报告(高桥)
Kanji Takahashi
?
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
Kanji Takahashi
?
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Kanji Takahashi
?
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
Kanji Takahashi
?
日本语机能表现の自动検出と统计的係り受け解析への応用
日本语机能表现の自动検出と统计的係り受け解析への応用日本语机能表现の自动検出と统计的係り受け解析への応用
日本语机能表现の自动検出と统计的係り受け解析への応用
Kanji Takahashi
?
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
20150916How Far are We from Fully Automatic High Quality Grammatical Error Co...
Kanji Takahashi
?
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
Kanji Takahashi
?
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
Kanji Takahashi
?

第17回Machine Learning 15 minutes!:ビジネスの出会いを科学する