狠狠撸
Submit Search
人力と机械の协调システムつくり
?
Download as PPTX, PDF
?
0 likes
?
417 views
Koji Kobayashi
Follow
厂补苍蝉补苍の名刺入力は人力と机械によって行われる。どのようにそのプロセスを构筑してきたかの解説。
Read less
Read more
1 of 54
Download now
Download to read offline
More Related Content
人力と机械の协调システムつくり
1.
人力と机械の协调システムつくり 厂补苍蝉补苍株式会社 DSOC R&Dグループ 小林幸司 2019.11.29
2.
厂补苍蝉补苍株式会社
3.
厂补苍蝉补苍株式会社が展開する2つの事業 法人向けクラウド名刺管理サービス 個人向け名刺アプリ
4.
法人向けクラウド名刺管理サービス
5.
ビジネスがはじまる3つの機能 出会いが社内で共有 されていない AI名刺管理 同僚コラボレーション いつでもスムーズに 同僚を頼れる 顧客データHub データが正しく統合され、 価値に気づける 出会いを正確にデータ化し、 社内で共有 名寄せエ ン
ジ ン 名刺データ
6.
個人向け名刺アプリ 名 刺 で
つ な が る 、 ビ ジ ネ ス の た め の S N S
7.
Eightの特長 気軽に連絡正確にデータ化 近況情報が届く すぐに名刺情報にアクセス
8.
ビジネスプラットフォームへ 2013 2015 2016 2017 リンク機能 メッセージ機能 フィード機能 プロフィール ページの編集 オンライン 名刺交換機能 シェア機能 プロフィール 画面 企業ページ 企業向け 求人ページ 無料化 クイック スキャン 着信時に名刺 情報を表示 2018 企業向け 採用プラット フォーム グループ メッセージ 機能 Slack連携 2019
9.
組織構成 法人向け名刺管理サービス Sansanの開発、提供 個人向け名刺アプリサービス Eightの開発、提供 Sansan事業部 Eight事業部 DSOC 厂补苍蝉补苍株式会社 データ統括部門 CSIRT セキュリティ部門 R&D データ分析?研究開発 (画像処理/機械学習?AI)
10.
DSOC R&D DSOC DDGDMGR&D SocSci Architect Data Development Automation DEV 今日の話
11.
R&Dの仕事 (Automation) 名刺取り込み 背景分離
画像補正 1 項目分割 2 セキュリティー項目細分割、項目入力 3 チェック&補正 5 マージ 4 セキュアな環境を構築
12.
R&Dの仕事 (Automation) スマートキャプチャー 撮影されてから数秒で結果をユーザーに届けることを可能にする技術 項目セグメンテーション 文字を読み取らずに、名刺のデザインから項目を見分ける 言語処理判定 文字を読み取らずに言語を判定 ミステイクディテクター 誤りの傾向を学習してミスの可能性を予測
13.
R&Dの仕事(データ活用) - 紙のままでは見えてこない、 新しい価値の掘り起こし ビジネスマンタイプ分析ABMダッシュボード ビジネスカード?コレクション abcd@efg.jp 090-0000-000
14.
京都のサテライトオフィス
15.
オフィス(2014/10 ~ 2018/10) -
Mesh KYOTO - シェアオフィス - 常勤1~2人 - 一応、京都ラボ
17.
シェアオフィス - ノートPCを持ち込めばもう仕事ができる - ネット回線、電話、机、椅子、棚 -
キッチン、予約制会議室、コピー機、その他 - 専門外の広い人脈ができる
18.
オフィス(2018/10~) - Sansan Innovation
Lab - 京都の古民家を改装
20.
Sansan Innovation Lab
活用例 - Sansanの機械学習系エンジニアの開発拠点 - 合宿、セミナー、社外勉強会などにも利用 - 関西エンジニアの活動 拠点としても機能させたい
21.
自己绍介
22.
- DSOC R&D
Automationチーム所属 - 機械学習?画像処理エンジニア - 2014年から現職 小林幸司
23.
京都
24.
なぜ京都か - なぜ私は京都か - 特に京都にこだわってない >
住めば都派 - 妻の実家が近いという一点のみ - なぜSansanに京都ラボが - 関西で転職先探し - Sansanはマッチ度が非常に高い - 「じゃあ京都に拠点創るか」
25.
リモートで働く - Sansanの開発拠点 - 京都、大阪、徳島、新潟、北海道 -
DSCO R&D はメンバー5人が地方 - リモート勤務による直接的な生産性向上はほぼない - 私生活の充実や通勤による疲弊の軽減など、間接的な影響はある - 地方の優秀な人材獲得のメリットは大きい - 個人的には必要最低限の会議にしか呼ばれないのが最大のメリット - 生産性をどう落とさない姿勢と工夫が必要
26.
リモートで働くコツ - ツール(主にクラウド)に頼る - ビデオ会議 -
チャット - ソースコード管理、タスク管理 - 出勤簿 - などなど - 良さそうなツールがでたらとりあえず試す - ダメならとっとと元に戻す - その他いろいろ試す - ダメならとっとと元に戻す
27.
入力システムについて
28.
サービス概要 今日は ここの話 AI×人によるデータ入力 データベース化 マルチデバイスで活用 他システムとの連携 お客様 テクノロジーとオペレーターに よる多重入力を活用し、高い入力精度を実現 名刺をスキャン 4 3 21 Sansanスキャナ スマートフォンアプリ ※Eightで撮影した名刺画像を転送可能
29.
入力システムコンセプト GEES ? より世界中のリソースを利用できるように ?
日本語以外は地産地消で処理できるようにGlobal ?繁忙/閑散期を柔軟に吸収できる伸縮自在な 体制が組めるようにElastic ? より効果的な方法で役割配置ができるよう にEfficiency ? よりスケーリングできるようにScalable
30.
入力処理イメージ 名刺取り込み 背景分離 画像補正 1 項目分割 2 セキュリティー項目細分割、項目入力 3 チェック&補正 5 マージ 4 マイクロタスク×マルチソーシングによる独自の名刺データ化システム セキュアな環境を構築
31.
マイクロタスク化とマルチソーシング マルチソーシング ? センターオペレータ ? 在宅オペレータ ?
海外オペレータ ? クラウドソーシング マイクロタスク ? 誰でも ? 何時でも ? どこでも ? 隙間時間で ? 事前準備不要
32.
人から机械
33.
- 2007~2013年 100%人力システム -
高クオリティ > 人の精度 > OCRの精度 > ここがSansanの優位性 - 高コスト - 低速度 - 指数関数的に増える名刺流入量にどう立ち向かうか 人力OCR(2007~)
34.
- 自動ピース切り出し - 自動名刺矩形切り出し -
名刺ホワイトニング - 自動選択 - 自動入力 - 入力ミスチェックエンジン - 言語判定 - 回転判定 自動化エンジン開発の履歴(2013~) - スマホ組み込み名刺切り出し - 即時納品OCR - 顔検出 - 自動手書き検出 - etc. 多種多様なリリースの連続。。。 どうやってこなせてきたのか
35.
マイクロタスクと自動化 - すべてを一度に自動化するのは難しい - リリースまでの開発工数が読めない -
開発の結果使える精度になるのか不安 - 機械はあまり複雑なことはできない - AI ≠ 人工知能 マイクロタスク化は機械にも優しかった!
36.
- できるところから自動化していけばよい - 難しいものは人に回せばよい >
手書き文字認識、変型名刺検出など - できる範囲で自動化していけばよい - あるタスクの自動化を行いたい > 1stリリースは自動化率5%とかでよい > 逐次改善、即座にリリース、次の日にはKPIに現れる - 24時間?365日動くシステムは、一度に大きな成果を出す必要はない 自動化の道筋
37.
マイクロタスク化の恩恵例 名刺四点抽出 2007 2014
2018 他モジュールを気にせず自動化?精度向上に注力していける 2019? 注)画像の名刺はダミー名刺です
38.
このスピード感は開発者にとって魅力! 自分が作ったものが次の瞬間から動き始めるという興奮が味わえる
39.
KPI 当然大事!アラート対応も仕事の一つ。 リリース次の日には数字をチェック 変化や異常をグラフでチェック
40.
人と机械
41.
- Sansanならではの開発 →人と机械の協調システム -
多様な人 > 言語、環境、能力、など - 多彩な技術 > 機械学習、画像処理、自然言語処理 - これらをどう組み合わせて最適解を導き出すがAutomationチームのテーマ 人と机械
42.
- 基本的な比較項目 - 精度 -
コスト - 速度 - スケーリング - セキュリティ - 組み合わせの典型モデルが次項 人か機械か、または両方か
43.
人と机械の組み合わせ一例(N vote matching) 機械の入力に自信があれば確定 自信がなければ入力を一票とし、 N票獲得するまで人に仕事を依頼する
44.
- 機械ができなかったものを人が行う - 目的:精度、速度、コストの最適化 -
ex.文字列入力?選択 人と机械 パターン1 OK NG
45.
- 機械が作業者を選ぶ - 目的:人の配置の最適化(言語、セキュリテイ、コストなど) -
ex.言語判定 人と机械 パターン2 日本語名刺or日本語項目 英語語名刺or英数項目
46.
例 言語判定 名刺画像から言語を判定 ○4言語(日英中韓)に対応 ○データ化フローの効率化 ○オペレータへの振り分けの自動化 ○精度 98
% 参考資料:”Deep Residual Learning for Image Recognition” Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun https://arxiv.org/abs/1512.03385 言語判定モデル 日本語名刺 英語名刺 中国語名刺 その他言語 韓国語名刺 名 刺
47.
- 機械しか使わない - 目的:セキュリティの確保、速度 -
ex.ピース切り出し、ホワイトニング 人と机械 パターン3
48.
例 項目分割、再分割 文字列ごとへの切り出し、 さらに細かく切り出し ○セキュリティ確保 ○マイクロタスク化 三三 太郎 TEL:03-6758-0033
49.
- 人しか使わない - 目的:人しかできない、まだ自動化に動いていない -
ex.入力に失敗した名刺の入力、カメラのシャッターを切る 人と机械 パターン4
50.
これから
51.
- 「人の精度 >>
機械の精度」から「機械の精度 > 人の精度」時代 - 2013年~2019年について > 既存自動化APIのリプレイス - 新規自社開発OCRの投入 - 人にはできない課題解決 > デバイス上での画像処理?画像認識 これから
52.
- 「もし機械が100%認識できるようになったら、何をしますか?」 - 100%じゃなくてもやりはじめています -
データ活用 > 一枚の名刺からは見えてこない価値の掘り起こし > リコメンド、名刺以外の情報との紐づけ - 人と人、人と会社、会社と会社のつながり解析 これから
53.
- 京都で横のつながりを作っていきたい - 人から机械 -
マイクロタスク化 - 継続的な改善 - 人と机械 - 精度?速度などの最適化問題 - これから - データ入力だけじゃない世界へ まとめ
Download