狠狠撸

狠狠撸Share a Scribd company logo
机械学习システム开発案件の事例绍介
<画像分類編>
株式会社ブレインパッド
アナリティクスサービス本部 開発部
塚原 朋也
ブレインパッドとエウレカが語る、データ分析と機械学習の活用
自己紹介
● 氏名:
○ 塚原 朋也
● 簡単なプロフィール:
○ 金融系SE、自社製品開発を経て、株式会社ブレインパッド ア
ナリティクスサービス本部で主に画像系の機械学習システムを
開発しています。
● 好きなこと等:
○ システムアーキテクチャ設計、GCPをさわる、子供(小学校1
年生男子)と遊ぶ、旅行。
アジェンダ
1. はじめに
2. 解決すべき課題とは…
3. まずは要件定義から…
4. 開発始動!!
5. 本格的な機能追加!!
6. 付録
7. おわりに
1.はじめに
深層学習を活用した画像自動分類の業務システムについ
て、とある不動産系の案件を題材に課題解決に向けての
アプローチについて私の体験談をお話しします!!
おまけで、システム構成概要も。
詳細はこちら→http://www.brainpad.co.jp/news/2018/06/11/7695
以下のような業務システムの話です。
ログイン画面 アップロード画面 登録画面自動分類処理 登録結果照会画面確認画面
リビングルーム!!
建物!!
不動産サイトに掲載!!
本当はもっと色々な処理を
行っているけど、簡単に表
現すると、こんな感じのシ
ステムです。
2.解决すべき课题とは…
● 物件の写真を営業マンが撮影し、「玄関」「キッチン」「洋
室」「トイレ」など、写真の種類ごとにアップロード作業を
行っている。その作業に1件5分もかかっている。
● 全数で数十万の物件があるので多大な工数がかかっている。
● 上記の工数を減らして、営業マンの工数を付加価値の高い業
務へ振り分けたい。
つまり、業務におけるコスト削減を図ることが目的
でした。
上記のように明確な目的を
設定することが重要です。
3.まずは要件定义から…
1. お客様が持つシステムイメージをヒアリングして譲れないポイントを押
さえる。
a. 例:出来るだけ画面数や操作を少なくする、物件写真の入ったフォルダをドラッグ&ド
ロップしてアップロード?自動分類したい。
i. 特に対応期間、費用(ランニングコストを含む)が重要なポイントだと思います。
2. 業務利用に必要な分類対象?分類精度を明確にする。
a. 例:トイレ?洗面所?リビング?…の21分類器。
b. 例:トイレ?洗面所?リビングは90%以上の正解率、その他(画像)は高い正解率は求
めない。
3. 業務利用可能な分類要件を満たすためのベストな対応方法を選択する。
a. 例:ルールベースの対応で足りるか、既成機械学習モデルで解決できるか、自前で機械
学習モデルで準備する必要があるか。
i. 人間の目を通しても区別することが不可能なものは学習モデルに頼らず、なるべくルールベースに寄せることが得
策ってこともあります。
この3つの作業により、対応スコー
プを明確にすることが重要です。
4.开発始动!!
1. モックアップ→α版→β版→正式版といった形で段階的に
システムを成長させながら顧客要望を具体化する。
2. 実装→リリース→顧客確認→仕様変更→リリース→…という
サイクルを回し、何度もリリースを繰り返す。
3. とくかく早く業務利用可能な状態に持っていく。
とにかく早くお客様に見える形でアウ
トプットを提示して、お客様の隠れた
要望を引き出すことが大事です。
段階的に進めることで大きな手戻りな
く対応スピードを早めることができる
と思います。
ちなみに
有名な風刺画でこんなのがあります。とにかく動くものを早く
提供することが大事であることを表現したものです。
5.本格的な机能追加!!
目的は業務におけるコスト削減を図ること。
次のステップは、機械学習モデルでなくUI改善により業
務効率化を実現!!
業務システムの目的達成のためには、機械学習モ
デルだけでなく、あらゆる方法を組み合わせて、
最適なアプローチで対応する必要があります。
大事なのは、目的を達成すること!!
7.付録
システム構成図
Client
Layer
Instance Group
Compute Engine
Autoscaling
Analysis Layer
Batch Layer
Instance Group
Compute Engine
Autoscaling
Presentation Layer
Front End App
App Engine
Autoscaling
Task
Queues
Cloud Load
Balancing
Cloud
DNS
Storage
Layer
Static Content
Cloud Storage
Dynamic Content
Cloud SQL
Stackdriver Monitoring Logging Error
Reporting
要件やコスト感を
考慮して、十分過
ぎず?不足しない
システム構成にす
るように心がけま
した。
● 今後の対応予定等
○ GCPには、Cloud AutoML API(β版)というサ
ービスがあり実際に検証したところ、なかなか
精度が高かったので見逃せない。
○ 機能追加に合わせて、引き続きシステムアーキ
テクチャも成長させる。
○ 機械学習モデルについて、ラベル付けのルール
を改善できるものは再定義する。
ご清聴ありがとうございました。
データサイエンティスト
機械学習アプリ作りたいエンジニア
積極採用中!
https://hrmos.co/pages/brainpad/jobs

More Related Content

机械学习システム开発案件の事例绍介