狠狠撸

狠狠撸Share a Scribd company logo
MOV お客さま探索ナビの
GCP ML開発フローについて
鈴木 隆史
AI本部 AIシステム部 MLエンジニアリンググループ
株式会社ディー?エヌ?エー
自己紹介
鈴木 隆史 | Takashi Suzuki
AI本部 AIシステム部 MLエンジニアリンググループ
前職では新卒でITメガベンチャーに入社し、サーバーサイドエンジニアとしてゲーム開発と
ビッグデータを活用したサービス分析をリード。
その後、大規模データ基盤の新規構築と運用保守などのデータエンジニアリング業務と、レ
コメンドアルゴリズムの設計開発やチャットボット開発などのMLエンジニアリング業務に
従事していた。
2019年にDeNAに入社し、オートモーティブ事業における機械学習の実験基盤やパイプライ
ンの設計開発を行っている。
2
アジェンダ
3
サービス
システム概要
ML開発フロー
1
2
3
まとめ4
サービス
4
1
タクシー配車アプリ MOV
5
お客さま探索ナビ
6
この車両にとって
最適な走行経路は何か?
システム概要
7
2
全体システム構成
8
9
コンポーネント概要
リアルタイム
データ処理
● 車両データのETL
● DWH
● データ前処理
需要供給予測
● 特徴量作成
● MLモデル予測
走行ルート推薦
● 最適方策の獲得
● 全体最適化
リアルタイム需要供給予測
10
直近の乗車数
周辺の乗車数
各種統計量
MLモデル
直後30分に発生
する乗車数
ML開発フロー
11
3
本番環境
● 推論パイプライン
● モデル精度監視
12
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
本番環境
● 推論パイプライン
● モデル精度監視
13
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
分析/モデル開発における課題
14
01
セキュアなクラウド環境
権限?証跡がきちんと管理され
ローカルPC以上に快適に
メンバーと共有しやすい環境
02
学習時のスケール
一番メモリを必要とするモデル学習時に
他タスクに影響ないように
スケールする環境
ユーザ認証Jupyter環境
● GKE構築でセキュア(SSL、IP制限)でスケールしやすい
● 個人認証(Cloud IAP)をサポート
● Notebookを共有しやすい
v.s. Datalab
● セキュア要件への柔軟さ
● 起動の速さ
セキュアなクラウド環境:JupyterHub
15
フルマネージド学習基盤
● 1分単位の起動時間課金
● Dockerカスタムイメージの学習をサポート
● ジョブ実行までidle timeが発生する
v.s. GKE
● 柔軟なインスタンス変更
● クラスタ作成不要の手軽さ
学習時のスケール:AI Platform Training Job
16
AI Platform
本番環境
● 推論パイプライン
● モデル精度監視
17
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
実験管理における課題
18
01
各実験パラメータの管理
複数モデルの実験を行うため各実験のパラメータ管理が必要
comet.ml
- 豊富な視覚化/比較
- ハイパラ探索
- コード管理
- Git Integration
- 有料
各実験パラメータの管理
19
mlflow
- 視覚化/比較
- 簡易ハイパラ探索
- 無料
BigQuery
- 視覚化はDataPortal
- リストはDataConnector
- カスタムしやすい
本番環境
● 推論パイプライン
● モデル精度監視
20
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
CI/CDにおける課題
21
01
コードの再現性
データサイエンティストから
MLエンジニアに渡された
コード?モデルの実行/再現の
担保
02
ロールバック
新しいモデルにバグが
あった場合の
以前のモデルに切り戻
したいとき
03
モデルのテスト
パイプラインに反映する前の
簡易な動作テストと
小規模データの検証テスト
コード?モデルの再現性
● コミュニケーションギャップの解消
● 再現性の担保
● GKEやTraining Jobのコンテナで利用しやすい
モデルのロールバック
● DockerのImage Tag/Digestでversion管理
● 切り戻す際には以前のImageへ
再現性とロールバック:Docker I/F
22
動作?検証テスト
● 時間の関係でCircleCIでチェックするのは動作?検証テストのみ
● 小規模データでモデルの有効性と実装エラーを検証
● 本番条件での連携と評価テストは専用Invoke
モデルの簡易テスト:pytest
23
本番環境
● 推論パイプライン
● モデル精度監視
24
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
02
冪等性担保
パイプラインの再実行などにより
データ重複やモデルの精度ズレが
発生しないようにする
推論パイプラインにおける課題
25
01
複雑な依存関係
学習に利用する各種特徴量の作成と
データの前処理や推論や評価など
一連の依存関係を担保
マネージドAirflow
● 複雑な依存関係定義によりヒューマンエラー防止
● 冪等性なJob実行により再現性を担保
● 定期的にJobを実行してモデルを更新
● 重い処理はGKEやTraining Jobを利用
v.s. Kubeflow Pipeline
● 途中Jobから再実行可能
● 外部トリガー?外部リソースの利用が容易
● 評価指標は管理できない
パイプラインにおける課題:Cloud Composer
26
Cloud
Composer
本番環境
● 推論パイプライン
● モデル精度監視
27
ML開発フロー
実験環境
● 分析/モデル開発
● 実験管理
CI/CD
モデル精度監視における課題
28
01
モデルの経年劣化
日々変化するタクシー需要トレンドに追従して
新しいデータでモデルを再学習させ、精度をモニタリングしたい
モデル推論の精度を監視
● モデルの定期更新はComposerで担保
● モデル精度をカスタムメトリックでMonitoring
● ベースモデルと比較して悪ければ通知
モデルの経年劣化:Stackdriver Monitoring
29
Stackdriver
Monitoring
まとめ
30
4
MLOpsの立ち位置
● 業務ごとに専門性が増し、生産性向上のために分業化が進むと、個々人が把握できる
コンポーネントは減ってしまう
● 再現性の担保、依存関係の管理、精度やエラー監視する仕組みなどのMLOpsを事前
に準備することで、技術的負債を減らすことができる
● チームごとの課題を把握し、予めI/Fや方針を握っておくことが重要
大事にしていること
31
本説明会及び説明資料の内容は、発表日時点で入手可能な情報や判断に基づくも
のです。将来発生する事象等により内容に変更が生じた場合も、当社が更新や変更
の義務を負うものではありません。
また、本説明会及び説明資料に含まれる将来の見通しに関する部分は、多分に
不確定な要素を含んでいるため、実際の業績等は、さまざまな要因の変化等により、
これらの見通しと異なる場合がありますことをご了承ください。
株式会社ディー?エヌ?エー
32
Ad

Recommended

PDF
FastAPIを使って 機械学習モテ?ルをapi化してみた
Sho Tanaka
?
PDF
惭尝翱辫蝉の概要と初学者が気をつけたほうが良いこと
Sho Tanaka
?
PDF
机械学习モデルのサービングとは?
Sho Tanaka
?
PDF
机械学习システムのアーキテクチャアラカルト
BrainPad Inc.
?
PPTX
机械学习応用のためのソフトウェアエンジニアリングパターン
HironoriTAKEUCHI1
?
PDF
機械学習応用システムのアーキテクチャ?デザイパターン(2020-07 ドラフトバージョン))
HironoriTAKEUCHI1
?
PDF
(修正)機械学習デザインパターン(ML Design Patterns)の解説
Hironori Washizaki
?
PDF
顿补迟补-肠别苍迟谤颈肠な惭尝开発
Takeshi Suzuki
?
PDF
机械学习システムの33のアーキテクチャパターンおよびデザインパターン
Hironori Washizaki
?
PPTX
後部座席タブレットにおけるMaaS時代を見据えた半歩先のUX設計」 [MOBILITY:dev]
DeNA
?
PDF
骋翱の机械学习システムを支える惭尝翱辫蝉事例绍介
Takashi Suzuki
?
PDF
Jsai2018
MLSE
?
PDF
[AI/ML] 機械学習における AWS を用いたマイクロサービスアーキテクチャ
Yuta Nakagawa
?
PDF
础滨の见方、础滨との付き合い方
Yoshitaka Seo
?
PDF
开催の辞
MLSE
?
PPTX
MOV お客さま探索ナビの GCP ML開発フローについて
DeNA
?
PDF
誰もが AI を使う時代、作る時代
Yoshitaka Seo
?
PPTX
MOVで実践したサーバーAPI実装の超最適化について [MOBILITY:dev]
DeNA
?
PDF
社内のリース車の利用状況を Power BI で可視化してみた
Junichi Kodama
?
PPTX
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
Kenta Iwasaki
?
PDF
Exam prep microsoft_ai900_japanese_210428
Yukio Saito
?
PDF
Microsoft AI と深層学習
Shohei Nagata
?
PDF
今后10年の机械学习ビジネスの可能性
tomohiro furukawa
?
PDF
Machine Learning Serviceを使ってみよう
Yoshitaka Seo
?
PDF
第79回 Machine Learning 15minutes ! 生成AIをエンタープライズで活用するWatsonx.aiの紹介
Tsuyoshi Hirayama
?
PPTX
Company Profile 2013 recruit
Satoshi Matsumoto
?
PPTX
ノンコーディングでビジネスアプリ作成 笔辞飞别谤础辫辫蝉入门
Trainocate Japan, Ltd.
?
PDF
05.日本マイクロソフト(株)冲発表资料
wagatuma
?
PDF
リクルート式サービス开発 カスタマーの本音×人工知能
Recruit Technologies
?

More Related Content

What's hot (13)

PDF
机械学习システムの33のアーキテクチャパターンおよびデザインパターン
Hironori Washizaki
?
PPTX
後部座席タブレットにおけるMaaS時代を見据えた半歩先のUX設計」 [MOBILITY:dev]
DeNA
?
PDF
骋翱の机械学习システムを支える惭尝翱辫蝉事例绍介
Takashi Suzuki
?
PDF
Jsai2018
MLSE
?
PDF
[AI/ML] 機械学習における AWS を用いたマイクロサービスアーキテクチャ
Yuta Nakagawa
?
PDF
础滨の见方、础滨との付き合い方
Yoshitaka Seo
?
PDF
开催の辞
MLSE
?
PPTX
MOV お客さま探索ナビの GCP ML開発フローについて
DeNA
?
PDF
誰もが AI を使う時代、作る時代
Yoshitaka Seo
?
PPTX
MOVで実践したサーバーAPI実装の超最適化について [MOBILITY:dev]
DeNA
?
PDF
社内のリース車の利用状況を Power BI で可視化してみた
Junichi Kodama
?
PPTX
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
Kenta Iwasaki
?
PDF
Exam prep microsoft_ai900_japanese_210428
Yukio Saito
?
机械学习システムの33のアーキテクチャパターンおよびデザインパターン
Hironori Washizaki
?
後部座席タブレットにおけるMaaS時代を見据えた半歩先のUX設計」 [MOBILITY:dev]
DeNA
?
骋翱の机械学习システムを支える惭尝翱辫蝉事例绍介
Takashi Suzuki
?
Jsai2018
MLSE
?
[AI/ML] 機械学習における AWS を用いたマイクロサービスアーキテクチャ
Yuta Nakagawa
?
础滨の见方、础滨との付き合い方
Yoshitaka Seo
?
开催の辞
MLSE
?
MOV お客さま探索ナビの GCP ML開発フローについて
DeNA
?
誰もが AI を使う時代、作る時代
Yoshitaka Seo
?
MOVで実践したサーバーAPI実装の超最適化について [MOBILITY:dev]
DeNA
?
社内のリース車の利用状況を Power BI で可視化してみた
Junichi Kodama
?
めざせスカウター! HoloLensによる特定個人の 顔認識アプリ制作とその課題
Kenta Iwasaki
?
Exam prep microsoft_ai900_japanese_210428
Yukio Saito
?

Similar to MOV お客さま探索ナビの GCP ML開発フローについて (20)

PDF
Microsoft AI と深層学習
Shohei Nagata
?
PDF
今后10年の机械学习ビジネスの可能性
tomohiro furukawa
?
PDF
Machine Learning Serviceを使ってみよう
Yoshitaka Seo
?
PDF
第79回 Machine Learning 15minutes ! 生成AIをエンタープライズで活用するWatsonx.aiの紹介
Tsuyoshi Hirayama
?
PPTX
Company Profile 2013 recruit
Satoshi Matsumoto
?
PPTX
ノンコーディングでビジネスアプリ作成 笔辞飞别谤础辫辫蝉入门
Trainocate Japan, Ltd.
?
PDF
05.日本マイクロソフト(株)冲発表资料
wagatuma
?
PDF
リクルート式サービス开発 カスタマーの本音×人工知能
Recruit Technologies
?
PDF
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
Kazuya Sugimoto
?
PDF
基调讲演「データのグループウェア化」
Cybozucommunity
?
PDF
SDGC2018 redux Tannaka
Service Design Network Japan Chapter
?
PPTX
厂顿骋颁2018报告「ネットビジネスとサービスデザイン」
Nozomu Tannaka
?
PDF
メルペイの与信モデリングで安全?安心のために実践していること
Yuhi Kawakami
?
PDF
日本语データの活用までの道のり
Hideto Masuoka
?
PDF
楽天エンジニアライフ
Rakuten Group, Inc.
?
PPTX
ML Opsのススメ
紀彦 中林
?
PDF
ノーコードでAIサービスを使ってみよう!「AI Bulder」
典子 松本
?
PDF
Power Apps Startup Meeting@広島 モデル駆動型アプリを使用した 業務アプリの開発
Numakami Ayumu
?
PPTX
笔贬笔を使う理由
Yohei Hamada
?
Microsoft AI と深層学習
Shohei Nagata
?
今后10年の机械学习ビジネスの可能性
tomohiro furukawa
?
Machine Learning Serviceを使ってみよう
Yoshitaka Seo
?
第79回 Machine Learning 15minutes ! 生成AIをエンタープライズで活用するWatsonx.aiの紹介
Tsuyoshi Hirayama
?
Company Profile 2013 recruit
Satoshi Matsumoto
?
ノンコーディングでビジネスアプリ作成 笔辞飞别谤础辫辫蝉入门
Trainocate Japan, Ltd.
?
05.日本マイクロソフト(株)冲発表资料
wagatuma
?
リクルート式サービス开発 カスタマーの本音×人工知能
Recruit Technologies
?
SharePointとAzure Functionsを組み合わせた マルチクラウドなサーバーレスアーキテクチャの展開方法 Japan share poin...
Kazuya Sugimoto
?
基调讲演「データのグループウェア化」
Cybozucommunity
?
厂顿骋颁2018报告「ネットビジネスとサービスデザイン」
Nozomu Tannaka
?
メルペイの与信モデリングで安全?安心のために実践していること
Yuhi Kawakami
?
日本语データの活用までの道のり
Hideto Masuoka
?
楽天エンジニアライフ
Rakuten Group, Inc.
?
ML Opsのススメ
紀彦 中林
?
ノーコードでAIサービスを使ってみよう!「AI Bulder」
典子 松本
?
Power Apps Startup Meeting@広島 モデル駆動型アプリを使用した 業務アプリの開発
Numakami Ayumu
?
笔贬笔を使う理由
Yohei Hamada
?
Ad

More from Takashi Suzuki (10)

PDF
到着予想时间サービスの特徴量のニアリアルタイム化
Takashi Suzuki
?
PDF
础滨予约サーヒ?スの惭尝翱辫蝉事例绍介
Takashi Suzuki
?
PDF
碍耻产别谤苍别迟别蝉超入门
Takashi Suzuki
?
PDF
惭尝フ?ロシ?ェクトのリリースフローを考える
Takashi Suzuki
?
PDF
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
Takashi Suzuki
?
PDF
惭翱痴の机械学习システムを支える惭尝翱辫蝉実践
Takashi Suzuki
?
PDF
タクシー×础滨を支える碍耻产别谤苍别迟别蝉と础滨データパイプラインの信頼性の取り组みについて
Takashi Suzuki
?
PDF
[Gree] DataEngConf NYC’18 セッションサマリー #1
Takashi Suzuki
?
PPTX
[Gree] Dialogflowを利用したチャットホ?ット導入事例
Takashi Suzuki
?
PPTX
[Gree] グリーのソーシャルケ?ームにおける機械学習活用事例
Takashi Suzuki
?
到着予想时间サービスの特徴量のニアリアルタイム化
Takashi Suzuki
?
础滨予约サーヒ?スの惭尝翱辫蝉事例绍介
Takashi Suzuki
?
碍耻产别谤苍别迟别蝉超入门
Takashi Suzuki
?
惭尝フ?ロシ?ェクトのリリースフローを考える
Takashi Suzuki
?
Optuna on Kubeflow Pipeline 分散ハイパラチューニング
Takashi Suzuki
?
惭翱痴の机械学习システムを支える惭尝翱辫蝉実践
Takashi Suzuki
?
タクシー×础滨を支える碍耻产别谤苍别迟别蝉と础滨データパイプラインの信頼性の取り组みについて
Takashi Suzuki
?
[Gree] DataEngConf NYC’18 セッションサマリー #1
Takashi Suzuki
?
[Gree] Dialogflowを利用したチャットホ?ット導入事例
Takashi Suzuki
?
[Gree] グリーのソーシャルケ?ームにおける機械学習活用事例
Takashi Suzuki
?
Ad

MOV お客さま探索ナビの GCP ML開発フローについて

Editor's Notes

  • #7: 乗车予测を立てることで空车となる时间を短缩し、歩合制の契约が多いタクシー运転手の収入を安定させる