Machine learning quality for productionyusuke shibui
?
This document discusses machine learning quality for production systems. It provides examples of machine learning applications in e-commerce and self-driving vehicles. For each application, it discusses three categories of end-to-end machine learning system quality: inference performance and robustness, system performance and stability, and operational requirements like security and updates. It emphasizes the importance of testing machine learning systems against real-world data changes over time.
46. アンチパターン:Nobody knowsパターン
LB
ML ML
ML
ML
ML
ML
ML?
● 稼働中の推論器がなぜ動いているのか誰も知らないパ
ターン。歴史的にシステムが複雑になっていくと頻繁に発
生する。
● MLプロジェクトの初期にプロトタイプで作った
モデルや、緊急対応で稼働させた推論器を残して
おくと「Nobody knows」になる。
● 学習データが残っていない状態は珍しくない。
学習コードもJupyter Notebookのみという場合、
モデルの評価や再現が困難。ML?
ML
49. 機械学習システムの品質
機械学習システムの品質には3カテゴリある。
1. 機械学習の推論モデル
a. 推論モデルのパフォーマンス
b. 本番データの変化による劣化とエラー
c. 問題定義とソリューション
2. 推論モデルを稼働させるシステム
a. 入出力のデータやデータ型
b. 推論スピードと可用性
c. 例外処理
3. 運用と体制
a. モデルの再現および再学習
b. 推論器の再現およびロールバック
c. 維持可能な運用体制
Client LB LB
int ?oat
test data
accuracy:
99.99%
何のML
だっけ?
1sec/req
モデル作った
VM消したよ
dockerimg:latest
上書き
error率
0.01%
アサイン
変わった
me
too
転
職
商品カテゴリ
追加削除
そして誰も
いなくなった