狠狠撸

狠狠撸Share a Scribd company logo
BigQuery MLの行列分解モデルを
用いた推薦システムの基礎
2022/07/30 機械学習の社会実装勉強会第13回
岩澤 幸太朗
Summary
? 推薦システムの基礎
○ コンテンツベースフィルタリング
○ 協調フィルタリング
? BigQueryMLで協調フィルタリングを用いたモデル作成?予測
? 膨大なコンテンツからユーザーの興味に合わせたものを提示
? どのコンテンツに価値があるかの特定を助ける
? 本、映画、ニュース など応用領域は多岐
推薦システム
プライバシー問題等、様々な課題を内包しているが、今回は議論しない
? ユーザー:膨大なコンテンツから興味にあったものを見つけられる
? サービス運営:利用者の体験向上
推薦システムの分類
? コンテンツベースフィルタリング (Content-Based Filtering)
○ アイテムの特徴に基づいて推薦
○ 新しい商品でも推薦可能
? 協調フィルタリング (Collaborative Filtering)
○ 他人の評価を参考に推薦
○ 新しいユーザ,商品には対応できない
? 統合アプローチ
似た嗜好の人が高評価
好きな俳優が出演して
いる映画
過去のレーティング情報を用いて特
徴の嗜好を推測
コンテンツベースフィルタリング
? 嗜好にあった特徴を備えたアイテムを推薦
映画 :監督、俳優、ジャンル、受賞歴、配給会社
ニュース:タイトル、ジャンル、本文キーワード
嗜好データ
ジャンル:サスペンス
俳優:デニーロ
私
『アンタッチャブル』(1987)
禁酒法時代のシカゴを舞台に、ギャングのボス、アル?カポネ(ロバート
?デニーロ)と合衆国財務官の攻防を描く、クライムサスペンス。ブライ
アン?デ?パルマ監督作。
協調フィルタリング
映画の趣味の合う友人 A
そこまで合わない友人 B
是枝裕和監督の最新作
よかったよ
新海誠監督の最新作
よかったよ
? 過去のレーティング情報を用いて嗜
好のマッチ度合いを計算する
私 是枝監督の最新作を推薦
推薦システム
? 5段階評価、未評価は「?」
? 未評価のうち最も評価が高いと推定できる映画を推薦
映画1 映画2 映画3 映画4
私 4 ? 2 5
A 4 5 2 5
B ? 1 5 2
協調フィルタリング
私に映画2を推薦する
高評価、低評価が同じ → 嗜好が似ている
? 類似度の定量化 → 相関係数、コサイン類似度 ..
? 行列分解による近似
推薦システム
フィードバックの分類
? 明示的フィードバック:ユーザーに質問して回答を得る
○ ユーザーが映画をレーティング
? 暗黙的フィードバック:ユーザーの行動から評価を推測
○ ユーザーがその映画を閲覧した時間
○ ソフトを購入したかどうか
明示的獲得 暗黙的獲得
データ量 少 多
正確度 高 低
未評価と不
支持の区別
明確 不明確
認知 認知 不認知
協調フィルタリング
? 類似度に基づく手法
○ 商品数、ユーザー数が膨大で疎なデータには難しい →次元削減が必要
? 行列分解に基づく手法
○ アイテム評価行列を低次元行列 U, Vに近似
岩田具治「機械学習に基づく推薦システム」p.11
https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf
疎な行列
使用データセット(映画のレーティング)
1 million ratings from 6000 users on 4000 movies.
Released 2/2003.
https://grouplens.org/datasets/movielens/1m/
映画タイトル(1920年代 - 2000年)
レーティング情報
MovieLens | https://movielens.org/home
Demo
使用したNotebook:
https://github.com/kootr/ml-study-session/tree/main/20220730_reccomendation_mf
補足: BigQuery スロット
model_type='matrix_factorization' 指定のために、スロット購入が必要(コミット期間は: FLEX)
補足: BigQuery スロット
予約作成
補足: BigQuery スロット
割り当ての作成
補足: BigQuery スロット
クエリの実行
補足: BigQuery スロット
割り当て、予約の削除
補足: BigQuery スロット
コミットメントの削除
結果
my ratings predicted ratings(知らない映画ばかりでした )
- 神嶌 敏弘 「推薦システム」
https://www.kamishima.net/archive/recsys.pdf 
- BigQuery ML を使用して映画の評価に基づきレコメンデーションを行う
https://cloud.google.com/bigquery-ml/docs/bigqueryml-mf-explicit-tutorial
- 岩田具治「機械学習に基づく推薦システム」
https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf
参考

More Related Content

BigQuery MLの行列分解モデルを 用いた推薦システムの基礎