狠狠撸
Submit Search
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
?
0 likes
?
445 views
幸
幸太朗 岩澤
Follow
BigQuery MLの行列分解モデルを用いて映画のレコメンドエンジンを作成しました。機械学習の社会実装勉強会 第13回の発表内容です。 <Attach YouTube link>
Read less
Read more
1 of 19
Download now
Download to read offline
More Related Content
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎
1.
BigQuery MLの行列分解モデルを 用いた推薦システムの基礎 2022/07/30 機械学習の社会実装勉強会第13回 岩澤
幸太朗
2.
Summary ? 推薦システムの基礎 ○ コンテンツベースフィルタリング ○
協調フィルタリング ? BigQueryMLで協調フィルタリングを用いたモデル作成?予測
3.
? 膨大なコンテンツからユーザーの興味に合わせたものを提示 ? どのコンテンツに価値があるかの特定を助ける ?
本、映画、ニュース など応用領域は多岐 推薦システム プライバシー問題等、様々な課題を内包しているが、今回は議論しない ? ユーザー:膨大なコンテンツから興味にあったものを見つけられる ? サービス運営:利用者の体験向上
4.
推薦システムの分類 ? コンテンツベースフィルタリング (Content-Based
Filtering) ○ アイテムの特徴に基づいて推薦 ○ 新しい商品でも推薦可能 ? 協調フィルタリング (Collaborative Filtering) ○ 他人の評価を参考に推薦 ○ 新しいユーザ,商品には対応できない ? 統合アプローチ 似た嗜好の人が高評価 好きな俳優が出演して いる映画
5.
過去のレーティング情報を用いて特 徴の嗜好を推測 コンテンツベースフィルタリング ? 嗜好にあった特徴を備えたアイテムを推薦 映画 :監督、俳優、ジャンル、受賞歴、配給会社 ニュース:タイトル、ジャンル、本文キーワード 嗜好データ ジャンル:サスペンス 俳優:デニーロ 私 『アンタッチャブル』(1987) 禁酒法時代のシカゴを舞台に、ギャングのボス、アル?カポネ(ロバート ?デニーロ)と合衆国財務官の攻防を描く、クライムサスペンス。ブライ アン?デ?パルマ監督作。
6.
協調フィルタリング 映画の趣味の合う友人 A そこまで合わない友人 B 是枝裕和監督の最新作 よかったよ 新海誠監督の最新作 よかったよ ?
過去のレーティング情報を用いて嗜 好のマッチ度合いを計算する 私 是枝監督の最新作を推薦 推薦システム
7.
? 5段階評価、未評価は「?」 ? 未評価のうち最も評価が高いと推定できる映画を推薦 映画1
映画2 映画3 映画4 私 4 ? 2 5 A 4 5 2 5 B ? 1 5 2 協調フィルタリング 私に映画2を推薦する 高評価、低評価が同じ → 嗜好が似ている ? 類似度の定量化 → 相関係数、コサイン類似度 .. ? 行列分解による近似 推薦システム
8.
フィードバックの分類 ? 明示的フィードバック:ユーザーに質問して回答を得る ○ ユーザーが映画をレーティング ?
暗黙的フィードバック:ユーザーの行動から評価を推測 ○ ユーザーがその映画を閲覧した時間 ○ ソフトを購入したかどうか 明示的獲得 暗黙的獲得 データ量 少 多 正確度 高 低 未評価と不 支持の区別 明確 不明確 認知 認知 不認知
9.
協調フィルタリング ? 類似度に基づく手法 ○ 商品数、ユーザー数が膨大で疎なデータには難しい
→次元削減が必要 ? 行列分解に基づく手法 ○ アイテム評価行列を低次元行列 U, Vに近似 岩田具治「機械学習に基づく推薦システム」p.11 https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf 疎な行列
10.
使用データセット(映画のレーティング) 1 million ratings
from 6000 users on 4000 movies. Released 2/2003. https://grouplens.org/datasets/movielens/1m/ 映画タイトル(1920年代 - 2000年) レーティング情報 MovieLens | https://movielens.org/home
11.
Demo 使用したNotebook: https://github.com/kootr/ml-study-session/tree/main/20220730_reccomendation_mf
12.
補足: BigQuery スロット model_type='matrix_factorization'
指定のために、スロット購入が必要(コミット期間は: FLEX)
13.
補足: BigQuery スロット 予約作成
14.
補足: BigQuery スロット 割り当ての作成
15.
補足: BigQuery スロット クエリの実行
16.
補足: BigQuery スロット 割り当て、予約の削除
17.
補足: BigQuery スロット コミットメントの削除
18.
結果 my ratings predicted
ratings(知らない映画ばかりでした )
19.
- 神嶌 敏弘
「推薦システム」 https://www.kamishima.net/archive/recsys.pdf - BigQuery ML を使用して映画の評価に基づきレコメンデーションを行う https://cloud.google.com/bigquery-ml/docs/bigqueryml-mf-explicit-tutorial - 岩田具治「機械学習に基づく推薦システム」 https://ibisml.org/archive/ibis2014/IBIS2014tutorial_iwata_color.pdf 参考
Download