狠狠撸

狠狠撸Share a Scribd company logo
Webと経済学:
経済主体の意思決定に影響する推薦システム
株式会社サイバーエージェント 秋葉原ラボ
數? 拓朗
WWW-2019 论?読み会
??紹介
l 數? 拓朗(かずみたくろう)
? 技術本部 秋葉原ラボ
? 経済学(博?) → 現職
l おしごと
? ?然?語処理技術を利?したプロダクトの開発
l しゅみ
? スマブラSP
? サッカー
? 漫画?アニメ
2
取り上げる論?と問題意識
l ゲーム理論の視点から?た推薦システム
? Immorlica, N. Mao, J. Slivkins, A. Wu Z. S. 2018
Bayesian Exploration with Heterogeneous Agents
l 本発表では、状況設定や問題意識の注?して、推薦システムを
ゲーム理論を通じてどのように解釈しているかを明らかにします
3
はじめに
4
はじめに:経済主体の意思決定への介?
l 経済主体の意思決定に影響を与えるとは?
5
商品を売りたい店員 商品の購?を検討している客
商品の性能
他店の価格
etc.
ニーズ
①推定
コミュニケーションによって経済主体の予想を変化させる
②メッセージの選択
③?動の選択
購? or not
はじめに:経済主体の意思決定への介?
6
情報提供者
1. 必ず役?つ
2. おそらく役?つ
3. 役に?たない
シグナルの選択
l 情報提供者のメッセージ = シグナル
意思決定者
③?動の選択
タイプ
情報提供者の期待利得を最?するシグナル = 最適シグナル
推定
メカニズムデザインと意思決定のフロンティア:第4章「最適シグナル」より
はじめに:最適シグナルの分析例
l ユーザのタイプは最適シグナルにどのような影響を与えるか?
? ユーザのタイプが公開されているケース
? ユーザのタイプがゲームが進?するにつれて公開されるケース
? ユーザのタイプが秘匿されているケース
l 意思決定者にある?動をとらせたい場合、どのような情報提供が
必要か?
? 情報提供者による推奨?動以外をとるインセンティブが、意思決定にない
ことを前提とする
7
はじめに:インターネットサービスの解析例
l 推薦システム
? [EC 2016] Moansour, Y. Slivkins, A. Syrgkanis, V. & Wu, Z. S.
“Bayesian Exploration: Incentivizing Exploration in Bayesian Games”
? [WWW 2019] Immorlica, N. Mao, J. Slivkins, A. Wu, Z. S.
“Bayesian Exploration with Heterogeneous Agents”
? 情報提供者 = 推薦システム、意思決定者 = ユーザ、シグナル = ?動履歴
l インターネット広告:広告(出稿位置やデザインなど)
? [JPE 2010] Ryao, L. & Segel, I. “Optimal Information Disclosure”
? 情報提供者 = 広告プラットフォーム、意思決定者 = ユーザ、シグナル = 広
告?デザインなど
8
具体例
9
推薦ゲーム:設定
l 状態?タイプを考慮しながら、ユーザに?動を推奨する
10
1. 起こりうる状態の集合 : Ω = ?$, ?&
2. 選択可能な?動の集合 : ? = ?$, ?&
3. ユーザのタイプの集合 : Θ = ?$, ?&
4. ユーザの利得関数 : ?(?-, ?., ?/)
5. 状態の事前予想の確率分布 : ?? ∈ ? Ω
6. タイプの事前予想の確率分布 : ?? ∈ ? Θ
以下のケースでは、 ?? ?$ =
&
7
, ?? ?$ =
&
7
と考える.
推薦ゲーム:設定
11
主体 ?動
1 意思決定者 タイプ ?$, ?& を持つユーザが推薦ゲームに参加
2 情報提供者 ??の期待利得を最?にするような推奨?動を意思決定者に提?
3 意思決定者 メッセージを受け取り、利得が最?になる?動?を選択
4 情報提供者 意思決定者の選択した?動と利得を観察
主体 ?動
1 情報提供者 R1のシグナルより、状態と意思決定者のタイプについての信念を更新
2 情報提供者 ??の期待利得を最?にするような推奨?動を意思決定者に提?
3 意思決定者 メッセージを受け取り、利得が最?になる?動?を選択
4 情報提供者 意思決定者の選択した?動と利得を観察
Round 1
Round 2
推薦ゲーム:Round 1
l 具体的に、利得は以下のように設定
l Round 1
12
?$ ?&
?$ 3 4
?& 2 0
?$ ?&
?$ 2 0
?& 3 4
?$のとき ?&のとき
?$を推奨したときの期待利得 : ?? ?$ 3 ?? ?$ + 2 ?? ?& + 1 ? ?? ?$ 2 ?? ?$ + 3 ?? ?& ①
?&を推奨したときの期待利得 : ?? ?$ 4 ?? ?$ + 0 ?? ?& + 1 ? ?? ?$ 0 ?? ?$ + 4 ?? ?& ②
∴ ?? ?$ =
&
7
, ?? ?$ =
&
7
より,①>②.推薦システムの最適シグナルは?動?$
? ?が実現すると考えている確率
? ?が実現すると考えている確率
? ?が実現したときのユーザの期待利得 ? ?が実現したときのユーザの期待利得
推薦ゲーム:Round 2
l タイプの秘匿は最適シグナルにどのような影響を与える?
l ユーザのタイプが明かされているとき:
? ユーザのRound 1における報酬とタイプから、推薦システムは?$と?&のど
ちらの状態が実現したかを知る
? ユーザのタイプに応じて最も報酬の?い ?$, ?& もしくは ?&, ?& を推奨で
きる
l ユーザのタイプが明かされないとき:
? 推薦システムの状態についての情報が更新されずに、 ?Cを推奨し続けるこ
とになる
13
おわりに
14
まとめと雑感
l まとめ
? 最適シグナルの観点から推薦システムの理論的解析を試みた論?を紹介
? 情報提供者を推薦システム、意思決定者をユーザ、シグナルをユーザ?動
履歴と解釈
l 雑感
? 今回の論?は、理論的解析にのみスポット
? ゲーム理論の視点がインターネットサービスを良くする?
? Uberの「謝罪モデルと実証分析」論?(Halperlin, et al., 2018)のように、インターネッ
トサービスにおける現象(情報の?対称性など)をモデル化し施策につなげた例
15

More Related Content

Webと経済学 數見拓朗