論文紹介 "budget constrained bidding by model free reinforcement learning in display advertising"
1. 論文紹介
“Budget Constrained Bidding by Model-free
Reinforcement Learning in Display Advertising”
2019/02/08
サイバーエージェント
アドテク本部 AI Lab
宮西 一徳
2. 論文概要
“Budget Constrained Bidding by Model-free Reinforcement Learning in Display Advertising”
予算内で広告入札の最適なポリシーを探す
?モデルフリーな強化学習
?効率的な報酬関数の設計
?DQN拡張の実装
27th ACM International Conference on Information and Knowledge Management (CIKM 2018)
にて発表された論文
(Alibaba Groupの人たちの論文)
このカンファレンスのテーマは
"From Big Data and Big Information to Big Knowledge"
23. で入札額を決める
提案手法(フレームワークとして)
Deep Reinforcement Learning to Bid(DRLB)
適応的ε-greedyに従って
行動を選択
=λを調整する
ステップtの結果
報酬と状態が得られる
①
②
③
報酬を推定する
別のDNN
Di Wu, et al. "Budget Constrained Bidding by Model-free Reinforcement Learning in Display Advertising" (CIKM '18)
24. で入札額を決める
提案手法(フレームワークとして)
Deep Reinforcement Learning to Bid(DRLB)
適応的ε-greedyに従って
行動を選択
=λを調整する
ステップtの結果
報酬と状態が得られる
①
②
③
報酬を推定する
別のDNN
状態
1 現在時刻
2 残予算
3 λの残り調整回数
4 予算消化率
5 t-1からtの間の勝ったimpでのCPM
6 勝率
7 t-1時点での勝ったimpのトータル
価値(総クリック数とかCV数とか)
Di Wu, et al. "Budget Constrained Bidding by Model-free Reinforcement Learning in Display Advertising" (CIKM '18)