狠狠撸

公司の中の経済学
2018 November 23-25
CyberAgent, Inc. All Rights Reserved
1

自己紹介
名前 : 金子雄祐
職業 : データサイエンティスト
経歴:
2012年東京大学文科II類入学
2016年東京大学経済学部卒業
2018年東京大学経済学研究科統計学コース卒業
2018年 CyberAgent入社．アドテク本部へ配属
使用言語 : Python, R , SQL, (Scala , Go , Spark)
blog :
https://cold-start-problem.hatenablog.com/
趣味 : Kaggle (Kaggle Expert)
2

今日の話の流れ
1. Tech企業と経済学
2. 経済学と因果推論
3. インターネット広告とは何か？
a. アドテクとはなにか？
b. 広告が表示されるまでの流れ(RTB)
4. アドテクと因果推論
a. アドテクとRCT
b. AIと因果推論
5. サイバーエージェントでの研究事例紹介(Off-Policy Evaluation)
6. まとめ + 余談
3

会社について
4
サイバーエージェントの事業一覧
ここの仕事をしてます

経済学者を雇うTech系企業
6
ネット広告関連企業

実際の求人例(FB)
7
● FBの求人
● 求人内容
1. 研究者
2. 経済学
3. 実験設計
4. 因果推論
1
2
3
4

実際の求人例(MS)
8
● MSの求人
● 求人内容
1. 研究者
2. 経済学
3. 因果推論
4. 計量経済学
5. 機械学習(人工知能)
１
3
4
2
5

求人例から見えること
9
● 経済学系の研究者の求人(基本的に研究者だと CS系，統計系，経済系の求人が多い )
● (計量)経済学 + 因果推論
● (計量)経済学 + 機械学習
研究者
経済学
因果推論
計量経済学
機械学習
経済学と因果推論，そして機械学習 (人工知能)がどう関係するのか？

例: 東大入学に効果はあるか?
11
Q: 東大に入学したら平均年収は上がるのか？
平均年収
600万円
平均年収
500万円
東大入学
他大学入学
この差が
入学の効果？

例: 東大入学に効果はあるか?
12
● 他の理由が入学と年収に効果を与えている可能性がある (例 : 親の年収，遺伝 etc …)
● この場合，年収の差そのままが東大入学そのものの因果効果とは言えない
● つまり，東大入学と年収には相関関係があるが，それは因果関係とは解釈できないということ
○ それではどうやって比較するのか？
年収 ↑
年収 ↓
Other Reasons
(親の年収 , 遺伝 etc)

方法1 : RCT
13
● １つの方法は，「学生をランダムに東大 or 他の大学に入れる」という実験をすること
○ ランダムにすれば，大学入学以外が年収に与える要因は消える
○ この方法はRCT(ランダム化比較試験 )と呼ばれる
● しかし実際には大学入学のようなケースでこのような実験は社会的に実施不可能
○ 社会的なコストが高すぎる． RCTを実施できないケースは社会に溢れてる

方法2 : 因果推論
14
● もう１つの方法は，因果推論という手法を用いること
○ RCTが実施できないケースは社会に溢れているため，特に (計量)経済学で発展してきた
● 例えば，以下のようなやり方で同じような質の学生を比べる
○ 親の年収や能力などが同じような学生のみを上手く抽出して差を調べる
○ 東大にギリギリ落ちた学生とギリギリ受かった学生の差を調べる
同質
入学効果は
+5万円 !
因果推論

15
インターネット広告とは？

Webページ内の広告
16
● 2018年ノーベル経済学賞の記事
● 赤い枠線内の部分がインターネット広告
● 掲載メディアのインセンティブ
○ 広告がクリックされると金銭
○ 従って，興味を惹く記事を出したい
● 広告をどんな仕組みで出しているのか？
● ネット広告が満たすべき性質
○ 即座に広告を出さないといけない
○ クリックされやすい
○ 広告内容( = 商品)への興味を惹く
● 上の問題をテクノロジーで解決する
= 広告(アド) × テクノロジー = アドテク
出典:https://www.yomiuri.co.jp/economy/20181008-OYT1T50089.html
これが広告

広告表示の流れ(RTB)
17
出典:https://www.yomiuri.co.jp/economy/20181008-OYT1T50089.html
<タグ>
● 広告が表示される場所(=広告枠)
● いわゆるタグが埋め込まれている
● 箩补惫补蝉肠谤颈辫迟などのプログラムで动作

18
<タグ>
SSP
● サイトへアクセスがあると、リクエストが送信
● SSPという広告取引のためのオークション主へのアクセスが行われる．

19
<タグ>
SSP
DSP
DSP
DSP
● SSPがDSP(=広告自動配信
システム)に入札リクエストを
送る．
● 入札リクエストの中身
○ 表示日時
○ 表示サイト
○ ユーザーのOS
○ ユーザーのデバイス
● 各DSPは様々な企業と契約
○ 広告クリックなどでDSP
は企業から金銭を得る

20
<タグ>
SSP
DSP
DSP
DSP
クリック率: 0.5%
入札額: 80円
クリック率: 1%
入札額: 100円
入札額: 150円
過去のクリック情報から機械学習でクリック率予測を行い入札額を決定
Bid = CTR × Value
● Bid = 入札額
● CTR = 予測クリック率
● Value = クリックの価値

21
<タグ>
SSP
DSP
DSP
DSP
入札額: 80円
クリック率: 1%
入札額: 100円
入札額: 150円
入札額を送信し勝者が 2番目に高い額で落札，広告表示．クリックされたメディアにも金銭
= 第２価格オークション (今回は触れないが，経済学理論に基づくもの )
100円
80円
150円

22
アドテクと因果推論

アドテク企業でのRCT
24
● そもそも海外のアドテク企業では RCTを盛んにやっている
○ 広告のサイズを変更した時にクリックは増えるのか？
○ デザインを変えた時に検索はどうなるのか？
● 上記の項目は全て企業の収益に直結する上に，RCTを行うのは特にネットでは容易
● しかし，ネットでもRCTが出来ない例がいくつか有り，その一つが AIの評価
○ そもそもAIとは？
1000 test/day
200 test/day

AIとアドテク
● 今はAI全盛の時代(例: ビッグデータ , ディープラーニング etc … )
● アドテク業界でもAIは用いないといけない(大量のリクエスト処理のため)
○ クリック率の予測 + 何円で入札するか?
○ クリック後の商品購入率の予測 + どんな広告を出すか? 25
”AI”とは？
AI = 機械学習による予測モデル + 意思決定ルール

例 : AIの更新
26
x
candidates
a,b,c,d
b Y_b
● ユーザーに対して広告画像を表示する
● ユーザーの情報Xを得て、選択肢{a,b,c,d}に対してクリックされるか否かの予測を行う。
● 予測クリック率が最大の選択肢を選ぶ
● クリックされたか否かの結果 (Y)を観測する
● 選ばれなかった画像に関しての結果は観測不能
Predict + decision
AI
Y_a 観測不可能a

例 : AIの更新
27
x
candidates
A = {a,b,c,d}
b Y_b
Predict + decision
dataset
X, A, Y
x
candidates
A = {a,b,c,d}
b Y_b
Predict + decision
モデルの学習と更新
1日この仕組みを回す
翌日は更新したモデルで回す
データの蓄積

例 : AIの更新
28
x
candidates
A = {a,b,c,d}
b Y_b
Predict + decision
dataset
X, A, Y
x
candidates
A = {a,b,c,d}
b
Predict + decision
1日この仕組みを回す
更新したモデルで回す
データの蓄積
new system
c
蓄積されたデータから
新AIを作る
→ 旧AIと新AIの比較を
どうすればいいのか？

AIの評価と因果推論
29
● AIの評価も本当はRCTで行いたい
○ しかし，AIの試したいパターンというのは上記の通り何通りも存在する
○ 非常に多くのユーザーや広告がいるアドテク市場だと，その組み合わせは何十万通りにも
● これらのAIをRCTで評価しようと思うと非常にコストがかかる
1. 効果がわからないAIを実際のシステム上で動かさないといけないリスク
2. 実験のための十分なサンプルを得られない
● つまり，AIのRCTは企業にとっても非常にコストがかかる
○ 低コストでかつAIの評価を正しくできる方法はないのか？ → 因果推論！
too many patterns...

Off-Policy Evaluation
31
● 過去ログに対して新規のAIに意思決定を行わせる
○ つまり新規AIを実システムで運用する必要がない
○ したがって，コストが低く済む
● 意思決定が一致する物は結果の観測が出来る
● 結果が一致しない物は観測が出来ない
○ いわゆる欠測変数の問題
X 結果
X1 1 a d
X2 1 d d
X3 0 c c
X4 1 a a
X5 1 b c
評価
-
1
0
1
-
旧新
AI

32
● 旧AIと新AIの性能を比較したい
● 旧AIについては全ての観測値が得られる
○ 旧AIについては、得られている結果について全
て平均を取れば性能になる
X 結果
X1 1 a d
X2 1 d d
X3 0 c c
X4 1 a a
X5 1 b c
評価
-
1
0
1
-
旧新
AI

33
● 新AIについては、左の赤い部分のみ観測可能
○ 赤い部分についての結果のみ平均して平均を取
ればいい?
● 左の赤い部分は，全体のデータからのランダムサンプ
ルになっているわけではない
○ よって因果推論が必要に
○ 理論的には、Inverse Propensity Score、
Doubly Robust Estimationなどの手法を使う
X 結果
X1 1 a d
X2 1 d d
X3 0 c c
X4 1 a a
X5 1 b c
評価
-
1
0
1
-
旧新
AI

OPEのメリット
34
● 左はイェール大学と CAの共同研究論文
(AAAI 2019 accepted)
○ OPEにおいて，統計的に最もバラツキが
少ない推定手法を提案
○ つまり．画像選択アルゴリズムの機能が
より改善するような手法を提案
● 論文内では，CAの実際の広告配信データを
使って効果を検証
○ 従来手法に比べて広告のクリック率が約
10 ~ 15%上昇するという検証結果になっ
た
Yale 助教授 CA researcher

OPEのメリット
35
● OPEには，以下のようなメリットがある
1. 日々蓄積される旧AIの過去ログを使えば良いので新 AIの実装コストが低く済む
2. 効果のわからないAIを実際に運用するリスクを回避できる
3. 擬似的なRCTも可能．つまり，選択肢の評価も同時に可能．
■ 1つの画像のみを選択する AIをa ~ dの4つ分用意してOPEの結果を比較すれば良い
● このように，サイバーエージェントでは因果推論 & 経済学でAIの改善を行なっている

日本のTech企業と経済学
37
Q: 海外のtech企業では経済学者を雇うけど日本ではどうなの？
海外日本
● 残念ながらCAを除いてほとんどないのが現状
● CAのアドテクスタジオというアドテク部門の中に AI Labという研究組織がある
○ 国内には珍しく，経済学部門が存在
○ AI Labには他に画像認識部門や機械学習部門、ロボット部門などが存在

余談
2018年の論文:
テクノロジー企業における経
済学者(と経済学) 38
Susan Athey:
マイクロソフトの主任経済学者
スタンフォード教授
経済学 × AIの分野の第一人者

余談
39
● 今年のKDDという機械学習のトップレベルの世界会議
● 人工知能系の最高レベルの学会の基調講演者がノーベル経済学賞受賞者の Alvin Roth
● 2015年はSusan Atheyも基調講演
● こんな感じで，Computer Science と経済学の融合は海外で特にすごく進んでいる

余談
40
● 少なくとも広告/アドテク系ならしばらくは食いっぱぐれない気がする
○ アドテク業界なら先述の定義の AIはまず無くならないし，となると AIの評価もしたい
○ あとは広告の因果効果とかもみんな気になってる（そういう研究もあります）
○ 実際，海外の機械学習系の学会でも因果推論 + 機械学習は流行りつつある
● 大学でやる研究と民間企業でやる研究の違い
○ (そもそも僕は研究やってないですが )金になるテーマをやんないといけないのが大変かも
○ 要は業界について理解してないと「何が金になるか」もわからない
○ その上で，大学の先生などと連携して研究とかなるとハードだと思います
○ 金になる研究を探すのにも経済学的なセンスが役立つと思います
● 特にプログラミングやってこなかったのに 1年目にコード書くの辛くないの
○ 結構楽しい
○ なんだかんだ企業入ったら頑張って仕事することが勉強になります
● 今後どんな研究あると思う
○ 「より大きな因果効果を得られる選択肢は何か？」を探すという話になると思います
○ 今から頑張るならそういう視点で研究してみるのもありかも
Q. 企業で経済学やるって実際どうなの

狠狠撸

公司の中の経済学

More Related Content

公司の中の経済学