狠狠撸

狠狠撸Share a Scribd company logo
Ken Takao
Infrastructure Manager, CyberAgent Inc.
Presented by:
広告におけるビッグデータの分析事例
Takayuki Kawabata
Senior Data Scientist, CyberAgent Inc.
Agenda
About CyberAgent
What is Ad Tech Studio
Overview our BigData Platform
Tableau in AdTech Studio
Connection with QuickSite
How analyze data byTableau
Future of our Business Intelligence
広告配信のビッグデータを
TABLEAUを使って可視化する!
Ken Takao/鷹雄 健
CyberAgent Inc./株式会社サイバーエージェント
AdTech Headquaters/アドテク本部
Technology Strategy Department/技術戦略室
Central Infrastructure Agency Group/シーアイエー
Infrastructure Manager/インフラマネージャー
Takayuki Kawabata
/ 川端 貴幸
CyberAgent Inc./株式会社サイバーエージェント
AdTech Headquaters/アドテク本部
Technology Strategy Department/技術戦略室
Scientific Advertising Team/SAT(サット)
Senior Data Scientist/シニアデータサイエンティスト
About CyberAgent
Our Vision
事业内容
What’s AdTech Studio
简易版アドテクマップ
サイバーエージェントのアドテクマップ
AdTech Studio
Overview our BigData Platform
? MySQL いっぱい
? Hadoop Platform(CDH,MAPR) 数十PBのデータストア
? BigQuery 数百TBのデータストア
? Redshift 約10クラスター 全体で約100ノード
? Matrix(旧Paraccel) SSDで約100TBのクラスター
データソース
データベースの全体図
Tableau in AdTech Studio
? Tableau Server
35
現在のライセンス数
? Tableau Desktop
26
? 技術戦略室で1ライセンス購入。 ↓
? 多プロジェクトでも試用版ライセンスで急激に広まる。 ↓
? アドテクサミット(明日会議)でデータ戦略の一つとして↓
Tableau Desktop,Tableau Serverの導入が決まる。 ↓
? アドテクスタジオの共通費として購入し、基本だれでも
Tableauを使えるように!
どうやって導入したか?
社内のポータルサイトから申请
広告におけるビッグデータの分析事例
? 基本的にサーバーサイドエンジニア、データサイエンティスト
がDashboardを作成します。
用途としてはプロダクトマネージャー?営業用のレポートを作
成したり、開発時や運用時のデータを利用してアルゴリズム
を考え、実装してその結果を確認したりします。
Tableau Desktop
? Tableau Desktopで作成されたDashboardをTableau Serverへ
パブリッシュし、Tableau Serverでレポートの閲覧などを行い
ます。
またTableau 9から利用できるサブスクリプション機能を利用
してメールでのレポート通知なども行っています。
Tableau Server
? AMoAdはCyberAgentとDeNA社が出資するスマートフォン広
告用アドネットワーク会社です。
Tableauは主にBigQueryと連携して利用しており、
分単位での配信データの表示を行い、広告配信の最適化の
参考にしています。
AMoAdの事例
Connection with
QuickSight
How analyze data by Tableau
? データサイエンティストがデータを分析する上で、
Tableauをどのように使っているかの一例を紹介します
? あくまで課題を解決するためのデータ分析であり、ダッシュ
ボード的なきれいなグラフを作っているわけではありません!
どのようにTableauをつかっているか
あるプロダクトの
ダッシュボード例
? Scientific AdvertisingTeam
? アドテクスタジオにある複数のプロダクトのデータ分析に
ついて横断的に担当する組織
? 主な業務
– ネット広告のClick予測モデルの作成
– DSPの入札ロジックの開発
– ユーザのデモグラ推定
– etc
SATについて
Tableau ServerがSATと各プロダクトを繋ぐ
データソースの違
いを透過的に
可視化したグラフ
の共有を楽に
? ビジネスサイドからはCSVファイル
? あるプロダクトはMySQL
? 別のプロダクトはRedshift
? また別のプロダクトはBigQuery
? などなど
様々なデータソース
? Case 1:広告運用時の異常検知
? Case 2:DSPのBidロジック改善
? Case 3:位置情報の分析
? Case 4:ゲーム課金ユーザの分析
? Case 5:レベニューシェアの最適化
? Case 6:購買ユーザの予測
? Case 7:デモグラの推定
様々な事例
1. 課題感のヒアリング
2. ざっくりとデータ分析、可視化して課題を具現化
3. 課題を解決するロジックを試行錯誤
4. 提案するソリューションのオフライン検証/シミュレーション
5. データをセットにしてソリューションの説明
6. 実装&オンラインでのABテスト
7. レポーティング
8. 目標達成までPDCAを回す
一案件のだいたいの流れ
1. 課題感のヒアリング
2. ざっくりとデータ分析、可視化して課題を具現化
3. 課題を解決するロジックを試行錯誤
4. 提案するソリューションのオフライン検証/シミュレーション
5. データをセットにしてソリューションの説明
6. 実装&オンラインでのABテスト
7. レポーティング
8. 目標達成までPDCAを回す
一案件のだいたいの流れ
多くの場面でTableauを活用している
? Python + Matplotlib
? 生産性は倍は違う
? さらにTableau Serverでの簡単共有!
Tableau以前は
? Tableauのつかいどころ
– データが整形すでにされている
– 初見のデータ
– インタラクティブな分析が必要なとき
? Pythonでやるとき
– データが非整形
– 予測モデルなどの検討
– グラフ(ネットワーク)の可視化
– などなど
とは言え使いわけ
? Scatter Plot(散布図)
? Box Plot(箱ひげ図)
? クロス集計
? Binの作成
? パラメータ
? ページ
データ分析で良く使うもの
2変数間の相関を見るためにとにかくよく使う
Scatter Plot(散布図)
? Scatter Matrix
散布図行列が簡単に作れるとなお良い
変数のすべてのペアを
散布図にしたもの
平均や分散などサマリーだけ
でなく、データ全体を観察す
ることはともて大事
Box Plot(箱ひげ図)
分布の違いを比較するためによく使う
クロス集計
説明変数と目的変数の因果関係の可視化によく使う
Bin
連続変数のクロス集計
? インタラクティブな分析をする上でよく使う
? よくパラメータ化するもの
– ビンのサイズ
– 閾値
– 目標値
– 計算式の中のパラメータ
パラメータ
ページ
? 時系列な変化を確認するためによく使う
? ぱらぱら漫画みたいに動きをもって、ちょっとした変化が追える
事例紹介:DSPでのBidロジック改善
https://www.microad.co.jp/service/platform/innovative.php
DSPのビジネスモデル
適正な売値を見極めるために、クリックされ
る確率を正確に予測することが最も大事
Clickと相関の強いものは?
曜日×時間 デバイスタイプ別 離脱してからの
経過時間
※上のデータはKaggleで公開されているCTR予測コンペのもの
Click予測モデルの精度は?
従来の
モデル
新規の
モデル
Clickが得られたリクエスト Clickが得られなかったリクエスト
? ABテストの結果、
新しいロジックは売上が伸びたが、利益がでない…
問題の原因は細かく分割して診る
? 入札額を細かいビンに分けて利益を可視化
問題の原因は細かく分割して診る
? 入札額を細かいビンに分けて利益を可視化
問題の原因は細かく分割して診る
入札額が低いところの
ビンで問題あり
ABテストの結果をモニタリング
Daily, Hourlyでモニタリング,Tableau Serverでビジネスサイドと共有
? 指定した更新間隔で、データソースから集計したデータを自
動で抽出する
? リアルタイム性が必要ないものなどは、毎時の集計値の方
がメリットが大きい
– 特にBigQueryのようにクエリ課金のクラウドでは
モニタリングにはデータの抽出が便利
たくさんの抽出タスク
が登録されている
Future of Business Intelligence
? 今は部門の中でも、一握りの人しかTableauを使っていない
? そして、彼らは元々別の手段でデータ分析をしていた人が多
い
? ハードルが高いとこれまでデータ分析を避けていた人が,
Tableauを使うようになれば、真にデータに強い会社になる
? データサイエンティストが作ったワークブックをTableauサーバ
で共有していくことで、ビジネス?エンジニアにもTableauに興味
を抱かせていく!
データ分析のリテラシーをあげる
シミュレーションをTableauで
運用変数を変える
ことによるKPIの変
化をみてもらう
Viewの表示回数のランキングが便利
日別
時間別
ユーザ別View別
? チャレンジしたいこと
? レポートの修正?変更がデータサイエンティスト中心の作業に
? レポートの項目を少し変更したいだけでも、変更範囲、変更
に関わるエンジニアがそこそこ発生し、小さなPDCAは回らな
い現状
? 実現すればけっこうメリットは大きい
? ライセンス料金がデメリット(実質、コアライセンスが必要)
Tableau ServerのViewをプロダクト管理画面のレポートに埋め込む
Got feedback?
Please fill out the brief session
survey in the conference app.

More Related Content

広告におけるビッグデータの分析事例