狠狠撸

狠狠撸Share a Scribd company logo
Summit
Developers
Developers Summit 2013 Kansai Action !
ソ ー シ ャ ル ゲ ー ム の デ ー タ サ イ エ ン ス
越智修司
KLab株式会社
ビジネスデベロップメント部
マーケティンググループ
#kansumiB3
B3
Summit
Developers
#kansumiB3
自己紹介
?越智 修司(神戸市在住)
?ビジネスデベロップメント部
マーケティンググループ所属
?エンジニア?プログラマ
? Felica/Edy,ガラケサイト,銀行アプリ,きせかえ
? アプリ?サービスのプロトタイピング
? 有名アーティスト?アイドルのファンクラブアプリ開発
? iOSアプリ開発(プライベートで継続中)
? python,Rなど
@ponpoko1968
Summit
Developers
#kansumiB3
作ったもの
「クリップリーダー」
?電子書籍リーダー
? 自炊PDFに特化
? evernote連携
? 段組書籍
「勤怠くん」
勤怠メールを素早く送信
iPhone版
(無料)
iPad版
(85円)
「SweetHome」
??「帰る」メールをジオフ
ェンス技術で自動送信
「あとも」
? PM2.5アプリ
Summit
Developers
#kansumiB3
はじめに
? データ分析重要らしい
? 何から手をつけて良いかわからない
? 体制は?
? 技術選定は?
我々がおかれた条件と過程を中
心に説明します。
Summit
Developers
#kansumiB3
KLab
? 2000年設立(筆者は9年目)
? 入社時は100名強→669名
? 歴史
? 携帯アプリ
? モバイルサイト+プロダクト
? ソーシャルゲーム ← イマココ
Summit
Developers
#kansumiB3
大阪事業所もあります
Summit
Developers
#kansumiB3
43サイト(分析対象
分)
数千万PV/日/タイトル
KLabのソーシャルゲーム
2年で13サイト増加
Summit
Developers
#kansumiB3
組織
技術
データ
Summit
Developers
#kansumiB3
組織
Summit
Developers
#kansumiB3
経緯
? ボトムアップ的に発達
? レポートWebが必要
? もっと詳細な分析の必要
? 技術者が自発的に開発を始めた
? 平行して企画者によるKPIチームが発足
? 統合
Summit
Developers
#kansumiB3
分析チーム
? 約10名
? 技術者チーム(2名は大阪勤務)
? 分析インフラ構築
? 新規案件対応
? 自動化
? KPI分析チーム
? 運営チームのコンサル
? 社内案件の傾向分析
? コンテンツ間のノウハウ共有
Summit
Developers
#kansumiB3
データサイエンティスト
ITスキル
プログラミング
データベース
ビジネススキル
マーケティング
統計学
データマイニング
機械学習
Summit
Developers
#kansumiB3
バックグラウンド
? 統計学の経験あり
? モバイルサイト?ソ
ーシャルゲームの開
発経験
? ECサイトのマーケテ
ィング経験
? モバイルサイトのデ
ィレクター
技術者チーム KPI分析チーム
Summit
Developers
#kansumiB3
現状:
ヒューリスティックス >サイエンス
Summit
Developers
#kansumiB3
ミッション定義
? 自社コンテンツの価値向上
? おもしろさ/遊びやすさ
? + 継続性
? = 収益性
? まずは定量的な状況?傾向を把握すべし
Summit
Developers
#kansumiB3
現在のステータス
データ分析をやっているチームがあるら
しいが直接役に立つイメージでもない
ゲームの数字について知りたいとおもっ
たら、分析チームに依頼すれば何かしら
出してくれるようだ
アウトプットを継続
Summit
Developers
#kansumiB3
技術
Summit
Developers
#kansumiB3
データ分析基盤(1)
分析システムコンテンツ側システム
S3
Log
Log
MySQL
Log
Sales
0100100100
0111001100
1110111110
11111111
0100100100
0111001100
1110111110
11111111
EMR!
RDS
Log
Sales
Summit
Developers
#kansumiB3
データ分析基盤(2)
? 基盤部分はほぼ内製
? AWS上に構築
? データウェアハウス(原データの保管所)
? S3
? データ集計
? EC2
? データマート(集計済みデータ、一次加工後のデータ保管所)
? RDS(MySQL) → redshift
? ビッグデータ解析
? EMR(elastic map reduce)
? ログ解析など
Summit
Developers
#kansumiB3
使用言語は?
Summit
Developers
#kansumiB3
Python
Python使っている方は?
Summit
Developers
#kansumiB3
Why Python?
? 保守性
? 習得の容易さ
? 速度
? 汎用言語の中では最も統計処理が得意
? 詳しい人が社内にいる(重要)
? 気が向いたらコードを添削してプルリクエスト
してくれるなど
Summit
Developers
#kansumiB3
データ分析と言えば、
Rなんじゃない?
Summit
Developers
#kansumiB3
Python vs. R
? Pythonの利点
? 汎用言語であるため統計以外のソフトウェア資産も豊富
? AWS関連
? 単一の言語で完結できる
? 保守性
? Rの利点
? 可視化処理
? アドホックなデータ操作
? 探索的データ解析に適している
KPIの発見?検討には、RやSPSSも使って
います
あくまで組織のおかれた状況次第ってと
ころはあります。
Rに詳しい人がいて、Rの欠点を補えると
判断できればRの方が良いかも。
Summit
Developers
#kansumiB3
Pythonライブラリ
? S3操作
? boto
? mapreduce/hadoop
? mrjob
? numpy
? pandas
? R風のデータ操作?加工
Summit
Developers
#kansumiB3
まずはデータ収集
? 自社サイトからのデータ収集
? ETL
? Extraction
? Translation
? Loading
Summit
Developers
#kansumiB3
分析システムコンテンツ側システム
S3
Log
Log
MySQL
Log
Sales
0100100100
0111001100
1110111110
11111111
0100100100
0111001100
1110111110
11111111
EMR!
RDS
Log
Sales
ETL
ETL処理
Summit
Developers
#kansumiB3
ETL
? アクセスログ解析
? DAUの抽出
? iOS/androidのシェア分布
? 地域?国の分布
? ゲーム用RDBからのデータ抽出
? レベル?アイテム所持状況など、刻々変わるもののスナッ
プショットを取る
? ゲーム共通なデータ抽出はライブラリ化して分析チームが担当
かつてはゲーム開発チームが担当。
スキーマ設計やフレームワークなども各
チームで試行錯誤しているため、
案件毎に前回の反省を踏まえ改良が入
る。
差異を吸収するのが結構大変
Summit
Developers
#kansumiB3
チーム発足当時、すでに10数
サイト
↓
とても面倒
急速に成長したため、システム
が乱立
同工異曲ではない
カオスな状態に
Summit
Developers
#kansumiB3
ETL
? ゲームシステムの理解
? ヒアリング
? 事前準備?交渉
? スキーマ設計
? ログ形式
Summit
Developers
#kansumiB3
商用プロダクト使ってないの?
? 使っています
? KPI分析チーム
? 最終工程など
? レポート作成
? SPSS Modeler
? Microsoft Excel
Summit
Developers
#kansumiB3
データ
Summit
Developers
#kansumiB3
どんなデータを集計しているの?
? DAU
? 継続率
? 仮想通貨売り上げ
? インストール数/日
? チュートリアル進度
? レベル
? ギルド?友達
? イベント参加状況
? プロモーション効果
業務データベースの中身は変わるので、ス
ナップショット重要
Summit
Developers
#kansumiB3
アウトプット
? レポートWeb
? KPIメール
? 月次レポート
? 独自テーマのレポート
? 運営チームからの依頼
? 自発的
? データダウンローダー
Summit
Developers
#kansumiB3
レポートWeb
? アクセス制限
? 時系列グラフ
? ゲーム别?全体
Summit
Developers
#kansumiB3
KPIメール(1)
? 一日一回送信
? 全体?OS別集計(iOS/android)
? Excelシート添付
? 運営チームの報告書作成に
活用
Summit
Developers
#kansumiB3
KPIメール(2)
gmail/GoogleAppsを導入してい
るので手軽に閲覧可能
Summit
Developers
#kansumiB3
月次レポート
? プロデューサー、経営層向け
? 主要KPIの動向報告
? レポートWeb、KPIメールと異なり、担
当の傾向分析が盛り込まれる
Summit
Developers
#kansumiB3
独自レポート
? 月次レポート等を作成する過程で浮かび上がった課題を掘り下げ
る
? 例
? ユーザ層のクラスタリング
? レベル(習熟度)
? 課金額
? S-in後の初動調査調査
? 定着率
? チュートリアル突破状況
Summit
Developers
#kansumiB3
例)コンテンツの収益性可視化
課金率
ARPPU
コアユーザ多い
優良だが小規模
要てこ入れ
カジュアル
Summit
Developers
#kansumiB3
分析軸の重要性
? 売り上げ?DAUの減少
? 一律に減ることは少ない
? 要因となるクラスタが存在
? いかに豊富な分析軸をもつか
Summit
Developers
#kansumiB3
課題
? 信頼性の向上
? リアルタイム性の向上
? 可視化?レポーティングの強化
? コスト削減
? スマートフォン対応
? 問題解決型から、問題発見?提案型へ
Summit
Developers
#kansumiB3
ソリューション
? BIツール導入
? クラウド型解析ツール
? 组织改革
Summit
Developers
#kansumiB3
BIツール導入
? 目的
? コスト削減
? リアルタイム性向上
? 信頼性向上
? 自社サーバに設置するタイプ
? Tabreau
? pentaho
? 自社スキーマに合わせカスタマイズ可能
Summit
Developers
#kansumiB3
分析システムコンテンツ側システム
S3
Log
Log
MySQL
Log
Sales
0100100100
0111001100
1110111110
11111111
0100100100
0111001100
1110111110
11111111
EMR!
RDS
Log
Sales
BIツール
独自
レポーティング画面
Summit
Developers
#kansumiB3
クラウド型解析ツール
? 目的
? スマートフォン対応
? クライアントサイドの状況を把握
? アプリの活性化?非活性化など
? 独自レポーティング画面を代替
? コスト削減
? クラウド型解析ツール
? Kontagent
? Flurry
? mixpanel
? SDKを組み込む
Summit
Developers
#kansumiB3
画面例(?urry)
※画面は筆者の個人アプリのデータです
Summit
Developers
#kansumiB3
分析チーム
? 約10名
? 技術者チーム
? 分析インフラ構築
? 新規案件対応
? 自動化
? KPI分析チーム
? 運営チームのコンサル
? 社内案件の傾向分析
? コンテンツ間のノウハウ共有
別の組織!
Summit
Developers
#kansumiB3
组织改革
? ノウハウが属人化していた
? 案件担当型→チームで対応
? ジョブローテ
? 開発→KPI分析
? 二つの視点を兼ね備えることで分析の質を向上
? マーケティング視点
? 技術
Summit
Developers
#kansumiB3
まとめ
? コンテンツ数が一定数を超えると分析
チームの結成を検討を
? 自社の資産(人材?技術)にみあった
技術選定
? 内製→プロダクトだったが、プロダクト
→一部内製が効率良いかも
Summit
Developers
#kansumiB3
おすすめ本
データ分析に関する
本は多いですが、BIの
概念から入るのがわ
りと実践的
Summit
Developers
#kansumiB3
ご清聴ありがとうございました

More Related Content

デブサミ関西2013 「ソーシャルゲームのデータサイエンス」