狠狠撸

狠狠撸Share a Scribd company logo
あなただけにそっと教える
弊社の分析事情
Data Analyst Meetup Tokyo vol.1
工藤 啓朗(Gunosy Inc.)
2016/06/23
自己紹介
くどう ひろあき (@Hmj_kd)
- 北海道釧路市出身, 30代, 妻子あり
- 高専 : 釧路高専 情報工学科
- 大学 : 物理学科 (ブラックホール,Inflation宇宙論)
- 前職 : プログラマ → Pandas データマエショリスト, データ分析
- 現職 : 4ヶ月目
- 2歳の娘に溺愛中...
自己紹介
以前こんな発表をした者です...
テーマは
「弊社の分析事情-○○社の場合」
入社してから前職やイメージ(?)と,
異なった部分を話したいと思います
Gunosy
データ×アルゴリズム
会社紹介
- Gunosy の紹介
- データ分析部の紹介
- チームについて
- どんなことやっているの?
- 運営ノウハウなど
今日のお話
データ分析部 in Gunosy
- 構成
- 8 名 + アルバイト数名(社員の10人に1人がデータ分析部)
- Bg : 人工知能,自然言語処理,計算知能,素粒子物理学 , ...
- 主な業務
- 記事配信ロジックの改善
- A/B テストの運用
- データ分析
- 施策前後の数値分析
- ユーザの行動分析, アド分析
- KPI設計,分析
- クライアントアプリのログ設計
主な分析の切り口
- ユーザ
- 性別,年齢,地域,...
- いつ登録したか
- どんな記事を読んでいるか
- いつ起動しているか
- 利用頻度は
- ...
ユーザの行動履歴などから推定
ログデータから
1. 研究組織(研究者)ではなく,課題解決する組織(エンジニア?)
2. 開発もワシワシする
3. コミュニケーション
4. 共有文化
5. Python 文化
他社のデータ分析部と異なる特殊なところ(主観イメージ)
主に取り組んでいる(きた)課題
- 組織の課題
- 施策のスピード,見るべき数値
- よりデータ?ドリブンな企業となるためへの改善
- ユーザにコンテンツを適切な形で伝える
- 定量,定性的にユーザを理解する
- 数値 : DAU,継続率,...
- ロジックの改善
- 現状把握だけではなく,仮説?検証?意思決定も含んだ分析が求められる
したいのは研究ではなく,課題を解決すること
データで遊んでいる
人々ではありません
(笑)
- 開発もします !!
- コードはGithub管理
- 本番データももちろんみれます.
- むしろ,AWSさわります
分析からデプロイするまで面倒みます
仮説 分析 施策
ロジック
開発
デプロイ
内容によっては,
1人で一気通貫もある
以前...
- mtg : 30分~1時間 × N
- 議事録...
- 事前ネゴ
- 決めるための事前mtg
- わかりやすいプレゼン資料
- 部長が中々つかまらない
今...
- 基本 slack
- 重要な数値、それを支える数値
- mtgがあっても,Google ドキュメントで
書きながら話しながら進める
- きれいなプレゼン資料つくるなら,施策
を前に進めよう
- 部長はonline
コミュニケーション
slack で議論
チャンネルは
- Project
- Team
- 個人分報
- …
など
- Task
- ZenHub で管理
- Github
- 仮説,施策,検証のログ
- Slack
- 議論
- yammer
- 最終意思決定
仮説,議論から意思決定まで流れ
意思決定
yammer
議論
Slack
ダッシュボード
A/B テスト
オフラインテスト
プロトタイプ
ロジック実装
ロジック実装
仮説出し
Github issue
アドホック分析
レビュー
- 失敗から学ぶ
- 重要な数値をモニタリングして,下がったら原因を探る.
- 他社事例
- 他社のABテストが100%になった.
- 撤退した.機能が消えた.
- ユーザ間の比較
- iOS/Android,獲得経路別,ユーザが最初に使った機能ごとの KPI
- 大切な数値と相関の大きな値
- ある行動の回数が多いと,重要な数値も高くなる傾向がある
仮説出しの例
Github(README/Wiki) や Qiita や GoogleDriveを活用して,
知見やトラブルシューティングをシェアしています.
気軽に聞ける風土
- Pandas Tips
- ロジックについてのアイデア
- ...
共有文化
ロジック開発では
- Django デス
- バッチもDjango
- (ほぼ) Python 3系
アドホックな分析では
Jupyter (旧: ipython notebook) を活用しています !!
- 前処理 : Pandas
- 可視化 : seaborn, ggplot風 など
Python 文化 そう, Python
主に
ダッシュボード(可視化)まわり
社内ダッシュボード
依頼ベースでの話は,
クエリを渡して
ディレクター側で運用しています!!
データ分析部 開発合宿
- データ分析部だけどコードも書く,ちょっと特殊なデータ分析部です(主観)
- まだまだ改善途中,ノウハウを共有しあってよいチームにしていきたい
まとめと,これから
ご清聴ありがとうございます !!

More Related Content

あなただけにそっと教える弊社の分析事情 #data analyst meetup tokyo vol.1 LT