狠狠撸

狠狠撸Share a Scribd company logo
1
データ分析における最適な判断材料とは何か?
天野?大輔
@dicethekamikaze
2
Background:
?自然言語処理
?言語学
?心理言語学
?機械学習
?python
?ちょっと統計
株式会社DoBoken
~クーポンを戦略的に~
人間の購買行動、欲しいと思ったタイミング、
迷っているをリアルタイムに、集計、分析し、
買い物の後押しをしてあげるサービスを提供しています。
やってること:
毎日、データとにらめっこ。
!
最近の取り組み:
離脱予測 とか
3
データ分析における判断要所 ?例(失敗談)
1. UXを考える。
2. よしデータが貯まったぞ!?生データを見てみよう!!
3.CVしてるユーザーはページ毎の滞在時間が長い傾向にあるな!あと、使っているブラウザはIEが多いな!!
!
!
4.よし!これらを説明変数に入れてみよう!パターンマイニングだ!!機械学習だ!
4.5 …ノーマライズ、 テストデータ、トレーニングデータ。。。もろもろ
5.学習器できた~!!
とあるデータ分析フロー
4
? さん!これと、これと、これを説明変数に使ってNaive Bayesで学習モデルつく
りました!!?精度は75%出てます!
? じゃあやってみようか!
? 結果!!!
? Accurary: 45% …. ぜんぜん結果でません。なんでかな~。
? チューニング。。。。
? 説明変数の見直し!
? そもそも、滞在時間は説明変数として信頼性が高いのか?
? ブラウザ情報(IE)などは、たまたまであってこれも信頼できないのでは無い
か?
このプロセス、繰り返しに1週間以上かかる
これではPDCAをガンガン回すことができない
データ分析における判断要所 ?例(失敗談)
5
データ分析における押さえおくべき要所
1. UXを考える。
2.よしデータが貯まったぞ!?生データを見てみよう!!
3.CVしてるユーザーはページ毎の滞在時間が長い傾向にあるな!あと、使っているブラウザはIEが多いな!!
!
4.よし!これも説明変数に入れてみよう!パターンマイニングだ!!機械学習だ!
4.5 …ノーマライズ、 テストデータ、トレーニングデータ。。。もろもろ
5.結果!!
データ分析をするにあたり、重要な判断要所はたくさんある。
判断要所
判断要所
判断要所
判断要所
判断要所
判断要所
判断要所
判断要所
ではどこが一番じゅうようなのか?
6
1.UX
?-?仮説を証明する為のデータを考える。
2. 生データ
?-?何を証明したいのかを明確にする。
?-?可能であればベースラインの設定。
3. 変数の選別
-?統計的に優位ではない変数は使わない。
-?クライアントにわかる変数を使用する。
? ※精度について。
-?1)ベースラインを設定する
-?2)過去の知見が無い場合はとにかくやる!!
???????-?1~2週間の早いサイクルで回す。

More Related Content

35thwebmining_lt