狠狠撸
Submit Search
35thwebmining_lt
?
0 likes
?
2,932 views
Daisuke Amano
1 of 6
Download now
Download to read offline
More Related Content
35thwebmining_lt
1.
1 データ分析における最適な判断材料とは何か? 天野?大輔 @dicethekamikaze
2.
2 Background: ?自然言語処理 ?言語学 ?心理言語学 ?機械学習 ?python ?ちょっと統計 株式会社DoBoken ~クーポンを戦略的に~ 人間の購買行動、欲しいと思ったタイミング、 迷っているをリアルタイムに、集計、分析し、 買い物の後押しをしてあげるサービスを提供しています。 やってること: 毎日、データとにらめっこ。 ! 最近の取り組み: 離脱予測 とか
3.
3 データ分析における判断要所 ?例(失敗談) 1. UXを考える。 2.
よしデータが貯まったぞ!?生データを見てみよう!! 3.CVしてるユーザーはページ毎の滞在時間が長い傾向にあるな!あと、使っているブラウザはIEが多いな!! ! ! 4.よし!これらを説明変数に入れてみよう!パターンマイニングだ!!機械学習だ! 4.5 …ノーマライズ、 テストデータ、トレーニングデータ。。。もろもろ 5.学習器できた~!! とあるデータ分析フロー
4.
4 ? さん!これと、これと、これを説明変数に使ってNaive Bayesで学習モデルつく りました!!?精度は75%出てます! ?
じゃあやってみようか! ? 結果!!! ? Accurary: 45% …. ぜんぜん結果でません。なんでかな~。 ? チューニング。。。。 ? 説明変数の見直し! ? そもそも、滞在時間は説明変数として信頼性が高いのか? ? ブラウザ情報(IE)などは、たまたまであってこれも信頼できないのでは無い か? このプロセス、繰り返しに1週間以上かかる これではPDCAをガンガン回すことができない データ分析における判断要所 ?例(失敗談)
5.
5 データ分析における押さえおくべき要所 1. UXを考える。 2.よしデータが貯まったぞ!?生データを見てみよう!! 3.CVしてるユーザーはページ毎の滞在時間が長い傾向にあるな!あと、使っているブラウザはIEが多いな!! ! 4.よし!これも説明変数に入れてみよう!パターンマイニングだ!!機械学習だ! 4.5 …ノーマライズ、
テストデータ、トレーニングデータ。。。もろもろ 5.結果!! データ分析をするにあたり、重要な判断要所はたくさんある。 判断要所 判断要所 判断要所 判断要所 判断要所 判断要所 判断要所 判断要所
6.
ではどこが一番じゅうようなのか? 6 1.UX ?-?仮説を証明する為のデータを考える。 2. 生データ ?-?何を証明したいのかを明確にする。 ?-?可能であればベースラインの設定。 3. 変数の選別 -?統計的に優位ではない変数は使わない。 -?クライアントにわかる変数を使用する。 ?
※精度について。 -?1)ベースラインを設定する -?2)過去の知見が無い場合はとにかくやる!! ???????-?1~2週間の早いサイクルで回す。
Download