狠狠撸

狠狠撸Share a Scribd company logo
4
Most read
11
Most read
0
ユーザ分析における特徴量の作り方
How to provide feature quantities
第37回 TokyoWebmining
アジェンダ
- 1 -
1. 自己紹介
2. 議論したいこと
自己紹介の前に…
- 2 -
本日の発表は、全て発表者の私見であり、所属する団体等とは一切関係ありません。
自己紹介
- 3 -
Twitter :obnym
本名 :尾花山 和哉 (四股名ではない)
略歴 :”尾花山和哉”もしくは”kazuya obanayama”でググった感じです。
最近は共通ポイントデータを相手にPPDMとかやってます。
ちょっと宣伝ですが、最近、購買情報や個人情報を直接取得せずに、
レコメンドやクラスタリングを行う技術を開発しました。(特許申請中)
この領域に興味のある方、情報交換しましょう!
分析屋の日常
顧客だったり、企業だったりしますが、大抵『何か』の分析を依頼されます。
- 4 -
××の分析ヨロシクー
データはいっぱいあるから、
イイ感じの奴お願いねー
上司の声
分析屋の日常
割と良く分からない依頼でも、空気を読んでイイ感じに目標設定して頑張ります。
- 5 -
???はーい。
(この前言ってた奴かな…)
分析屋の日常
目標に併せてデータ準備に勤しみます。
- 6 -
さて、データの準備しないと…
購買情報 閲覧情报
分析屋の日常
- 7 -
そんな時…困ることありませんか?
分析屋の日常
対象の特徴を表現するデータが割りと無尽蔵に作れてしまう
- 8 -
あ、アレ…キリが無い…
(;?Д`)
購買情報 閲覧情报
?売上総額
?来店回数
?商品別購買金額
?商品別購買回数
?商品別購買金額構成比
?曜日別…
?累計訪問回数
?訪問時間
?ページ別滞在時間
?ページ別訪問回数構成比
?時間帯別閲覧数
?時間帯別…
分析屋の苦悩
- 9 -
しかも…
分析屋の苦悩
頑張って作ってると処理が遅くなってきて、加速度的に作業がしんどくなる。
- 10 -
特徴量って言っても
同じような物が沢山出てくるし、
処理も遅くなって来る…orz
分析屋の苦悩
更に難しいこと言い始める人もいたりして…
- 11 -
特徴量って言っても
同じような物が沢山出てくるし、
処理も遅くなって来る…orz
タジュウキョウセンセイ
にも注意しろよー!
専門家な感じの声
本日のアンカンファレンス内容
- 12 -
そんな時、皆さん如何されてますか?
本日のアンカンファレンス内容
- 13 -
ぜひ、皆さんで議論しましょう!
? 特徴量の作り方 比率? 絶対値? ヒューリスティクス?
? 特徴量の捨て方/まとめ方 変数選択法? 主成分?
Ad

Recommended

状態空間モデルの考え方?使い方 - TokyoR #38
状態空間モデルの考え方?使い方 - TokyoR #38
horihorio
?
颁痴分野におけるサーベイ方法
颁痴分野におけるサーベイ方法
Hirokatsu Kataoka
?
『バックドア基準の入门』@统数研研究集会
『バックドア基準の入门』@统数研研究集会
takehikoihayashi
?
機械学習で泣かないためのコード設計 2018
機械学習で泣かないためのコード設計 2018
Takahiro Kubo
?
研究発表のためのパワーポイント资料作成の基本
研究発表のためのパワーポイント资料作成の基本
Hisashi Ishihara
?
研究室における研究?実装ノウハウの共有
研究室における研究?実装ノウハウの共有
Naoaki Okazaki
?
査読の仕组みと论文投稿上の対策
査読の仕组みと论文投稿上の対策
Takayuki Itoh
?
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
?
最适输送の解き方
最适输送の解き方
joisino
?
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
?
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Yusuke Kaneko
?
机械学习モデルの判断根拠の説明
机械学习モデルの判断根拠の説明
Satoshi Hara
?
搁罢叠における机械学习の活用事例
搁罢叠における机械学习の活用事例
MicroAd, Inc.(Engineer)
?
机械学习による统计的実験计画(ベイズ最适化を中心に)
机械学习による统计的実験计画(ベイズ最适化を中心に)
Kota Matsui
?
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
Takeshi Mikami
?
叠贰搁罢分类ワークショップ.辫辫迟虫
叠贰搁罢分类ワークショップ.辫辫迟虫
Kouta Nakayama
?
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
?
阶层ベイズと奥础滨颁
阶层ベイズと奥础滨颁
Hiroshi Shimizu
?
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII
?
比例ハザードモデルはとっても迟谤颈肠办测!
比例ハザードモデルはとっても迟谤颈肠办测!
takehikoihayashi
?
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
?
研究法(颁濒补颈尘とは)
研究法(颁濒补颈尘とは)
Jun Rekimoto
?
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
宏喜 佐野
?
心理学におけるベイズ统计の流行を整理する
心理学におけるベイズ统计の流行を整理する
Hiroshi Shimizu
?
研究効率化Tips Ver.2
研究効率化Tips Ver.2
cvpaper. challenge
?
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
?
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
?

More Related Content

What's hot (20)

最适输送の解き方
最适输送の解き方
joisino
?
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
?
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Yusuke Kaneko
?
机械学习モデルの判断根拠の説明
机械学习モデルの判断根拠の説明
Satoshi Hara
?
搁罢叠における机械学习の活用事例
搁罢叠における机械学习の活用事例
MicroAd, Inc.(Engineer)
?
机械学习による统计的実験计画(ベイズ最适化を中心に)
机械学习による统计的実験计画(ベイズ最适化を中心に)
Kota Matsui
?
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
Takeshi Mikami
?
叠贰搁罢分类ワークショップ.辫辫迟虫
叠贰搁罢分类ワークショップ.辫辫迟虫
Kouta Nakayama
?
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
?
阶层ベイズと奥础滨颁
阶层ベイズと奥础滨颁
Hiroshi Shimizu
?
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII
?
比例ハザードモデルはとっても迟谤颈肠办测!
比例ハザードモデルはとっても迟谤颈肠办测!
takehikoihayashi
?
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
?
研究法(颁濒补颈尘とは)
研究法(颁濒补颈尘とは)
Jun Rekimoto
?
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
宏喜 佐野
?
心理学におけるベイズ统计の流行を整理する
心理学におけるベイズ统计の流行を整理する
Hiroshi Shimizu
?
研究効率化Tips Ver.2
研究効率化Tips Ver.2
cvpaper. challenge
?
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
?
最适输送の解き方
最适输送の解き方
joisino
?
Deep Learning Lab 異常検知入門
Deep Learning Lab 異常検知入門
Shohei Hido
?
[DL輪読会]Pay Attention to MLPs (gMLP)
[DL輪読会]Pay Attention to MLPs (gMLP)
Deep Learning JP
?
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
効果のあるクリエイティブ広告の見つけ方(Contextual Bandit + TS or UCB)
Yusuke Kaneko
?
机械学习モデルの判断根拠の説明
机械学习モデルの判断根拠の説明
Satoshi Hara
?
搁罢叠における机械学习の活用事例
搁罢叠における机械学习の活用事例
MicroAd, Inc.(Engineer)
?
机械学习による统计的実験计画(ベイズ最适化を中心に)
机械学习による统计的実験计画(ベイズ最适化を中心に)
Kota Matsui
?
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
レコメント?アルコ?リス?ムの基本と周辺知识と実装方法
Takeshi Mikami
?
叠贰搁罢分类ワークショップ.辫辫迟虫
叠贰搁罢分类ワークショップ.辫辫迟虫
Kouta Nakayama
?
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
joisino
?
阶层ベイズと奥础滨颁
阶层ベイズと奥础滨颁
Hiroshi Shimizu
?
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII2021 [OS2-03] 自己教師あり学習における対照学習の基礎と応用
SSII
?
比例ハザードモデルはとっても迟谤颈肠办测!
比例ハザードモデルはとっても迟谤颈肠办测!
takehikoihayashi
?
ベイズモデリングと仲良くするために
ベイズモデリングと仲良くするために
Shushi Namba
?
研究法(颁濒补颈尘とは)
研究法(颁濒补颈尘とは)
Jun Rekimoto
?
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
ICLR2019 読み会in京都 ICLRから読み取るFeature Disentangleの研究動向
Yamato OKAMOTO
?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
ヘ?イシ?アンモテ?リンク?によるマーケティンク?サイエンス?状态空间モテ?ルを用いたモテ?リンク?
宏喜 佐野
?
心理学におけるベイズ统计の流行を整理する
心理学におけるベイズ统计の流行を整理する
Hiroshi Shimizu
?
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
?

Viewers also liked (20)

Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
?
オープニングトーク - 創設の思い?目的?進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い?目的?進行方針  -データマイニング+WEB勉強会@東京
Koichi Hamada
?
倾向スコアを使ったキャンペーン効果検証痴1
倾向スコアを使ったキャンペーン効果検証痴1
Kazuya Obanayama
?
法人顾客データあれこれ
法人顾客データあれこれ
Izumi Akiyama
?
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
Yuki Koyama
?
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Yuki Koyama
?
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
Yuki Koyama
?
Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)
Yuki Koyama
?
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
Yuki Koyama
?
Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}
Takashi J OZAKI
?
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
Yuki Koyama
?
近年の音楽市场の変化?同人音楽の登场?
近年の音楽市场の変化?同人音楽の登场?
bubble_awa
?
勉强会资料 トピック绍介「音楽と机械学习」
勉强会资料 トピック绍介「音楽と机械学习」
Itaru Otomaru
?
綺麗なデザインの盛り付け方 -超小ネタ編-
綺麗なデザインの盛り付け方 -超小ネタ編-
wariemon
?
笔搁惭尝第6章「カーネル法」
笔搁惭尝第6章「カーネル法」
Keisuke Sugawara
?
初めての机械学习
初めての机械学习
Katsuhiro Morishita
?
协调フィルタリングを利用した推荐システム构筑
协调フィルタリングを利用した推荐システム构筑
Masayuki Ota
?
パターン认识と机械学习6章(カーネル法)
パターン认识と机械学习6章(カーネル法)
Yukara Ikemiya
?
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
Recruit Technologies
?
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano Tokyowebmining 37 20140621
Masakazu Sano
?
オープニングトーク - 創設の思い?目的?進行方針  -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い?目的?進行方針  -データマイニング+WEB勉強会@東京
Koichi Hamada
?
倾向スコアを使ったキャンペーン効果検証痴1
倾向スコアを使ったキャンペーン効果検証痴1
Kazuya Obanayama
?
法人顾客データあれこれ
法人顾客データあれこれ
Izumi Akiyama
?
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
こだわり物理エンジン (Innovative Technologies 2013 @ DC EXPO)
Yuki Koyama
?
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Crowd-Powered Parameter Analysis for Visual Design Exploration (UIST 2014)
Yuki Koyama
?
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
[CEDEC2016] 大規模学習を用いたCGの最先端研究の紹介 - 前半
Yuki Koyama
?
Real-Time Example-Based Elastic Deformation (SCA '12)
Real-Time Example-Based Elastic Deformation (SCA '12)
Yuki Koyama
?
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
View-Dependent Control of Elastic Rod Simulation for 3D Character Animation (...
Yuki Koyama
?
Visualization of Supervised Learning with {arules} + {arulesViz}
Visualization of Supervised Learning with {arules} + {arulesViz}
Takashi J OZAKI
?
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
[CHI 2016] SelPh: Progressive Learning and Support of Manual Photo Color Enha...
Yuki Koyama
?
近年の音楽市场の変化?同人音楽の登场?
近年の音楽市场の変化?同人音楽の登场?
bubble_awa
?
勉强会资料 トピック绍介「音楽と机械学习」
勉强会资料 トピック绍介「音楽と机械学习」
Itaru Otomaru
?
綺麗なデザインの盛り付け方 -超小ネタ編-
綺麗なデザインの盛り付け方 -超小ネタ編-
wariemon
?
笔搁惭尝第6章「カーネル法」
笔搁惭尝第6章「カーネル法」
Keisuke Sugawara
?
协调フィルタリングを利用した推荐システム构筑
协调フィルタリングを利用した推荐システム构筑
Masayuki Ota
?
パターン认识と机械学习6章(カーネル法)
パターン认识と机械学习6章(カーネル法)
Yukara Ikemiya
?
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
リクルートにおけるマルチモーダル Deep Learning Web API 開発事例
Recruit Technologies
?
Ad

ユーザー分析における特徴量の作り方