際際滷

際際滷Share a Scribd company logo
GBDTを聞った
feature transformationのm喘箭
毅輝 @Quasi_quant2010
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20101
‐デ`タサイエンスLT疾り 2匚朕/
古勣
- 蒙翮燭力珸v(掲侘來)をGDBTで渇竃 -
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20102
? ケ`ス
? 嚠yラベル債Г互い?詰い
? feature債襠h?縮圄定方?誘Yp払?Prg/L, etc
? 箭えば、(Prg/L, 誘Y旋吩)の屈つをMみ栽わせたr、
Prgは玉いが、誘Y旋吩が互い繁は互いA鬚砲△襪呂
? ドメイン岑Rより、Featureをand訳周のMみ栽わせで
掲侘featureは恬れる
? ただし、Qyしたfeatureが謹い栽、Mみ栽わせは峺方卯k
? そもそも、繁gがゼロから掲侘featureをOするのは寄
? 掲侘來のOをGBDTでI尖した瘁、侘モデルで嚠y
念I尖 蛍匂
gYY惚
- Stacking+Blending P GBDT+LR > LR -
? GBDTのMax_Depthは8
? 鏡羨にえるfeatureに掲侘來があった
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20103
Model accuracy precision recall f-value
LR 8.35e-01 9.22e-01 8.67e-01 8.94e-01
GDBT+LR **8.63e-01 **9.31e-01 8.91e-01 9.11e-01
Stacking+
Blending
8.62e-01 9.30e-01 **8.92e-01 **9.11e-01
廣1) 麻デ`タ : Adult Data Set (goo.gl/GzB8bS)
age workclass sex education
education-
num
39 State-gov male Bachelors 13
50
Self-emp-
not-inc
female Bachelors 13
廣2) 5-Fold
廣3) ** : Best Score
廣4) カテゴリカル篳は
畠てOne-hot-encoding
デ`タセット箭
嚠yY惚
歌深
- GBDTとは -
? PAC Learning
? Boostingとは樋僥匂をたくさん鹿めて僥匂を恬ろう
? C亠僥
? PAC Learningをp払v方を恷弌晒する}として壅協x、
p払を恷弌晒する圭鬚鯡修垢里帽甘簀鵑鯤垢辰討い襪里如
Gradient Boosting
? ポイント
? negative gradientを恷弌屈\除貌し、樋僥匂を容協
? しくは
? [Quasi_quant2010c] を歌孚
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20104
念I尖(イメ`ジ)
- 掲侘來のOをGBDTでI尖 -
? 2つのQ協直のアンサンブル箭
? 匯つは3つのleaf node(A)
? 匯つは2つのleaf node(B)
? デ`タ箭
? Aの2桑朕のleaf nodeに欺_
? Bの1桑朕のleaf nodeに欺_
? 掲侘Q瘁のfeatureは
[0,1,0,1,0] となる
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20105
哈喘 [H.Xinran, etc]
Figure1
Input Features
Transoformed
Features
侘モデル
で嚠y
GBDTの圻尖がp払を恷弌晒するように直を弖紗するという泣で功
をもち、Q協直が}方and訳周の秤鵑瞋个垢觀脳侘Qが辛嬬
A B
gYY惚
- FeatureImportanceと屎t晒path -
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20106
? Featuregのand訳周を深]辛
? age * hours-parweek吉
? Blendingはp払v方と屎t晒v
方のMみ栽わせを曳^
? p払v方 : Logistic-Loss or
Hinge Loss
? 屎t晒v方 : L1 or L2
Ridge指「でBlending
深賀
- サンプルデ`タの尅り卦り -
? モデルの尅り卦り
? GBDTがfeaturegの珸vをうまくI尖したか
? 恬ったtreeにvし、max_depthが8なので、うまくI尖できた
? ただし、g佞任Hyper-paramsを般塚く{屁する駅勣あり
? g佞鯱覿┐靴腎颪蠏気
? 仏貨g悶が嗤燭覆里、}栽勣咀なのか
? 書指のデ`タでは、仏貨}栽も嗤燭世辰
? 何Tg悶により森という鷂罎あった栽
それは、`りであることがモデル貧_Jできる
? Q麻貧並gかは、掲侘featureを児にб罎鰈頚Eすればよい
? モデルではビジネスサイドが{誼できないので、
深賀をビジネスサイドの返乾り湖に除づけることも嶷勣
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20107
深賀(g佞箸いσ泣で)
- 仏貨への幣又を誼られることが恷も嶷勣 -
? α,βなど、仏貨g悶をuするのではなく、仏貨のMみ栽わ
せをuできるMみなので、より人Q議な尅り卦りが辛嬬
? 仏貨g悶しかuできないとPDCAを指し俳るのにrgがかかる
? Qyした蒙翮燭鬟皀妊襪之脳侘Qしているものの、
Lれ篳を秘していないため、g悶仏貨(feature) や}
栽仏貨(掲侘feature)にvする尅り卦りが辛嬬
? g悶仏貨
? GBDTのfeature importance
? }栽仏貨
? 掲侘Qしたfeatureのweight(侘モデルのfeature weight)
? featureの芦協來も紗龍する並も辛嬬で、隔A森もわかる
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20108
歌深猟
? **[H.Xinran, etc] Practical Lessons from Predicting Clicks on
Ads at Facebook. ADKDD14
? [C.Zhicheng, etc] Optimal Action Extraction for Random
Forests and Boosted Trees. KDD15
? [Quasi_quant2010a] Gradient Boostingについて - Scikit-Learnを
聞ったfeature transformation(GBDT + LR vs LR) -
goo.gl/Pkto81
? [Quasi_quant2010b] Stacking - テンプレ`ト晒?麻「 -
goo.gl/jXSrw8
? [Quasi_quant2010c] Gradient Boostingについて - 箴 -
goo.gl/tng0vl
? [Quasi_quant2010d] Gradient Boostingについて - 屎t晒?
Xgboost C goo.gl/dBQqYc
デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20109

More Related Content

What's hot (20)

20090924 徊殕洞┐隼憇佩双
20090924 徊殕洞┐隼憇佩双20090924 徊殕洞┐隼憇佩双
20090924 徊殕洞┐隼憇佩双
Toru Tamaki
?
ブラックボックス恷癖晒とその鮄
ブラックボックス恷癖晒とその鮄ブラックボックス恷癖晒とその鮄
ブラックボックス恷癖晒とその鮄
gree_tech
?
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
cvpaper. challenge
?
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
Deep Learning JP
?
恷癖補僕の柴麻アルゴリズムの冩梢強
恷癖補僕の柴麻アルゴリズムの冩梢強恷癖補僕の柴麻アルゴリズムの冩梢強
恷癖補僕の柴麻アルゴリズムの冩梢強
ohken
?
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
Deep Learning JP
?
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
cvpaper. challenge
?
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
Takahiro Kubo
?
箏屮戰ぅ嵯┐燐h苧
箏屮戰ぅ嵯┐燐h苧箏屮戰ぅ嵯┐燐h苧
箏屮戰ぅ嵯┐燐h苧
Haruka Ozaki
?
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII
?
Data-Centric AIのB初
Data-Centric AIのB初Data-Centric AIのB初
Data-Centric AIのB初
Kazuyuki Miyazawa
?
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
Deep Learning JP
?
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
Eiji Uchibe
?
[DLi氏]Deep Learning 及15嫗 燕F僥
[DLi氏]Deep Learning 及15嫗 燕F僥[DLi氏]Deep Learning 及15嫗 燕F僥
[DLi氏]Deep Learning 及15嫗 燕F僥
Deep Learning JP
?
みzみ晦壊岳馨
みzみ晦壊岳馨みzみ晦壊岳馨
みzみ晦壊岳馨
tak9029
?
方僥で盾き苧かす侮蚊僥楼の圻尖
方僥で盾き苧かす侮蚊僥楼の圻尖方僥で盾き苧かす侮蚊僥楼の圻尖
方僥で盾き苧かす侮蚊僥楼の圻尖
Taiji Suzuki
?
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networks
tm1966
?
或沿岳庄馨庄噛艶姻秘壇ψ醫其
或沿岳庄馨庄噛艶姻秘壇ψ醫其或沿岳庄馨庄噛艶姻秘壇ψ醫其
或沿岳庄馨庄噛艶姻秘壇ψ醫其
Motokawa Tetsuya
?
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄ ‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
yoshitaka373
?
Skip Connection まとめNeural Network
Skip Connection まとめNeural NetworkSkip Connection まとめNeural Network
Skip Connection まとめNeural Network
Yamato OKAMOTO
?
20090924 徊殕洞┐隼憇佩双
20090924 徊殕洞┐隼憇佩双20090924 徊殕洞┐隼憇佩双
20090924 徊殕洞┐隼憇佩双
Toru Tamaki
?
ブラックボックス恷癖晒とその鮄
ブラックボックス恷癖晒とその鮄ブラックボックス恷癖晒とその鮄
ブラックボックス恷癖晒とその鮄
gree_tech
?
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
‐メタサ`ベイ/方塀ドリブン縮弗あり僥楼
cvpaper. challenge
?
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
[DLi氏]NVAE: A Deep Hierarchical Variational Autoencoder
Deep Learning JP
?
恷癖補僕の柴麻アルゴリズムの冩梢強
恷癖補僕の柴麻アルゴリズムの冩梢強恷癖補僕の柴麻アルゴリズムの冩梢強
恷癖補僕の柴麻アルゴリズムの冩梢強
ohken
?
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
畏禽晦態i氏液赫河鰻とv銭冩梢弊順モデルとのvSについて
Deep Learning JP
?
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
コンピュ`タビジョンのQ泣から需た粥鴛の巷峠來
cvpaper. challenge
?
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
侮嗔Яの登僅功を尖盾するための 冩梢とその吭x @PRMU 2017俑云
Takahiro Kubo
?
箏屮戰ぅ嵯┐燐h苧
箏屮戰ぅ嵯┐燐h苧箏屮戰ぅ嵯┐燐h苧
箏屮戰ぅ嵯┐燐h苧
Haruka Ozaki
?
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII2019OS: 侮嗔Яにかかるrgを玉くしてみませんか ゛蛍柊僥の瓩瓠
SSII
?
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
畏禽晦態i氏液ドメイン卞と音箟輜屬哩vするサ`ベイ
Deep Learning JP
?
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
膿晒僥楼と剃膿晒僥楼を怏み栽わせた庁僥楼
Eiji Uchibe
?
[DLi氏]Deep Learning 及15嫗 燕F僥
[DLi氏]Deep Learning 及15嫗 燕F僥[DLi氏]Deep Learning 及15嫗 燕F僥
[DLi氏]Deep Learning 及15嫗 燕F僥
Deep Learning JP
?
みzみ晦壊岳馨
みzみ晦壊岳馨みzみ晦壊岳馨
みzみ晦壊岳馨
tak9029
?
方僥で盾き苧かす侮蚊僥楼の圻尖
方僥で盾き苧かす侮蚊僥楼の圻尖方僥で盾き苧かす侮蚊僥楼の圻尖
方僥で盾き苧かす侮蚊僥楼の圻尖
Taiji Suzuki
?
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networks
tm1966
?
或沿岳庄馨庄噛艶姻秘壇ψ醫其
或沿岳庄馨庄噛艶姻秘壇ψ醫其或沿岳庄馨庄噛艶姻秘壇ψ醫其
或沿岳庄馨庄噛艶姻秘壇ψ醫其
Motokawa Tetsuya
?
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄ ‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
‐C亠僥茶氏/鮫颪侶U  ̄Image-to-Image translation ̄
yoshitaka373
?
Skip Connection まとめNeural Network
Skip Connection まとめNeural NetworkSkip Connection まとめNeural Network
Skip Connection まとめNeural Network
Yamato OKAMOTO
?

Viewers also liked (8)

RandomForest
RandomForestRandomForest
RandomForest
goodbaton
?
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
Ichigaku Takigawa
?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
Hiroki Yamamoto
?
悪温乙乙鉛艶のテクニック
悪温乙乙鉛艶のテクニック悪温乙乙鉛艶のテクニック
悪温乙乙鉛艶のテクニック
Yasunori Ozaki
?
10蛍でわかるRandom forest
10蛍でわかるRandom forest10蛍でわかるRandom forest
10蛍でわかるRandom forest
Yasunori Ozaki
?
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
Ichigaku Takigawa
?
g樹謹クラス蛍 Kaggle Ottoから僥んだこと
g樹謹クラス蛍 Kaggle Ottoから僥んだことg樹謹クラス蛍 Kaggle Ottoから僥んだこと
g樹謹クラス蛍 Kaggle Ottoから僥んだこと
nishio
?
書さら療けないカ`ネル隈とサポ`トベクタ`マシン
書さら療けないカ`ネル隈とサポ`トベクタ`マシン書さら療けないカ`ネル隈とサポ`トベクタ`マシン
書さら療けないカ`ネル隈とサポ`トベクタ`マシン
Shinya Shimizu
?
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
親僥と字亠僥楼のあいだ篩燭良莠?篁?僉k?住札恬喘?瀰緑
Ichigaku Takigawa
?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
中宜くさいこと深えたくないあなたへ?意沿看岳と字亠僥楼?
Hiroki Yamamoto
?
悪温乙乙鉛艶のテクニック
悪温乙乙鉛艶のテクニック悪温乙乙鉛艶のテクニック
悪温乙乙鉛艶のテクニック
Yasunori Ozaki
?
10蛍でわかるRandom forest
10蛍でわかるRandom forest10蛍でわかるRandom forest
10蛍でわかるRandom forest
Yasunori Ozaki
?
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
栽撹篩燭肇▲鵐汽鵐屮襭沙「畢と紗隈モデルの勣泣
Ichigaku Takigawa
?
g樹謹クラス蛍 Kaggle Ottoから僥んだこと
g樹謹クラス蛍 Kaggle Ottoから僥んだことg樹謹クラス蛍 Kaggle Ottoから僥んだこと
g樹謹クラス蛍 Kaggle Ottoから僥んだこと
nishio
?
書さら療けないカ`ネル隈とサポ`トベクタ`マシン
書さら療けないカ`ネル隈とサポ`トベクタ`マシン書さら療けないカ`ネル隈とサポ`トベクタ`マシン
書さら療けないカ`ネル隈とサポ`トベクタ`マシン
Shinya Shimizu
?

Similar to GBDTを聞ったfeature transformationのm喘箭 (15)

ZoZei - アイデアpスライド
ZoZei - アイデアpスライドZoZei - アイデアpスライド
ZoZei - アイデアpスライド
Kosaku Ono
?
2024 annual retrospect / IoT fullstack freelance
2024 annual retrospect / IoT fullstack freelance2024 annual retrospect / IoT fullstack freelance
2024 annual retrospect / IoT fullstack freelance
Yuki Kikuchi
?
Why we need blockchain for dx
Why we need blockchain for dxWhy we need blockchain for dx
Why we need blockchain for dx
SBI R3 Japan
?
AWS IoT Eventsで[んでみた
AWS IoT Eventsで[んでみたAWS IoT Eventsで[んでみた
AWS IoT Eventsで[んでみた
Ken'ichirou Kimura
?
Big data盾裂ビジネス
Big data盾裂ビジネスBig data盾裂ビジネス
Big data盾裂ビジネス
Mie Mori
?
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDBビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
griddb
?
2019 kotlin-rejected-fest-doyaaaaaken
2019 kotlin-rejected-fest-doyaaaaaken2019 kotlin-rejected-fest-doyaaaaaken
2019 kotlin-rejected-fest-doyaaaaaken
Koyama Kenta
?
kintonedevcamp-vol5-kintonepossibility
kintonedevcamp-vol5-kintonepossibilitykintonedevcamp-vol5-kintonepossibility
kintonedevcamp-vol5-kintonepossibility
Takashi Ushirosako
?
蝶芙の禽京塰喘巓りあれこれ
蝶芙の禽京塰喘巓りあれこれ蝶芙の禽京塰喘巓りあれこれ
蝶芙の禽京塰喘巓りあれこれ
lhfukamachi 侮隨
?
徭嵶悶 |奨並嬲 Lの嶄g鷂
徭嵶悶 |奨並嬲 Lの嶄g鷂徭嵶悶 |奨並嬲 Lの嶄g鷂
徭嵶悶 |奨並嬲 Lの嶄g鷂
Katsuhito Okada
?
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬YOSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
Daisuke Ikeda
?
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ムQgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
DaichiKimura3
?
Node red for-collecting_information
Node red for-collecting_informationNode red for-collecting_information
Node red for-collecting_information
Harada Kazuki
?
令はコンテンツ並I宀である S爺
令はコンテンツ並I宀である S爺令はコンテンツ並I宀である S爺
令はコンテンツ並I宀である S爺
Rakuten Group, Inc.
?
ZoZei - アイデアpスライド
ZoZei - アイデアpスライドZoZei - アイデアpスライド
ZoZei - アイデアpスライド
Kosaku Ono
?
2024 annual retrospect / IoT fullstack freelance
2024 annual retrospect / IoT fullstack freelance2024 annual retrospect / IoT fullstack freelance
2024 annual retrospect / IoT fullstack freelance
Yuki Kikuchi
?
Why we need blockchain for dx
Why we need blockchain for dxWhy we need blockchain for dx
Why we need blockchain for dx
SBI R3 Japan
?
Big data盾裂ビジネス
Big data盾裂ビジネスBig data盾裂ビジネス
Big data盾裂ビジネス
Mie Mori
?
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDBビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
ビッグIoTデ`タに鬉靴織禰`タベ`ス GridDB
griddb
?
2019 kotlin-rejected-fest-doyaaaaaken
2019 kotlin-rejected-fest-doyaaaaaken2019 kotlin-rejected-fest-doyaaaaaken
2019 kotlin-rejected-fest-doyaaaaaken
Koyama Kenta
?
kintonedevcamp-vol5-kintonepossibility
kintonedevcamp-vol5-kintonepossibilitykintonedevcamp-vol5-kintonepossibility
kintonedevcamp-vol5-kintonepossibility
Takashi Ushirosako
?
蝶芙の禽京塰喘巓りあれこれ
蝶芙の禽京塰喘巓りあれこれ蝶芙の禽京塰喘巓りあれこれ
蝶芙の禽京塰喘巓りあれこれ
lhfukamachi 侮隨
?
徭嵶悶 |奨並嬲 Lの嶄g鷂
徭嵶悶 |奨並嬲 Lの嶄g鷂徭嵶悶 |奨並嬲 Lの嶄g鷂
徭嵶悶 |奨並嬲 Lの嶄g鷂
Katsuhito Okada
?
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬YOSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
OSC 2020 Fukuoka IT\喘徭啝を屶址する仝\喘レコメンドプラットフォ`ム々gFの玲岬Y
Daisuke Ikeda
?
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ムQgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
Qgシステム坪u晒に鬚韻織廛薀奪肇侫`ムB - PCF?BOSHによるオブザ`バブルプラットフォ`ム
DaichiKimura3
?
Node red for-collecting_information
Node red for-collecting_informationNode red for-collecting_information
Node red for-collecting_information
Harada Kazuki
?
令はコンテンツ並I宀である S爺
令はコンテンツ並I宀である S爺令はコンテンツ並I宀である S爺
令はコンテンツ並I宀である S爺
Rakuten Group, Inc.
?

More from Takanori Nakai (18)

Sentence-State LSTM for Text Representation
Sentence-State LSTM for Text RepresentationSentence-State LSTM for Text Representation
Sentence-State LSTM for Text Representation
Takanori Nakai
?
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
Takanori Nakai
?
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @DenaICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
Takanori Nakai
?
Note : Noise constastive estimation of unnormalized statictics methods
Note : Noise constastive estimation of unnormalized statictics methodsNote : Noise constastive estimation of unnormalized statictics methods
Note : Noise constastive estimation of unnormalized statictics methods
Takanori Nakai
?
Adaptive subgradient methods for online learning and stochastic optimization ...
Adaptive subgradient methods for online learning and stochastic optimization ...Adaptive subgradient methods for online learning and stochastic optimization ...
Adaptive subgradient methods for online learning and stochastic optimization ...
Takanori Nakai
?
Learning Better Embeddings for Rare Words Using Distributional Representations
Learning Better Embeddings for Rare Words Using Distributional RepresentationsLearning Better Embeddings for Rare Words Using Distributional Representations
Learning Better Embeddings for Rare Words Using Distributional Representations
Takanori Nakai
?
Preference-oriented Social Networks_Group Recommendation and Inference
Preference-oriented Social Networks_Group Recommendation and InferencePreference-oriented Social Networks_Group Recommendation and Inference
Preference-oriented Social Networks_Group Recommendation and Inference
Takanori Nakai
?
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
Takanori Nakai
?
Analysis of Learning from Positive and Unlabeled Data
Analysis of Learning from Positive and Unlabeled DataAnalysis of Learning from Positive and Unlabeled Data
Analysis of Learning from Positive and Unlabeled Data
Takanori Nakai
?
Positive Unlabeled Learning for Deceptive Reviews Detection
Positive Unlabeled Learning for Deceptive Reviews DetectionPositive Unlabeled Learning for Deceptive Reviews Detection
Positive Unlabeled Learning for Deceptive Reviews Detection
Takanori Nakai
?
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Takanori Nakai
?
Similarity component analysis
Similarity component analysisSimilarity component analysis
Similarity component analysis
Takanori Nakai
?
Query driven context aware recommendation
Query driven context aware recommendationQuery driven context aware recommendation
Query driven context aware recommendation
Takanori Nakai
?
Unsupervised Graph-based Topic Labelling using DBpedia
Unsupervised Graph-based Topic Labelling using DBpediaUnsupervised Graph-based Topic Labelling using DBpedia
Unsupervised Graph-based Topic Labelling using DBpedia
Takanori Nakai
?
Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Psychological Advertising_Exploring User Psychology for Click Prediction in S...Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Takanori Nakai
?
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
Takanori Nakai
?
署旋豚g夛について:Forward Martingale MeasureのС
署旋豚g夛について:Forward Martingale MeasureのС署旋豚g夛について:Forward Martingale MeasureのС
署旋豚g夛について:Forward Martingale MeasureのС
Takanori Nakai
?
Topic discovery through data dependent and random projections
Topic discovery through data dependent and random projectionsTopic discovery through data dependent and random projections
Topic discovery through data dependent and random projections
Takanori Nakai
?
Sentence-State LSTM for Text Representation
Sentence-State LSTM for Text RepresentationSentence-State LSTM for Text Representation
Sentence-State LSTM for Text Representation
Takanori Nakai
?
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
WSDM2018 iみ氏 Latent cross making use of context in recurrent recommender syst...
Takanori Nakai
?
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @DenaICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
ICLR2017iみ氏 Data Noising as Smoothing in Neural Network Language Models @Dena
Takanori Nakai
?
Note : Noise constastive estimation of unnormalized statictics methods
Note : Noise constastive estimation of unnormalized statictics methodsNote : Noise constastive estimation of unnormalized statictics methods
Note : Noise constastive estimation of unnormalized statictics methods
Takanori Nakai
?
Adaptive subgradient methods for online learning and stochastic optimization ...
Adaptive subgradient methods for online learning and stochastic optimization ...Adaptive subgradient methods for online learning and stochastic optimization ...
Adaptive subgradient methods for online learning and stochastic optimization ...
Takanori Nakai
?
Learning Better Embeddings for Rare Words Using Distributional Representations
Learning Better Embeddings for Rare Words Using Distributional RepresentationsLearning Better Embeddings for Rare Words Using Distributional Representations
Learning Better Embeddings for Rare Words Using Distributional Representations
Takanori Nakai
?
Preference-oriented Social Networks_Group Recommendation and Inference
Preference-oriented Social Networks_Group Recommendation and InferencePreference-oriented Social Networks_Group Recommendation and Inference
Preference-oriented Social Networks_Group Recommendation and Inference
Takanori Nakai
?
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
互肝圷デ`タの由柴坤好僣`ス屎夸晒の除貌列餓と容協列餓
Takanori Nakai
?
Analysis of Learning from Positive and Unlabeled Data
Analysis of Learning from Positive and Unlabeled DataAnalysis of Learning from Positive and Unlabeled Data
Analysis of Learning from Positive and Unlabeled Data
Takanori Nakai
?
Positive Unlabeled Learning for Deceptive Reviews Detection
Positive Unlabeled Learning for Deceptive Reviews DetectionPositive Unlabeled Learning for Deceptive Reviews Detection
Positive Unlabeled Learning for Deceptive Reviews Detection
Takanori Nakai
?
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Modeling Mass Protest Adoption in Social Network Communities using Geometric ...
Takanori Nakai
?
Similarity component analysis
Similarity component analysisSimilarity component analysis
Similarity component analysis
Takanori Nakai
?
Query driven context aware recommendation
Query driven context aware recommendationQuery driven context aware recommendation
Query driven context aware recommendation
Takanori Nakai
?
Unsupervised Graph-based Topic Labelling using DBpedia
Unsupervised Graph-based Topic Labelling using DBpediaUnsupervised Graph-based Topic Labelling using DBpedia
Unsupervised Graph-based Topic Labelling using DBpedia
Takanori Nakai
?
Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Psychological Advertising_Exploring User Psychology for Click Prediction in S...Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Psychological Advertising_Exploring User Psychology for Click Prediction in S...
Takanori Nakai
?
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
永雨遺悪モデルの癖喘箭歳淆曚鯤防呂欧榛鵝倖繁議にやっていたリサ`チ
Takanori Nakai
?
署旋豚g夛について:Forward Martingale MeasureのС
署旋豚g夛について:Forward Martingale MeasureのС署旋豚g夛について:Forward Martingale MeasureのС
署旋豚g夛について:Forward Martingale MeasureのС
Takanori Nakai
?
Topic discovery through data dependent and random projections
Topic discovery through data dependent and random projectionsTopic discovery through data dependent and random projections
Topic discovery through data dependent and random projections
Takanori Nakai
?

GBDTを聞ったfeature transformationのm喘箭

  • 1. GBDTを聞った feature transformationのm喘箭 毅輝 @Quasi_quant2010 デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20101 ‐デ`タサイエンスLT疾り 2匚朕/
  • 2. 古勣 - 蒙翮燭力珸v(掲侘來)をGDBTで渇竃 - デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20102 ? ケ`ス ? 嚠yラベル債Г互い?詰い ? feature債襠h?縮圄定方?誘Yp払?Prg/L, etc ? 箭えば、(Prg/L, 誘Y旋吩)の屈つをMみ栽わせたr、 Prgは玉いが、誘Y旋吩が互い繁は互いA鬚砲△襪呂 ? ドメイン岑Rより、Featureをand訳周のMみ栽わせで 掲侘featureは恬れる ? ただし、Qyしたfeatureが謹い栽、Mみ栽わせは峺方卯k ? そもそも、繁gがゼロから掲侘featureをOするのは寄 ? 掲侘來のOをGBDTでI尖した瘁、侘モデルで嚠y 念I尖 蛍匂
  • 3. gYY惚 - Stacking+Blending P GBDT+LR > LR - ? GBDTのMax_Depthは8 ? 鏡羨にえるfeatureに掲侘來があった デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20103 Model accuracy precision recall f-value LR 8.35e-01 9.22e-01 8.67e-01 8.94e-01 GDBT+LR **8.63e-01 **9.31e-01 8.91e-01 9.11e-01 Stacking+ Blending 8.62e-01 9.30e-01 **8.92e-01 **9.11e-01 廣1) 麻デ`タ : Adult Data Set (goo.gl/GzB8bS) age workclass sex education education- num 39 State-gov male Bachelors 13 50 Self-emp- not-inc female Bachelors 13 廣2) 5-Fold 廣3) ** : Best Score 廣4) カテゴリカル篳は 畠てOne-hot-encoding デ`タセット箭 嚠yY惚
  • 4. 歌深 - GBDTとは - ? PAC Learning ? Boostingとは樋僥匂をたくさん鹿めて僥匂を恬ろう ? C亠僥 ? PAC Learningをp払v方を恷弌晒する}として壅協x、 p払を恷弌晒する圭鬚鯡修垢里帽甘簀鵑鯤垢辰討い襪里如 Gradient Boosting ? ポイント ? negative gradientを恷弌屈\除貌し、樋僥匂を容協 ? しくは ? [Quasi_quant2010c] を歌孚 デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20104
  • 5. 念I尖(イメ`ジ) - 掲侘來のOをGBDTでI尖 - ? 2つのQ協直のアンサンブル箭 ? 匯つは3つのleaf node(A) ? 匯つは2つのleaf node(B) ? デ`タ箭 ? Aの2桑朕のleaf nodeに欺_ ? Bの1桑朕のleaf nodeに欺_ ? 掲侘Q瘁のfeatureは [0,1,0,1,0] となる デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20105 哈喘 [H.Xinran, etc] Figure1 Input Features Transoformed Features 侘モデル で嚠y GBDTの圻尖がp払を恷弌晒するように直を弖紗するという泣で功 をもち、Q協直が}方and訳周の秤鵑瞋个垢觀脳侘Qが辛嬬 A B
  • 6. gYY惚 - FeatureImportanceと屎t晒path - デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20106 ? Featuregのand訳周を深]辛 ? age * hours-parweek吉 ? Blendingはp払v方と屎t晒v 方のMみ栽わせを曳^ ? p払v方 : Logistic-Loss or Hinge Loss ? 屎t晒v方 : L1 or L2 Ridge指「でBlending
  • 7. 深賀 - サンプルデ`タの尅り卦り - ? モデルの尅り卦り ? GBDTがfeaturegの珸vをうまくI尖したか ? 恬ったtreeにvし、max_depthが8なので、うまくI尖できた ? ただし、g佞任Hyper-paramsを般塚く{屁する駅勣あり ? g佞鯱覿┐靴腎颪蠏気 ? 仏貨g悶が嗤燭覆里、}栽勣咀なのか ? 書指のデ`タでは、仏貨}栽も嗤燭世辰 ? 何Tg悶により森という鷂罎あった栽 それは、`りであることがモデル貧_Jできる ? Q麻貧並gかは、掲侘featureを児にб罎鰈頚Eすればよい ? モデルではビジネスサイドが{誼できないので、 深賀をビジネスサイドの返乾り湖に除づけることも嶷勣 デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20107
  • 8. 深賀(g佞箸いσ泣で) - 仏貨への幣又を誼られることが恷も嶷勣 - ? α,βなど、仏貨g悶をuするのではなく、仏貨のMみ栽わ せをuできるMみなので、より人Q議な尅り卦りが辛嬬 ? 仏貨g悶しかuできないとPDCAを指し俳るのにrgがかかる ? Qyした蒙翮燭鬟皀妊襪之脳侘Qしているものの、 Lれ篳を秘していないため、g悶仏貨(feature) や} 栽仏貨(掲侘feature)にvする尅り卦りが辛嬬 ? g悶仏貨 ? GBDTのfeature importance ? }栽仏貨 ? 掲侘Qしたfeatureのweight(侘モデルのfeature weight) ? featureの芦協來も紗龍する並も辛嬬で、隔A森もわかる デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20108
  • 9. 歌深猟 ? **[H.Xinran, etc] Practical Lessons from Predicting Clicks on Ads at Facebook. ADKDD14 ? [C.Zhicheng, etc] Optimal Action Extraction for Random Forests and Boosted Trees. KDD15 ? [Quasi_quant2010a] Gradient Boostingについて - Scikit-Learnを 聞ったfeature transformation(GBDT + LR vs LR) - goo.gl/Pkto81 ? [Quasi_quant2010b] Stacking - テンプレ`ト晒?麻「 - goo.gl/jXSrw8 ? [Quasi_quant2010c] Gradient Boostingについて - 箴 - goo.gl/tng0vl ? [Quasi_quant2010d] Gradient Boostingについて - 屎t晒? Xgboost C goo.gl/dBQqYc デ`タサイエンスLT疾り 2匚朕 @Quasi_quant20109