狠狠撸

狠狠撸Share a Scribd company logo
Bootstrap Method
の勉強メモ
注:このスライドはブログ記事の一部として利用しています。
Webページデザインとは何の関係もありません。
統計分野でのBootstrapのスライドとなります
内容についての正確性は保証できかねますのでご了承ください
未知の母集団?
?
?1 ?2 ?3 ??? ?n
n個の
ランダム
サンプリング
? = ?(?1, ?2,, ?3 ? , ? ?)
?: 推定したいパラメーター
ここで、母集団Pがどんな分布なのかは不明???
母集団?
?
もし、母集団PからB回、ランダムサンプリングすることが
できたらこんな感じで推定が可能。
n個のRS
→ ?1
n個のRS
→ ?2
n個のRS
→ ? ?
?
?
?
平均
? =
1
?
?=1
?
??
分散
?2 =
1
?
?=1
?
(??)2 ?
1
?
?=1
?
??
2
平均
? =
1
?
?=1
?
?? →
?
? ?
分散
?2 =
1
?
?=1
?
(??)2 ?
1
?
?=1
?
??
2
→
?
???(?)
Bの数を無限に増やしていくと、Mの真の平均?(?)と、
真の分散??? ? の値となる
母集団?
? ただし、現実は、母集団から無限に
ランダムサンプリングすることはできない。
手元のデータからなんとかしたい
そのためには
?Empirical Distribution Function
?Plug-in Estimator
の考え方が必要
手元の
データ
Empirical Distribution Function
? ? =
1
?
?=1
?
?(?? ≤ ?)
?はインジケーター関数
例:10個のランダムサンプルの結果が
{1,3,3,5,6,7,7,7,8,8}であれば ?(?)は、こん
な感じのグラフになる
? ? =
0, ? < 1
0.1, 1 ≤ ? < 3
0.3, 3 ≤ ? < 5
?
1, 8 ≤ ?
? 4 =
1
10
?=1
10
?(?? ≤ ?)
=
1
10
? ?1 ≤ 4 + ? ?2 ≤ 4 + ? ?3 ≤ 4
+? ?4 ≤ 4 + ? ?5 ≤ 4 + ? ?6 ≤ 4
+? ?7 ≤ 4 + ? ?8 ≤ 4 + ? ?9 ≤ 4 + ? ?10 ≤ 4 )
=
1
10
? 1 ≤ 4 + ? 3 ≤ 4 + ? 3 ≤ 4
+? 5 ≤ 4 + ? 6 ≤ 4 + ? 7 ≤ 4
+? 7 ≤ 4 + ? 7 ≤ 4 + ? 8 ≤ 4 + ? 8 ≤ 4 )
=
1
10
1 + 1 + 1 + 0 + 0 + 0 + 0 + 0 + 0 + 0 = 0.3
x=4のとき
Statistical Functional
0.0
0.1
0.2
0.3
0.4
1 2 3 4 5
0.00
0.25
0.50
0.75
1.00
1 2 3 4 5
PMF:?(?)
? 2 = 0.4
CDF:?(?)
? = 2
? 2 = 0.6
? 1 = 0.2
?? ?
??
= 0.4, ?? ? = 2
?? ?
??
= ?(?)
?? ? = ? ? ??
とできる。
これは、連続値のPDFでも同様なので、
CDFの傾きとPMFの個別の値が一致する
ことを利用して、
? ? = ? ??(?) = ? ? ? ?? =
?
? ?(?)
Statistical Functional とは、推定したい
値をCDFを含んだ形とすること?で、
例えば、E(X)であれば、
Statistical Functional
? = ? ? = ? ? = ? ??(?) = ? ? ? ??
? = ? ? = ?2
= ?2
??(?) ? ? ? ? ??
2
このように、平均や分散等、色々な統計的な推定したい値をF(x)を用いて表現可能。
Plug-in Estimator
母集団?
?
手元の
データ
ここで、母集団からMを推定したい場合、Fの分布がわかっていれば、Mを推定できるが、
それがわからないので、???: ?(?)の代わりに、???: ?(?)を用いる!
?は?のplug-in estimator!
? = ?(?) ? = ?( ?)
? ? =
1
?
?=1
?
?(?? ≤ ?)
まとめるt、EDF: ?(?)は、
? ? =
0, ? < 1
0.1, 1 ≤ ? < 3
0.3, 3 ≤ ? < 5
?
1, 8 ≤ ?
その、PMF(?(?))は、
? ? =
1
?
, ? ∈ {?1, ?2, ? ? ?}
? = ? ? = ? ? ? ?(?) = ? ? ? ? ?? =
1
?
?=1
?
?(?)
?? ?
??
= ?(?)
なので、
? =
1
?
?=1
?
?(?)
分散を求めてみると
? = ? ? = ?2
= ?2 ? ? (?) ? ? ? ? ??
2
= ?2
? ? ?? ? ?? ? ??
2
=
1
?
?=1
?
?2
?
1
?
?=1
?
?
2
と、EDFから ?を求めることは比較的簡単!
ここで、この ?の分散を求める場合は、
母
集
団
?
→ ?1
n個のRS
→ ?2
→ ? ?
?
?
?
平均
?[ ?] =
1
?
?=1
?
??
分散
???( ?) =
1
?
?=1
?
( ??)2
?
1
?
?=1
?
??
2
手
元
の
デ
ー
タ
RS
とすることで求めることができる
分布:?
分布: ?
ここで、ブートストラップで推定した???( ?)が母集団のMの分散と一致するためには何が必要かを考えると、
母
集
団
?
→ ?1
n個のRS
→ ?2
→ ? ?
?
?
?
平均
?[ ?] =
1
?
?=1
?
??
分散
???( ?) =
1
?
?=1
?
( ??)2
?
1
?
?=1
?
??
2
手
元
の
デ
ー
タ
RS
分布:?
分布: ?
仮定1
仮定2
???( ?) =
1
?
?=1
?
( ??)2
?
1
?
?=1
?
??
2
分布:? 分布: ?
仮定1
仮定2
仮定1:
母集団の分布のCDF(?)と手元のデータのEDF( ?)が近似できること
また、
分散を求める関数がSmoothness Conditionを満たしていること(微分可能なこと)
???(?; ?) ???( ?; ?)
仮定2:
??? ? と???( ?; ?)が近似できること
?CDFとEDFが近似できるかどうかはわからないものの、データ数が十分に多ければ
ある程度近似できる?
?微分可能な条件等については、調べきれていないが、分散は問題なしとのこと。
?ここの近似は、Bの数を大きくすること(サンプリング回数を大きくする)こと
で、問題はなさそう。

More Related Content

What's hot (20)

PDF
変分推論と Normalizing Flow
Akihiro Nitta
?
PPTX
深层学习による自然言语処理の研究动向
STAIR Lab, Chiba Institute of Technology
?
PDF
MLaPP 24章 「マルコフ連鎖モンテカルロ法 (MCMC) による推論」
moterech
?
PDF
Statistical Semantic入門 ~分布仮説からword2vecまで~
Yuya Unno
?
PPTX
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
?
PDF
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
?
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
驰补丑辞辞!デベロッパーネットワーク
?
PDF
研究室における研究?実装ノウハウの共有
Naoaki Okazaki
?
PDF
パターン认识と机械学习入门
Momoko Hayamizu
?
PDF
笔蝉测肠丑辞笔测を使った初学者向けの心理実験环境の构筑
Hirokazu Ogawa
?
PDF
(修正)機械学習デザインパターン(ML Design Patterns)の解説
Hironori Washizaki
?
PDF
データに内在する构造をみるための埋め込み手法
Tatsuya Shirakawa
?
PPTX
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
?
PDF
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Yusuke Uchida
?
PDF
情报推荐システム入门:讲义スライド
Kenta Oku
?
PDF
実装ディープラーニング
Yurie Oka
?
PDF
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
?
PDF
Python nlp handson_20220225_v5
博三 太田
?
PDF
cvpaper.challenge 研究効率化 Tips
cvpaper. challenge
?
PPTX
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
?
変分推論と Normalizing Flow
Akihiro Nitta
?
深层学习による自然言语処理の研究动向
STAIR Lab, Chiba Institute of Technology
?
MLaPP 24章 「マルコフ連鎖モンテカルロ法 (MCMC) による推論」
moterech
?
Statistical Semantic入門 ~分布仮説からword2vecまで~
Yuya Unno
?
畳み込みニューラルネットワークの高精度化と高速化
Yusuke Uchida
?
最近の碍补驳驳濒别に学ぶテーブルデータの特徴量エンジニアリング
mlm_kansai
?
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
驰补丑辞辞!デベロッパーネットワーク
?
研究室における研究?実装ノウハウの共有
Naoaki Okazaki
?
パターン认识と机械学习入门
Momoko Hayamizu
?
笔蝉测肠丑辞笔测を使った初学者向けの心理実験环境の构筑
Hirokazu Ogawa
?
(修正)機械学習デザインパターン(ML Design Patterns)の解説
Hironori Washizaki
?
データに内在する构造をみるための埋め込み手法
Tatsuya Shirakawa
?
【DL輪読会】Visual Classification via Description from Large Language Models (ICLR...
Deep Learning JP
?
最近のSingle Shot系の物体検出のアーキテクチャまとめ
Yusuke Uchida
?
情报推荐システム入门:讲义スライド
Kenta Oku
?
実装ディープラーニング
Yurie Oka
?
【メタサーベイ】基盤モデル / Foundation Models
cvpaper. challenge
?
Python nlp handson_20220225_v5
博三 太田
?
cvpaper.challenge 研究効率化 Tips
cvpaper. challenge
?
Curriculum Learning (関東CV勉強会)
Yoshitaka Ushiku
?

Similar to Bootstrap methodの勉強メモ (20)

PDF
パターン認識 04 混合正規分布
sleipnir002
?
PPTX
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
Yu Otsuka
?
PDF
第8回スキル养成讲座讲义资料.辫诲蹿
keiodig
?
PDF
混合ガウスモデルと贰惭アルゴリスム
貴之 八木
?
PPTX
骋尘尘勉强会
Hayato Ohya
?
PDF
第5章混合分布モテ?ルによる逐次更新型异常検知
Tetsuma Tada
?
PDF
第4回DARM勉強会 (構造方程式モデリング)
Yoshitake Takebayashi
?
PDF
【Zansa】第17回 ブートストラップ法入門
Zansa
?
PDF
Bishop prml 9.3_wk77_100408-1504
Wataru Kishimoto
?
PDF
統計的推定の基礎 1 -- 期待値の推定
Wataru Shito
?
PPTX
第五回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
PDF
クラシックな機械学習の入門  9. モデル推定
Hiroshi Nakagawa
?
PDF
厂迟补苍コードの书き方 中级编
Hiroshi Shimizu
?
PDF
Oshasta em
Naotaka Yamada
?
PDF
搁厂迟补苍と厂丑颈苍测厂迟补苍によるベイズ统计モデリング入门
Masaki Tsuda
?
PDF
Infomation geometry(overview)
Yoshitake Misaki
?
PDF
统计学における相関分析と仮説検定の基本的な考え方とその実践
id774
?
PDF
第8章 カ?ウス過程回帰による異常検知
Chika Inoshita
?
PDF
How to study stat
Ak Ok
?
PDF
prml_titech_9.0-9.2
Taikai Takeda
?
パターン認識 04 混合正規分布
sleipnir002
?
[The Elements of Statistical Learning]Chapter8: Model Inferennce and Averaging
Yu Otsuka
?
第8回スキル养成讲座讲义资料.辫诲蹿
keiodig
?
混合ガウスモデルと贰惭アルゴリスム
貴之 八木
?
骋尘尘勉强会
Hayato Ohya
?
第5章混合分布モテ?ルによる逐次更新型异常検知
Tetsuma Tada
?
第4回DARM勉強会 (構造方程式モデリング)
Yoshitake Takebayashi
?
【Zansa】第17回 ブートストラップ法入門
Zansa
?
Bishop prml 9.3_wk77_100408-1504
Wataru Kishimoto
?
統計的推定の基礎 1 -- 期待値の推定
Wataru Shito
?
第五回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
クラシックな機械学習の入門  9. モデル推定
Hiroshi Nakagawa
?
厂迟补苍コードの书き方 中级编
Hiroshi Shimizu
?
Oshasta em
Naotaka Yamada
?
搁厂迟补苍と厂丑颈苍测厂迟补苍によるベイズ统计モデリング入门
Masaki Tsuda
?
Infomation geometry(overview)
Yoshitake Misaki
?
统计学における相関分析と仮説検定の基本的な考え方とその実践
id774
?
第8章 カ?ウス過程回帰による異常検知
Chika Inoshita
?
How to study stat
Ak Ok
?
prml_titech_9.0-9.2
Taikai Takeda
?
Ad

Bootstrap methodの勉強メモ