狠狠撸

狠狠撸Share a Scribd company logo
尝别迟中部2012シンホ?スライト?
より好ましい統計手法1
 —Resampling Methods—
例えばこんなデータ




            3
データはきったない



        4
とりあえず平均




          5
なんか違うけど...	
 ?まあいいか。




  「t	
 ?検定?分散分析は	
 ?n	
 ?が大きければ,
  ?前提が満たされなくても頑健性(robustness)を持つ。」   6
Q-?‐Q	
 ?Plot




                7
外れ値を含む场合の対処方法
        橋本(2011)

? 一定基準以上(平均値±2/3SDなど)の
 値を取り除く。

? データを変換(対数変換?逆変換)する。
? 何もしない。
外れ値は外していいの?

? 明らかに反応がおかしい場合?Yes
? 特殊な集団を対象とした実験の場合?No
? 実験デザインを考えて,サンプルサイズ
 が小さくなる場合?No
尝别迟中部2012シンホ?スライト?
Resampling
手元の観測データ(標本)を使って,
再度サンプリング(再抽出)を行い,
新しい標本を複数作り,その統計量を
推定する方法。
搁别蝉补尘辫濒颈苍驳のイメージ
                              3   7      8            5
                          4
    1                                                     9
                  2
        3               5     6   3      1            2
              6
7                                     M	
 ?=	
 ?4.9
         9            8


                              9個の抽出を

        M	
 ?=	
 ?5.0         	
 ?	
 ?1,000回程度繰り返す
尝别迟中部2012シンホ?スライト?
... N
はじめのデータに适用
Resampling
         大きく2つに分類



? Bootstrapping (Jackknife)
? Permutation (Randomization)
 tests
Bootstrapping



http://blog.templatemonster.com/2012/10/04/bootstrap-templates-launch/



     h"p://images.yourdic3onary.com/jackknife




                               Jackknife
                                                                         http://www.lhup.edu/~dsimanek/museum/themes/NewtonsThird.htm
4
    1                         3    7   8   5
                2
        3           5                            9
            6                 6    3   1   2
7
        9           8

                            同じものを再度抽出
                            (リサンプリング)することを
                            許すのが Bootstrapping
                            許さないのがJackknife
Resampling
         大きく2つに分類



? Bootstrapping (Jackknife)
? Permutation (Randomization)
 Tests
並べ替え検定
Permutation/Randomization Tests
                                  R. Fisher




? 母集団の分布(正規分布など)の仮定なし。
? 小さいサンプルで外れ値が含まれている
 ときには,パラメトリック検定よりも有効。

? 常に正しい p 値を得ることができる。
? 推測統計よりも,考え方がシンプル。
ノンパラでいいのでは?

? 分布の仮定が必要ないということと,
 外れ値が含まれている場合に有効とい
 う点ではノンパラと同じ。

? しかし,ノンパラもパラメトリック検
 定と同様に,特定の確率分布を基に
 p 値の推定を行う。
                      21
ノンパラでいいのでは?

? パラメトリック検定やノンパラメトリ
 ック検定で推定しようとしている?近
 似(approximation)を行っている p の
 正しい値
 = Permutation (Randomization) testsで
 ?得られる p 値
                                        22
Howell	
 ?(2002)
“I	
 ?believe	
 ?that	
 ?in	
 ?a	
 ?short	
 ?Dme	
 ?they	
 ?
  will	
 ?overtake	
 ?what	
 ?are	
 ?now	
 ?the	
 ?
  more	
 ?common	
 ?nonparametric	
 ?
  tests,	
 ?and	
 ?may	
 ?eventually	
 ?
  overtake	
 ?the	
 ?tradiDonal	
 ?
  parametric	
 ?tests”	
 ?(p.	
 ?692).
                                                           23
“The	
 ?day	
 ?.	
 ?.	
 ?.	
 ?has	
 ?come.”
                           R版ではノンパラなし




                                              24
以心伝心




       25
並べ替え検定の例
Permutation/Randomization Tests
Permutation/Randomization Tests
Permutation/Randomization Tests
n	
 ?=	
 ?12	
 ?で	
 ?2	
 ?群に	
 ?6	
 ?個のデータ
      すべての組み合わせ	
 ?
            12!/6!/6!	
 ?=	
 ?924

差が30以上の組み合わせは54組
   54	
 ?/	
 ?924	
 ?=	
 ?0.058	
 ?(これが	
 ?p	
 ?値)
p	
 ?値の比較
尝别迟中部2012シンホ?スライト?
母集団への一般化
      どちらも同じものだが呼び名が違う



? 並べ替え検定(Permutation Test)
 → 推定の対象は母集団(研究向き)


? 確率化検定(Randomization Test)
 → 手元のサンプルのみ(実践向き)
                              31
どうやって
やればいいですか?




            32
より好ましい統計手法2
  —Effect 厂颈锄别蝉—
差が大きいのはどちら?
差が大きいのはどちら?
効果量


	
 ?統計的検定の問題
-?‐	
 ?サンプルサイズが影響。
-?‐	
 ?有意差あり?なしのみの判断。
-?‐	
 ?p	
 ?値は実質的な差を示さない。
効果量


	
 ?効果量(e?ect	
 ?size)
-?‐	
 ?サンプルサイズに影響されない。
-?‐	
 ?効果の大小を示す。
-?‐	
 ?実質的な差を確認できる。
効果量 d = 0.2 / r = 0.1



効果量 d = 0.2 / r = 0.1
<さらに発展編>

統計的有意差検定さようなら?

             39
一般化線形モデル
 GLM	
 ?(Generalized	
 ?Linear	
 ?Model)

検定
  帰無仮説検定である要因の影響を調べる。

 まったく別のものではなく発展させたもの


モデル選択
  データを最もよく説明しているモデルを選ぶ。

                                           40
“A picture is worth a thousand p values.”
                                (Loftus, 1993)




より好ましい図示方法
  —Visualization—
分布を见せる




         42
「隠れる」「隠される」情報がない

100


 90
           ***
                      CALL


 80
                             ***

 70


 60


 50


 40


 30


 20


 10


  0
      10         20     40




                 OK                Better
个别のデータも见せる
                0.700




                0.600




                0.500




                0.400
Oxy-Hb(mM-mm)




                0.300




                0.200




                0.100




                0.000
                         Normal   Scanning
                                             44

                -0.100
个别のデータも见せる




             45
論旨に合った図示方法
前田啓朗 (2008). WBTを援用した授業で成功した学習者?
 成功しなかった学習者. ARELE, 19, 253–262.
再现性は科学の基本

? データの二次利用を推奨すべき。
 例えば,使用したデータを(個人情報に
 気をつけて)オンラインなどで公開。

? ソフトウェアのスクリプトも公開
 すれば,誰でも再現ができる。
再现性は科学の基本




     http://www.apa.org/pubs/journals/arc/
まとめ
?	
 ?“Resampling”	
 ?-?‐-?‐-?‐	
 ?強力なツール
?「効果量」-?‐-?‐-?‐	
 ?実質的な意味
?「p	
 ?値」よりも「図」で語る
?	
 ?	
 ?再現性を重視する風土を!
推薦書籍(入門編)




www.mizumot.com/lablog
Ad

Recommended

PDF
異常検知と変化検知 9章 部分空間法による変化点検知
hagino 3000
?
PPTX
DLLab 異常検知ナイト 資料 20180214
Kosuke Nakago
?
PDF
外れ値
Shintaro Fukushima
?
PPTX
データマイニングにおける属性构筑、事例选択
无职
?
PDF
Maeshori missing
Daisuke Ichikawa
?
PPTX
Interpreting Tree Ensembles with inTrees
Satoshi Kato
?
PPTX
研究説明(学部生向け)
yoshida takayuki
?
PDF
中古车贩売の価格予测モデル(2)
IBM Analytics Japan
?
PDF
搁を使ったコンピュータ适応型テスト构筑の试み
Mizumoto Atsushi
?
PDF
LET2015 National Conference Seminar
Mizumoto Atsushi
?
PDF
JSSS2014 Symposium (Atsushi Mizumoto)
Mizumoto Atsushi
?
PDF
2015-1003 英語コーパス学会ワークショップ使用スライド
Mizumoto Atsushi
?
PDF
2013 11 jacet-kansai-ws
Mizumoto Atsushi
?
PDF
2013全国英语教育学会奥厂公开用スライド
Mizumoto Atsushi
?
PDF
量的テ?ータの分析?报告て?気をつけたいこと
Mizumoto Atsushi
?
PDF
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
yasuimao
?
PDF
SappoRo.R #3 LT: Shiny by RStudio
Mizumoto Atsushi
?
PDF
2012-1110「マルチレベルモデルのはなし」(肠别苍蝉辞谤别诲)
Mizumoto Atsushi
?
PPTX
第五回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
PDF
20130223冲集计?分析の基础@アンケート研究会
Takanori Hiroe
?
PPTX
13.01.20. 第1回DARM勉強会資料#4
Yoshitake Takebayashi
?
PPT
K020 appstat201202
t2tarumi
?
PDF
Rm20130626 10key
youwatari
?
PDF
一般化線形混合モデル isseing333
Issei Kurahashi
?
PDF
R Study Tokyo03
Yohei Sato
?
PDF
贰虫肠别濒を使った统计解析とグラフ化入门
Mizumoto Atsushi
?
PPTX
第二回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
PDF
Rで実験計画法 後編
itoyan110
?
PDF
Tokyor24 doradora09
Nobuaki Oshiro
?
PPTX
ブートストラップ法とその周辺と搁
Daisuke Yoneoka
?

More Related Content

Viewers also liked (10)

PDF
搁を使ったコンピュータ适応型テスト构筑の试み
Mizumoto Atsushi
?
PDF
LET2015 National Conference Seminar
Mizumoto Atsushi
?
PDF
JSSS2014 Symposium (Atsushi Mizumoto)
Mizumoto Atsushi
?
PDF
2015-1003 英語コーパス学会ワークショップ使用スライド
Mizumoto Atsushi
?
PDF
2013 11 jacet-kansai-ws
Mizumoto Atsushi
?
PDF
2013全国英语教育学会奥厂公开用スライド
Mizumoto Atsushi
?
PDF
量的テ?ータの分析?报告て?気をつけたいこと
Mizumoto Atsushi
?
PDF
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
yasuimao
?
PDF
SappoRo.R #3 LT: Shiny by RStudio
Mizumoto Atsushi
?
PDF
2012-1110「マルチレベルモデルのはなし」(肠别苍蝉辞谤别诲)
Mizumoto Atsushi
?
搁を使ったコンピュータ适応型テスト构筑の试み
Mizumoto Atsushi
?
LET2015 National Conference Seminar
Mizumoto Atsushi
?
JSSS2014 Symposium (Atsushi Mizumoto)
Mizumoto Atsushi
?
2015-1003 英語コーパス学会ワークショップ使用スライド
Mizumoto Atsushi
?
2013 11 jacet-kansai-ws
Mizumoto Atsushi
?
2013全国英语教育学会奥厂公开用スライド
Mizumoto Atsushi
?
量的テ?ータの分析?报告て?気をつけたいこと
Mizumoto Atsushi
?
コーパス分析ツールの選択肢の一つとしての CasualConc - 2015 英語コーパス学会@愛知大学名古屋キャンパス
yasuimao
?
SappoRo.R #3 LT: Shiny by RStudio
Mizumoto Atsushi
?
2012-1110「マルチレベルモデルのはなし」(肠别苍蝉辞谤别诲)
Mizumoto Atsushi
?

Similar to 尝别迟中部2012シンホ?スライト? (20)

PPTX
第五回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
PDF
20130223冲集计?分析の基础@アンケート研究会
Takanori Hiroe
?
PPTX
13.01.20. 第1回DARM勉強会資料#4
Yoshitake Takebayashi
?
PPT
K020 appstat201202
t2tarumi
?
PDF
Rm20130626 10key
youwatari
?
PDF
一般化線形混合モデル isseing333
Issei Kurahashi
?
PDF
R Study Tokyo03
Yohei Sato
?
PDF
贰虫肠别濒を使った统计解析とグラフ化入门
Mizumoto Atsushi
?
PPTX
第二回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
PDF
Rで実験計画法 後編
itoyan110
?
PDF
Tokyor24 doradora09
Nobuaki Oshiro
?
PPTX
ブートストラップ法とその周辺と搁
Daisuke Yoneoka
?
PDF
反応时间データをどう分析し図示するか
SAKAUE, Tatsuya
?
PPTX
搁で学ぶ観察データでの因果推定
Hiroki Matsui
?
PDF
Rm20140702 11key
youwatari
?
PDF
搁で学ぶロバスト推定
Shintaro Fukushima
?
PDF
JASELE2015-KumamotoWS
SAKAUE, Tatsuya
?
PDF
第2回顿础搁惭勉强会
Masaru Tokuoka
?
PDF
Datamining 4th adaboost
sesejun
?
PDF
MCMCサンプルの使い方 ~見る?決める?探す?発生させる~
. .
?
第五回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
20130223冲集计?分析の基础@アンケート研究会
Takanori Hiroe
?
13.01.20. 第1回DARM勉強会資料#4
Yoshitake Takebayashi
?
K020 appstat201202
t2tarumi
?
Rm20130626 10key
youwatari
?
一般化線形混合モデル isseing333
Issei Kurahashi
?
R Study Tokyo03
Yohei Sato
?
贰虫肠别濒を使った统计解析とグラフ化入门
Mizumoto Atsushi
?
第二回统计学勉强会蔼东大驹场
Daisuke Yoneoka
?
Rで実験計画法 後編
itoyan110
?
Tokyor24 doradora09
Nobuaki Oshiro
?
ブートストラップ法とその周辺と搁
Daisuke Yoneoka
?
反応时间データをどう分析し図示するか
SAKAUE, Tatsuya
?
搁で学ぶ観察データでの因果推定
Hiroki Matsui
?
Rm20140702 11key
youwatari
?
搁で学ぶロバスト推定
Shintaro Fukushima
?
JASELE2015-KumamotoWS
SAKAUE, Tatsuya
?
第2回顿础搁惭勉强会
Masaru Tokuoka
?
Datamining 4th adaboost
sesejun
?
MCMCサンプルの使い方 ~見る?決める?探す?発生させる~
. .
?
Ad

尝别迟中部2012シンホ?スライト?