狠狠撸

狠狠撸Share a Scribd company logo
操作変数法の書き方
田淵貴大
臨床疫学研究における報告の質向上のため
の統計学の研究会(REQUIRE研究会)
第15回研究集会(2014/12/6)
まずはじめに
? 操作変数法は、統計学に疎い私にとっ
ては非常に難解でした。
? 私はこれまで操作変数法を使ったこと
がありません。
? 本発表の内容は文献からの引用がほと
んどですが、私の理解が間違っている
かもしれません。
? 本発表に関する利益相反はありません。
本日の内容(40min)
(1) なぜ操作変数法なのか? (5min)
(2)操作変数法(IV)に関して報告するべきこと(25min)
IV Reporting Checklistと事例
IV reporting flowchartと推定効果の範囲
(3) IV の候補とバイアスへのケア(10min)
IVの候補
IV を脅かす交絡要因(IV-結果変数交絡要因)
なぜ操作変数法?
操作変数法
■英語表記
instrumental variable (IV) method
? 測定できていない交絡要因(Unmeasured
confounders)があっても、因果効果(causal
effects)を推定できる=疫学者の夢?
Hernan MA, Robins JM. Instruments for causal inference: an
epidemiologist's dream? Epidemiology. 2006;17(4):360-72.
A?Yを分析したい
Brookhart, M. A., et al.(2010). Confounding control in healthcare database research:
challenges and potential approaches. Med Care, 48(6 Suppl), S114-120.
重要なunobserved covariate(変数u)がモデル
に含められない時にどうするか?
1) 無視する?biased result
2) 変数uのproxy-variableを含める
3) 操作変数法(IV)を使う(Aと相関し、uおよびerrorと相
関しない、と論理的に説明できる変数z[IV]が必
要!)
4) 調査をやり直す(無理な分析をしない)
A?Yを分析したい
Y=β0+β1A+β2u+error
IVが必要ない場合
? errorにunobserved covariatesすべてが含まれる。
? 説明変数が外生性(exogenous)であれば、IVは必要
ない。
? 説明変数が内生性(endogenous)であってもerrorと相
関していないなら、IVは必要ない。
? IVがerrorと相関しないかどうか熟慮を要する。
Wooldridge 2013, p.534
IVを適用するために(仮定していること)
1. 操作変数が説明変数と関連していること
2. 操作変数は説明変数を介してのみ結果変数に影響
を与えていること (exclusion restriction)
3. 操作変数から結果変数への別のルートがないこと
4. 単調性 (monotonicity)
本日の内容(40min)
(1) なぜ操作変数法なのか? (5min)
(2)操作変数法(IV)に関して報告するべきこと(25min)
IV Reporting Checklistと事例
IV reporting flowchartと推定効果の範囲
(3) IV の候補とバイアスへのケア(10min)
IVの候補
IV を脅かす交絡要因(IV-結果変数交絡要因)
IV Reporting Checklist
Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
操作変数法を使用した研究のシステマティックレビューによって
報告すべき内容を確認
IV Reporting Checklist
1. 推定した結果の対象者は誰か、関連する仮定とともに記述
する。
2. partial F-statisticにて操作変数と説明変数の関連を記述する。
3. 操作変数と説明変数それぞれについて測定された交絡要因
との関連を報告もしくはテストする。
4. 複数の操作変数を使用する場合、過剰識別制約についてテ
ストする。
5. 2値の結果変数、説明変数、操作変数の場合、それぞれの頻
度についてクロスした集計表を呈示する。
6. 2値の結果変数について線形モデルを使用する場合、
sandwich estimatorsもしくはbootstrapによるstandard errors
を使用し、必要に応じて研究対象者のクラスターを考慮に入
れた分析を行う。
Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
事例
Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
事例は、医師の過去の処方をIVとしてCOX2阻害剤とNSAIDの比較に
おける胃腸障害および心筋梗塞の発症の差をみた研究
IV Reporting Checklist
2. partial F-statisticにて操作変数と説明変数の関連
を記述する。
28% の論文でF-statisticsもしくはpartial r2が報告されていた。
■事例 ●方法の節(partial F-statistic)
? We estimated the association of previous prescriptions
with actual prescriptions using linear regressions of
exposures on previous prescriptions and report the partial
r2 and partial F tests. Larger partial F statistics imply
stronger associations of previous prescriptions and
exposure.[46]
■事例 ●結果の節
? previous prescription was strongly associated with actual
prescription
事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
IV Reporting Checklist
3. 操作変数と説明変数それぞれについて測定さ
れた交絡要因との関連を報告もしくはテストす
る。
Risk differences were estimated using ordinary least squares regression of confounder
on exposure or instrument (COX-2s vs. nonselective NSAIDs).
事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
■事例 ●結果(Table)
IV Reporting Checklist
4. 複数の操作変数を使用する場合、過剰識別制
約(over identification)についてテストする。
i.e., Sargan test or Hansen test[116,117]
事例:Palmer TM, et al. Stat Methods Med Res 2012; 21(3): 223-42.
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
■事例
●方法の節(Sargan test)
? In models including multiple instruments
the Sargan test of over-identification,
available in the ivreg2 command, was used to
test the joint validity of the instruments.[39]
●結果の節(Sargan test+Table)
? For each multiple instrument model, the
Sargan over-identification test provides little
evidence against the joint validity of the
instruments.
(抜粋)
事例は、遺伝子をIVとした研究
IV Reporting Checklist
5. 2値の結果変数、説明変数、操作変数の場合、
それぞれの頻度についてクロスした集計表を
呈示する。
事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
■事例 ●結果の節
? All combinations of surrogate instruments, prescriptions, and
outcomes had one or more events (Table 2)
IV Reporting Checklist
6. 2値の結果変数について線形モデルを使用する
場合、robust (sandwich estimators)もしくは
bootstrapによるstandard errorsを使用し、必要
に応じて研究対象者のクラスターを考慮に入れ
た分析を行う。
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
IV Reporting Checklist
6. 2値の結果変数について線形モデルを使用する
場合、robust (sandwich estimators)もしくは
bootstrapによるstandard errorsを使用し、必要
に応じて研究対象者のクラスターを考慮に入れ
た分析を行う。
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
■事例
●方法の節(robust standard errors/clustering)
? We calculated robust standard errors accounting for
clustering of patients by physician and the binary
(heteroskedastic) outcome[36]
事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
IV Reporting Checklist
1. 推定した結果の対象者は誰か、関連する仮定
とともに記述する。
61%のStudyで明記されていた。 (Swanson 2013)
Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
例えば、
monotonicityの仮定のもとのlocal average treatment
effect(LATE)= complierにおける効果
no effect modificationの仮定のもとのaverage treatment
effect(ATE)=対象者全体における効果
本日の内容(40min)
(1) なぜ操作変数法なのか? (5min)
(2)操作変数法(IV)に関して報告するべきこと(25min)
IV Reporting Checklistと事例
IV reporting flowchartと推定効果の範囲
(3) IV の候補とバイアスへのケア(10min)
IVの候補
IV を脅かす交絡要因(IV-結果変数交絡要因)
IV reporting flowchart
Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
操作変数法で報告すべき内容をフローチャート形式で呈示
IV reporting flowchart
Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
IV reporting flowchart 前半
Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
仮定
(1) 操作変数が説明変数と関連している
こと
(2) 操作変数は説明変数を介してのみ結
果変数に影響を与えていること
(exclusion restriction)
(3) 操作変数から結果変数への別の
ルートがないこと
検証可能
検証不可能
IV reporting flowchart 後半
Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
仮定
(4h) for ATE 効果が均一である
(4m) for LATE 単調性(monotonicity)
No “defiers”
交互作用がないと仮定
4つの集団(angrist, imbens, & rubin, 1996)
■Compliers:いつも従順な人
■non-compliers:従順とはいえない人
?always-takers:いつも治療を受けることを選択する人
?never-takers:いつも治療を受けないことを選択する人
?Defiers:いつも反対を選ぶ人=“あまのじゃく”
4つの集団の例
? N=100, 50%でIV=1、全員がComplierではない
Complierは何%?
治療[T]
IV[Z] No[0]Yes[1] %
0 45 5 .10
1 15 35 .70
合計 60 40 .40
Compliers
or
never-takers
Defiers
or
never-takers
Defiers
or
always-takers
Compliers
or
always-takers
Complierの割合を計算
? Defierがいないと仮定
? すると、Z=1, T=0は全員never-taker (50人のうち
の15人 [30%])
? Z=0の集団でも30%がnever-takerとみなす
? 同様にして、10%がalways-taker
? 総合して、60% (100% - 30% - 10%)がcomplier
IV Estimators
? LATE; local average treatment effect (complierに
おける平均因果効果):母集団の構成員のうち
complier(暴露群と非暴露群)における結果変数
の期待値の差
? ATE; average treatment effect (平均因果効果):母
集団の構成員すべてが非暴露群から暴露群に
変化したときの,結果変数の期待値の差
? TET; treatment effect among the treated (暴露群
の平均因果効果)
? TEU; treatment effect among the untreated (非暴
露群の平均因果効果)
IV Reporting Checklist
1. 推定した結果の対象者は誰か、関連する仮定
とともに記述する。
■事例
●方法の節(local average treatment effect)
? This is the local average causal effect for patients who
would be prescribed COX-2s by physicians with
prescribing preference u*, but not by physicians with a
lower preference v.
The specific group of patients for whom this parameter
applies is unknown.[45]
Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
本日の内容(40min)
(1) なぜ操作変数法なのか? (5min)
(2)操作変数法(IV)に関して報告するべきこと(25min)
IV Reporting Checklistと事例
IV reporting flowchartと推定効果の範囲
(3) IV の分類とバイアスへのケア(10min)
IVの分類
IV を脅かす交絡要因(IV-結果変数交絡要因)
IVの分類とバイアスへのケア
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
systematic review in PubMed, EconLit, PsycINFO, Social Services
Abstracts, Social Sciences Citation Index, and Web of Science to
identify instrumental variable comparative effectiveness
research (CER) studies that were published in an English-
language, peer-reviewed journal through 31 December 2011
and conducted in the United States and other industrialized
countries.
187 IV studies in CER
これまで操作変数として使用された変数を分類し、それぞれで考慮すべき
交絡要因について説明 (ただし、GeneticsはIVの分類から除外)
IVの分類 in Davies 2013
Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
地域の特徴
病院や医師の治療パターン
その他
日付?時間
合併症
など
IVの分類
4 Most Commonly Used Instrument Categories in
Comparative Effectiveness Research
? Distance to facility: 患者住居から病院までの距離
? Regional variation:地域における治療パターン
? Facility variation:病院における治療パターン
? Physician variation:医師における治療パターン
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
分類に応じた操作変数(IV)の例
4 Most Commonly Used Instrument Categories in
Comparative Effectiveness Research
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
操作変数法における仮定とその違反
IV assumption and the violation
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
IV-結果変数間交絡要因
この交絡要因は操作変数法における仮定の(2)「操作変数は説明変数を介してのみ
結果変数に影響を与えていること (exclusion restriction)」に違反している!
IV-結果変数間交絡要因の分類
for the Most Commonly Used Instruments and a Mortality Outcome
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
For all type of instrument
1. Geographic location 都市/田舎
2. Patient characteristics 人種、学歴、所得、年齢、医療保
険、健康状態?合併症、健康行動
3. Treatment characteristics その他の治療を受けたかどう
か、治療までの時間
4. Facility characteristics 手術件数、診療科、教育施設かど
うか、公的機関かどうか
For Regional variation
1. Provider supply 病床数、介護施設数
2. Technology adoption and utilization 高度医療提供、
処方傾向
IV-結果変数間交絡要因の調整
for the Most Commonly Used Instruments and a Mortality Outcome
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
さいごに
? 操作変数法(IV)を使用した多く
の研究 (48 of 65 [74%])で、IV以
外の解析手法が併用されていた。
? どの解析にも前提とする仮定や
限界があり、十分に理解した上で
比較検討することが必要
Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
参考書籍
Wooldridge, Introductory
Econometrics 5e, 2013
Joshua D. Angrist , Jorn-Steffen Pischke,
Mostly Harmless Econometrics: An
Empiricist's Companion, 2009

More Related Content

What's hot (20)

明日から読めるメタ?アナリシス
明日から読めるメタ?アナリシス明日から読めるメタ?アナリシス
明日から読めるメタ?アナリシス
Yasuyuki Okumura
?
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics
?
质的変数の相関?因子分析
质的変数の相関?因子分析质的変数の相関?因子分析
质的変数の相関?因子分析
Mitsuo Shimohata
?
感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析
Takahiro Kubo
?
因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"
takehikoihayashi
?
第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)
Yoshitake Takebayashi
?
媒介分析について
媒介分析について媒介分析について
媒介分析について
Hiroshi Shimizu
?
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
Koichiro Gibo
?
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
logics-of-blue
?
非劣性试験の入门
非劣性试験の入门非劣性试験の入门
非劣性试験の入门
Yasuyuki Okumura
?
相関と因果について考える:统计的因果推论、その(不)可能性の中心
相関と因果について考える:统计的因果推论、その(不)可能性の中心相関と因果について考える:统计的因果推论、その(不)可能性の中心
相関と因果について考える:统计的因果推论、その(不)可能性の中心
takehikoihayashi
?
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
Makoto Hirakawa
?
ネットワークメタ分析入门
ネットワークメタ分析入门ネットワークメタ分析入门
ネットワークメタ分析入门
Senshu University
?
「操作変数法」の报告事例
「操作変数法」の报告事例「操作変数法」の报告事例
「操作変数法」の报告事例
Yoshitake Takebayashi
?
『バックドア基準の入门』@统数研研究集会
『バックドア基準の入门』@统数研研究集会『バックドア基準の入门』@统数研研究集会
『バックドア基準の入门』@统数研研究集会
takehikoihayashi
?
优れた研究论文の书き方
优れた研究论文の书き方优れた研究论文の书き方
优れた研究论文の书き方
Masanori Kado
?
优れた研究论文の书き方―7つの提案
优れた研究论文の书き方―7つの提案优れた研究论文の书き方―7つの提案
优れた研究论文の书き方―7つの提案
Masanori Kado
?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
Yasuyuki Okumura
?
社会心理学者のための时系列分析入门冲小森
社会心理学者のための时系列分析入门冲小森社会心理学者のための时系列分析入门冲小森
社会心理学者のための时系列分析入门冲小森
Masashi Komori
?
データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析
Seiichi Uchida
?
明日から読めるメタ?アナリシス
明日から読めるメタ?アナリシス明日から読めるメタ?アナリシス
明日から読めるメタ?アナリシス
Yasuyuki Okumura
?
Counterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイCounterfaual Machine Learning(CFML)のサーベイ
Counterfaual Machine Learning(CFML)のサーベイ
ARISE analytics
?
质的変数の相関?因子分析
质的変数の相関?因子分析质的変数の相関?因子分析
质的変数の相関?因子分析
Mitsuo Shimohata
?
感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析感情の出どころを探る、一歩进んだ感情解析
感情の出どころを探る、一歩进んだ感情解析
Takahiro Kubo
?
因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"因果推論の奥へ: "What works" meets "why it works"
因果推論の奥へ: "What works" meets "why it works"
takehikoihayashi
?
第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)第4回DARM勉強会 (構造方程式モデリング)
第4回DARM勉強会 (構造方程式モデリング)
Yoshitake Takebayashi
?
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
搁耻产颈苍の论文(の行间)を読んでみる-倾向スコアの理论-
Koichiro Gibo
?
1 4.回帰分析と分散分析
1 4.回帰分析と分散分析1 4.回帰分析と分散分析
1 4.回帰分析と分散分析
logics-of-blue
?
相関と因果について考える:统计的因果推论、その(不)可能性の中心
相関と因果について考える:统计的因果推论、その(不)可能性の中心相関と因果について考える:统计的因果推论、その(不)可能性の中心
相関と因果について考える:统计的因果推论、その(不)可能性の中心
takehikoihayashi
?
重回帰分析で交互作用効果
重回帰分析で交互作用効果重回帰分析で交互作用効果
重回帰分析で交互作用効果
Makoto Hirakawa
?
ネットワークメタ分析入门
ネットワークメタ分析入门ネットワークメタ分析入门
ネットワークメタ分析入门
Senshu University
?
『バックドア基準の入门』@统数研研究集会
『バックドア基準の入门』@统数研研究集会『バックドア基準の入门』@统数研研究集会
『バックドア基準の入门』@统数研研究集会
takehikoihayashi
?
优れた研究论文の书き方
优れた研究论文の书き方优れた研究论文の书き方
优れた研究论文の书き方
Masanori Kado
?
优れた研究论文の书き方―7つの提案
优れた研究论文の书き方―7つの提案优れた研究论文の书き方―7つの提案
优れた研究论文の书き方―7つの提案
Masanori Kado
?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
臨床疫学研究における傾向スコア分析の使い? ?観察研究における治療効果研究?
Yasuyuki Okumura
?
社会心理学者のための时系列分析入门冲小森
社会心理学者のための时系列分析入门冲小森社会心理学者のための时系列分析入门冲小森
社会心理学者のための时系列分析入门冲小森
Masashi Komori
?
データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析データサイエンス概論第一 5 時系列データの解析
データサイエンス概論第一 5 時系列データの解析
Seiichi Uchida
?

Viewers also liked (20)

搁で学ぶ観察データでの因果推定
搁で学ぶ観察データでの因果推定搁で学ぶ観察データでの因果推定
搁で学ぶ観察データでの因果推定
Hiroki Matsui
?
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
?
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
Hiroki Matsui
?
回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)
Jaehyun Song
?
Tokyo r25 hiro_macchan
Tokyo r25 hiro_macchanTokyo r25 hiro_macchan
Tokyo r25 hiro_macchan
Hiroki Matsui
?
Japan r.3
Japan r.3Japan r.3
Japan r.3
Hiroki Matsui
?
Excelでも統計分析 HADについて SappoRo.R#3
Excelでも統計分析 HADについて SappoRo.R#3Excelでも統計分析 HADについて SappoRo.R#3
Excelでも統計分析 HADについて SappoRo.R#3
Hiroshi Shimizu
?
20101002保健医疗分野から见た骋滨厂
20101002保健医疗分野から见た骋滨厂20101002保健医疗分野から见た骋滨厂
20101002保健医疗分野から见た骋滨厂
Tsubasa Suzuki
?
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー ) [2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
Infromation Literacy Working Group, Hokkaido University Library
?
観察研究の必须事项
観察研究の必须事项観察研究の必须事项
観察研究の必须事项
Yoshitake Takebayashi
?
ビッグデータ时代の个人情报保护法改正のあり方
ビッグデータ时代の个人情报保护法改正のあり方ビッグデータ时代の个人情报保护法改正のあり方
ビッグデータ时代の个人情报保护法改正のあり方
OpenID Foundation Japan
?
プライバシー保护の法制と技术课题(2014年时点)
プライバシー保护の法制と技术课题(2014年时点)プライバシー保护の法制と技术课题(2014年时点)
プライバシー保护の法制と技术课题(2014年时点)
Hiroshi Nakagawa
?
因果推论の基础
因果推论の基础因果推论の基础
因果推论の基础
Hatsuru Morita
?
ベイズ统计入门
ベイズ统计入门ベイズ统计入门
ベイズ统计入门
Miyoshi Yuya
?
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
?
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Yohei Sato
?
学部生向けヘ?イス?统计イントロ(公开版)
学部生向けヘ?イス?统计イントロ(公开版)学部生向けヘ?イス?统计イントロ(公开版)
学部生向けヘ?イス?统计イントロ(公开版)
考司 小杉
?
统计的因果推论勉强会 第1回
统计的因果推论勉强会 第1回统计的因果推论勉强会 第1回
统计的因果推论勉强会 第1回
Hikaru GOTO
?
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
?
搁で学ぶ観察データでの因果推定
搁で学ぶ観察データでの因果推定搁で学ぶ観察データでの因果推定
搁で学ぶ観察データでの因果推定
Hiroki Matsui
?
エクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについてエクセルで統計分析 統計プログラムHADについて
エクセルで統計分析 統計プログラムHADについて
Hiroshi Shimizu
?
Tokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's RuleTokyo r #37 Rubin's Rule
Tokyo r #37 Rubin's Rule
Hiroki Matsui
?
回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)回帰不連続デザイン(Regression Discontinuity Design, RDD)
回帰不連続デザイン(Regression Discontinuity Design, RDD)
Jaehyun Song
?
Excelでも統計分析 HADについて SappoRo.R#3
Excelでも統計分析 HADについて SappoRo.R#3Excelでも統計分析 HADについて SappoRo.R#3
Excelでも統計分析 HADについて SappoRo.R#3
Hiroshi Shimizu
?
20101002保健医疗分野から见た骋滨厂
20101002保健医疗分野から见た骋滨厂20101002保健医疗分野から见た骋滨厂
20101002保健医疗分野から见た骋滨厂
Tsubasa Suzuki
?
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー ) [2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
[2016年度]国際機関情報の探し方セミナー : 統計(労働?人口?教育?国際教育)編(前期アカデミックスキルセミナー )
Infromation Literacy Working Group, Hokkaido University Library
?
ビッグデータ时代の个人情报保护法改正のあり方
ビッグデータ时代の个人情报保护法改正のあり方ビッグデータ时代の个人情报保护法改正のあり方
ビッグデータ时代の个人情报保护法改正のあり方
OpenID Foundation Japan
?
プライバシー保护の法制と技术课题(2014年时点)
プライバシー保护の法制と技术课题(2014年时点)プライバシー保护の法制と技术课题(2014年时点)
プライバシー保护の法制と技术课题(2014年时点)
Hiroshi Nakagawa
?
ベイズ统计入门
ベイズ统计入门ベイズ统计入门
ベイズ统计入门
Miyoshi Yuya
?
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
?
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Rて?学ふ? 傾向スコア解析入門 - 無作為割り当てか?出来ない時の因果効果推定 -
Yohei Sato
?
学部生向けヘ?イス?统计イントロ(公开版)
学部生向けヘ?イス?统计イントロ(公开版)学部生向けヘ?イス?统计イントロ(公开版)
学部生向けヘ?イス?统计イントロ(公开版)
考司 小杉
?
统计的因果推论勉强会 第1回
统计的因果推论勉强会 第1回统计的因果推论勉强会 第1回
统计的因果推论勉强会 第1回
Hikaru GOTO
?
ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定ようやく分かった!最尤推定とベイズ推定
ようやく分かった!最尤推定とベイズ推定
Akira Masuda
?

Similar to 操作変数法の书き方冲田渊贵大 (20)

临床的有意性の书き方
临床的有意性の书き方临床的有意性の书き方
临床的有意性の书き方
Yasuyuki Okumura
?
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
Koichiro Gibo
?
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
Yasuyuki Okumura
?
诊断研究メタアナリシス报告事例
诊断研究メタアナリシス报告事例诊断研究メタアナリシス报告事例
诊断研究メタアナリシス报告事例
Takashi Fujiwara
?
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
Eizen Kimura
?
「诊断精度研究のメタ分析」の入门
「诊断精度研究のメタ分析」の入门「诊断精度研究のメタ分析」の入门
「诊断精度研究のメタ分析」の入门
yokomitsuken5
?
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システムイメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
Dell TechCenter Japan
?
项目反応理论による尺度运用
项目反応理论による尺度运用项目反応理论による尺度运用
项目反応理论による尺度运用
Yoshitake Takebayashi
?
万延する研究報告の質の低さの問題への 総合的対策
万延する研究報告の質の低さの問題への総合的対策万延する研究報告の質の低さの問題への総合的対策
万延する研究報告の質の低さの問題への 総合的対策
Yasuyuki Okumura
?
160509 STROBE解説
160509 STROBE解説160509 STROBE解説
160509 STROBE解説
KuraRINet
?
観察研究の质の评価
観察研究の质の评価観察研究の质の评価
観察研究の质の评価
Yoshitake Takebayashi
?
厂罢搁翱叠贰/厂罢础搁顿の解説
厂罢搁翱叠贰/厂罢础搁顿の解説厂罢搁翱叠贰/厂罢础搁顿の解説
厂罢搁翱叠贰/厂罢础搁顿の解説
Takashi Fujiwara
?
20130213勉強会_文献レビュー (1)
20130213勉強会_文献レビュー (1)20130213勉強会_文献レビュー (1)
20130213勉強会_文献レビュー (1)
Satoko Yamashita
?
研究の质を评価する重要性
研究の质を评価する重要性研究の质を评価する重要性
研究の质を评価する重要性
Yasuyuki Okumura
?
中断时系列分析の书き方
中断时系列分析の书き方中断时系列分析の书き方
中断时系列分析の书き方
Shuhei Ichikawa
?
20161015 srws第一回preliminarysearching 公開用
20161015 srws第一回preliminarysearching 公開用20161015 srws第一回preliminarysearching 公開用
20161015 srws第一回preliminarysearching 公開用
SR WS
?
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
Yoshitake Takebayashi
?
成果を确认しながら、患者安全活动を
成果を确认しながら、患者安全活动を成果を确认しながら、患者安全活动を
成果を确认しながら、患者安全活动を
Takahiro Matsumoto
?
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
Yasuyuki Okumura
?
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
Masakazu Umezawa
?
临床的有意性の书き方
临床的有意性の书き方临床的有意性の书き方
临床的有意性の书き方
Yasuyuki Okumura
?
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
Koichiro Gibo
?
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
Yasuyuki Okumura
?
诊断研究メタアナリシス报告事例
诊断研究メタアナリシス报告事例诊断研究メタアナリシス报告事例
诊断研究メタアナリシス报告事例
Takashi Fujiwara
?
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
正確性?連続性に関する考察 openEHRにおけるProblemの扱いの調査を通して
Eizen Kimura
?
「诊断精度研究のメタ分析」の入门
「诊断精度研究のメタ分析」の入门「诊断精度研究のメタ分析」の入门
「诊断精度研究のメタ分析」の入门
yokomitsuken5
?
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システムイメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
イメージングバイオマーカによる国際的産学連携イメージング ARO 支援システム
Dell TechCenter Japan
?
项目反応理论による尺度运用
项目反応理论による尺度运用项目反応理论による尺度运用
项目反応理论による尺度运用
Yoshitake Takebayashi
?
万延する研究報告の質の低さの問題への 総合的対策
万延する研究報告の質の低さの問題への総合的対策万延する研究報告の質の低さの問題への総合的対策
万延する研究報告の質の低さの問題への 総合的対策
Yasuyuki Okumura
?
160509 STROBE解説
160509 STROBE解説160509 STROBE解説
160509 STROBE解説
KuraRINet
?
厂罢搁翱叠贰/厂罢础搁顿の解説
厂罢搁翱叠贰/厂罢础搁顿の解説厂罢搁翱叠贰/厂罢础搁顿の解説
厂罢搁翱叠贰/厂罢础搁顿の解説
Takashi Fujiwara
?
20130213勉強会_文献レビュー (1)
20130213勉強会_文献レビュー (1)20130213勉強会_文献レビュー (1)
20130213勉強会_文献レビュー (1)
Satoko Yamashita
?
研究の质を评価する重要性
研究の质を评価する重要性研究の质を评価する重要性
研究の质を评価する重要性
Yasuyuki Okumura
?
中断时系列分析の书き方
中断时系列分析の书き方中断时系列分析の书き方
中断时系列分析の书き方
Shuhei Ichikawa
?
20161015 srws第一回preliminarysearching 公開用
20161015 srws第一回preliminarysearching 公開用20161015 srws第一回preliminarysearching 公開用
20161015 srws第一回preliminarysearching 公開用
SR WS
?
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
単一事例研究法と統計的推測:ベイズ流アプローチを架け橋として (文字飛び回避版はこちら -> /yos...
Yoshitake Takebayashi
?
成果を确认しながら、患者安全活动を
成果を确认しながら、患者安全活动を成果を确认しながら、患者安全活动を
成果を确认しながら、患者安全活动を
Takahiro Matsumoto
?
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
Yasuyuki Okumura
?
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
トキシコロジーからナノ规制ガバナンスへの提言―予防原则の最适化
Masakazu Umezawa
?

操作変数法の书き方冲田渊贵大

  • 2. まずはじめに ? 操作変数法は、統計学に疎い私にとっ ては非常に難解でした。 ? 私はこれまで操作変数法を使ったこと がありません。 ? 本発表の内容は文献からの引用がほと んどですが、私の理解が間違っている かもしれません。 ? 本発表に関する利益相反はありません。
  • 3. 本日の内容(40min) (1) なぜ操作変数法なのか? (5min) (2)操作変数法(IV)に関して報告するべきこと(25min) IV Reporting Checklistと事例 IV reporting flowchartと推定効果の範囲 (3) IV の候補とバイアスへのケア(10min) IVの候補 IV を脅かす交絡要因(IV-結果変数交絡要因)
  • 4. なぜ操作変数法? 操作変数法 ■英語表記 instrumental variable (IV) method ? 測定できていない交絡要因(Unmeasured confounders)があっても、因果効果(causal effects)を推定できる=疫学者の夢? Hernan MA, Robins JM. Instruments for causal inference: an epidemiologist's dream? Epidemiology. 2006;17(4):360-72.
  • 5. A?Yを分析したい Brookhart, M. A., et al.(2010). Confounding control in healthcare database research: challenges and potential approaches. Med Care, 48(6 Suppl), S114-120.
  • 6. 重要なunobserved covariate(変数u)がモデル に含められない時にどうするか? 1) 無視する?biased result 2) 変数uのproxy-variableを含める 3) 操作変数法(IV)を使う(Aと相関し、uおよびerrorと相 関しない、と論理的に説明できる変数z[IV]が必 要!) 4) 調査をやり直す(無理な分析をしない) A?Yを分析したい Y=β0+β1A+β2u+error
  • 7. IVが必要ない場合 ? errorにunobserved covariatesすべてが含まれる。 ? 説明変数が外生性(exogenous)であれば、IVは必要 ない。 ? 説明変数が内生性(endogenous)であってもerrorと相 関していないなら、IVは必要ない。 ? IVがerrorと相関しないかどうか熟慮を要する。 Wooldridge 2013, p.534
  • 9. 本日の内容(40min) (1) なぜ操作変数法なのか? (5min) (2)操作変数法(IV)に関して報告するべきこと(25min) IV Reporting Checklistと事例 IV reporting flowchartと推定効果の範囲 (3) IV の候補とバイアスへのケア(10min) IVの候補 IV を脅かす交絡要因(IV-結果変数交絡要因)
  • 10. IV Reporting Checklist Davies NM, et al. Epidemiology 2013; 24(3): 363-9. 操作変数法を使用した研究のシステマティックレビューによって 報告すべき内容を確認
  • 11. IV Reporting Checklist 1. 推定した結果の対象者は誰か、関連する仮定とともに記述 する。 2. partial F-statisticにて操作変数と説明変数の関連を記述する。 3. 操作変数と説明変数それぞれについて測定された交絡要因 との関連を報告もしくはテストする。 4. 複数の操作変数を使用する場合、過剰識別制約についてテ ストする。 5. 2値の結果変数、説明変数、操作変数の場合、それぞれの頻 度についてクロスした集計表を呈示する。 6. 2値の結果変数について線形モデルを使用する場合、 sandwich estimatorsもしくはbootstrapによるstandard errors を使用し、必要に応じて研究対象者のクラスターを考慮に入 れた分析を行う。 Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
  • 12. 事例 Davies NM, et al. Epidemiology 2013; 24(3): 352-62. 事例は、医師の過去の処方をIVとしてCOX2阻害剤とNSAIDの比較に おける胃腸障害および心筋梗塞の発症の差をみた研究
  • 13. IV Reporting Checklist 2. partial F-statisticにて操作変数と説明変数の関連 を記述する。 28% の論文でF-statisticsもしくはpartial r2が報告されていた。 ■事例 ●方法の節(partial F-statistic) ? We estimated the association of previous prescriptions with actual prescriptions using linear regressions of exposures on previous prescriptions and report the partial r2 and partial F tests. Larger partial F statistics imply stronger associations of previous prescriptions and exposure.[46] ■事例 ●結果の節 ? previous prescription was strongly associated with actual prescription 事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62. Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
  • 14. IV Reporting Checklist 3. 操作変数と説明変数それぞれについて測定さ れた交絡要因との関連を報告もしくはテストす る。 Risk differences were estimated using ordinary least squares regression of confounder on exposure or instrument (COX-2s vs. nonselective NSAIDs). 事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62. Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. ■事例 ●結果(Table)
  • 15. IV Reporting Checklist 4. 複数の操作変数を使用する場合、過剰識別制 約(over identification)についてテストする。 i.e., Sargan test or Hansen test[116,117] 事例:Palmer TM, et al. Stat Methods Med Res 2012; 21(3): 223-42. Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. ■事例 ●方法の節(Sargan test) ? In models including multiple instruments the Sargan test of over-identification, available in the ivreg2 command, was used to test the joint validity of the instruments.[39] ●結果の節(Sargan test+Table) ? For each multiple instrument model, the Sargan over-identification test provides little evidence against the joint validity of the instruments. (抜粋) 事例は、遺伝子をIVとした研究
  • 16. IV Reporting Checklist 5. 2値の結果変数、説明変数、操作変数の場合、 それぞれの頻度についてクロスした集計表を 呈示する。 事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62. Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. ■事例 ●結果の節 ? All combinations of surrogate instruments, prescriptions, and outcomes had one or more events (Table 2)
  • 17. IV Reporting Checklist 6. 2値の結果変数について線形モデルを使用する 場合、robust (sandwich estimators)もしくは bootstrapによるstandard errorsを使用し、必要 に応じて研究対象者のクラスターを考慮に入れ た分析を行う。 Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9.
  • 18. IV Reporting Checklist 6. 2値の結果変数について線形モデルを使用する 場合、robust (sandwich estimators)もしくは bootstrapによるstandard errorsを使用し、必要 に応じて研究対象者のクラスターを考慮に入れ た分析を行う。 Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. ■事例 ●方法の節(robust standard errors/clustering) ? We calculated robust standard errors accounting for clustering of patients by physician and the binary (heteroskedastic) outcome[36] 事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
  • 19. IV Reporting Checklist 1. 推定した結果の対象者は誰か、関連する仮定 とともに記述する。 61%のStudyで明記されていた。 (Swanson 2013) Swanson SA, et al.: Epidemiology, 24: 370-4, 2013 Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. 例えば、 monotonicityの仮定のもとのlocal average treatment effect(LATE)= complierにおける効果 no effect modificationの仮定のもとのaverage treatment effect(ATE)=対象者全体における効果
  • 20. 本日の内容(40min) (1) なぜ操作変数法なのか? (5min) (2)操作変数法(IV)に関して報告するべきこと(25min) IV Reporting Checklistと事例 IV reporting flowchartと推定効果の範囲 (3) IV の候補とバイアスへのケア(10min) IVの候補 IV を脅かす交絡要因(IV-結果変数交絡要因)
  • 21. IV reporting flowchart Swanson SA, et al.: Epidemiology, 24: 370-4, 2013 操作変数法で報告すべき内容をフローチャート形式で呈示
  • 22. IV reporting flowchart Swanson SA, et al.: Epidemiology, 24: 370-4, 2013
  • 23. IV reporting flowchart 前半 Swanson SA, et al.: Epidemiology, 24: 370-4, 2013 仮定 (1) 操作変数が説明変数と関連している こと (2) 操作変数は説明変数を介してのみ結 果変数に影響を与えていること (exclusion restriction) (3) 操作変数から結果変数への別の ルートがないこと 検証可能 検証不可能
  • 24. IV reporting flowchart 後半 Swanson SA, et al.: Epidemiology, 24: 370-4, 2013 仮定 (4h) for ATE 効果が均一である (4m) for LATE 単調性(monotonicity) No “defiers” 交互作用がないと仮定
  • 25. 4つの集団(angrist, imbens, & rubin, 1996) ■Compliers:いつも従順な人 ■non-compliers:従順とはいえない人 ?always-takers:いつも治療を受けることを選択する人 ?never-takers:いつも治療を受けないことを選択する人 ?Defiers:いつも反対を選ぶ人=“あまのじゃく”
  • 26. 4つの集団の例 ? N=100, 50%でIV=1、全員がComplierではない Complierは何%? 治療[T] IV[Z] No[0]Yes[1] % 0 45 5 .10 1 15 35 .70 合計 60 40 .40 Compliers or never-takers Defiers or never-takers Defiers or always-takers Compliers or always-takers
  • 27. Complierの割合を計算 ? Defierがいないと仮定 ? すると、Z=1, T=0は全員never-taker (50人のうち の15人 [30%]) ? Z=0の集団でも30%がnever-takerとみなす ? 同様にして、10%がalways-taker ? 総合して、60% (100% - 30% - 10%)がcomplier
  • 28. IV Estimators ? LATE; local average treatment effect (complierに おける平均因果効果):母集団の構成員のうち complier(暴露群と非暴露群)における結果変数 の期待値の差 ? ATE; average treatment effect (平均因果効果):母 集団の構成員すべてが非暴露群から暴露群に 変化したときの,結果変数の期待値の差 ? TET; treatment effect among the treated (暴露群 の平均因果効果) ? TEU; treatment effect among the untreated (非暴 露群の平均因果効果)
  • 29. IV Reporting Checklist 1. 推定した結果の対象者は誰か、関連する仮定 とともに記述する。 ■事例 ●方法の節(local average treatment effect) ? This is the local average causal effect for patients who would be prescribed COX-2s by physicians with prescribing preference u*, but not by physicians with a lower preference v. The specific group of patients for whom this parameter applies is unknown.[45] Checklist: Davies NM, et al. Epidemiology 2013; 24(3): 363-9. 事例: Davies NM, et al. Epidemiology 2013; 24(3): 352-62.
  • 30. 本日の内容(40min) (1) なぜ操作変数法なのか? (5min) (2)操作変数法(IV)に関して報告するべきこと(25min) IV Reporting Checklistと事例 IV reporting flowchartと推定効果の範囲 (3) IV の分類とバイアスへのケア(10min) IVの分類 IV を脅かす交絡要因(IV-結果変数交絡要因)
  • 31. IVの分類とバイアスへのケア Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8. systematic review in PubMed, EconLit, PsycINFO, Social Services Abstracts, Social Sciences Citation Index, and Web of Science to identify instrumental variable comparative effectiveness research (CER) studies that were published in an English- language, peer-reviewed journal through 31 December 2011 and conducted in the United States and other industrialized countries. 187 IV studies in CER これまで操作変数として使用された変数を分類し、それぞれで考慮すべき 交絡要因について説明 (ただし、GeneticsはIVの分類から除外)
  • 32. IVの分類 in Davies 2013 Davies NM, et al. Epidemiology 2013; 24(3): 363-9. 地域の特徴 病院や医師の治療パターン その他 日付?時間 合併症 など
  • 33. IVの分類 4 Most Commonly Used Instrument Categories in Comparative Effectiveness Research ? Distance to facility: 患者住居から病院までの距離 ? Regional variation:地域における治療パターン ? Facility variation:病院における治療パターン ? Physician variation:医師における治療パターン Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
  • 34. 分類に応じた操作変数(IV)の例 4 Most Commonly Used Instrument Categories in Comparative Effectiveness Research Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
  • 35. 操作変数法における仮定とその違反 IV assumption and the violation Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8. IV-結果変数間交絡要因 この交絡要因は操作変数法における仮定の(2)「操作変数は説明変数を介してのみ 結果変数に影響を与えていること (exclusion restriction)」に違反している!
  • 36. IV-結果変数間交絡要因の分類 for the Most Commonly Used Instruments and a Mortality Outcome Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8. For all type of instrument 1. Geographic location 都市/田舎 2. Patient characteristics 人種、学歴、所得、年齢、医療保 険、健康状態?合併症、健康行動 3. Treatment characteristics その他の治療を受けたかどう か、治療までの時間 4. Facility characteristics 手術件数、診療科、教育施設かど うか、公的機関かどうか For Regional variation 1. Provider supply 病床数、介護施設数 2. Technology adoption and utilization 高度医療提供、 処方傾向
  • 37. IV-結果変数間交絡要因の調整 for the Most Commonly Used Instruments and a Mortality Outcome Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
  • 38. さいごに ? 操作変数法(IV)を使用した多く の研究 (48 of 65 [74%])で、IV以 外の解析手法が併用されていた。 ? どの解析にも前提とする仮定や 限界があり、十分に理解した上で 比較検討することが必要 Garabedian LF, et al. Ann Intern Med. 2014;161(2):131-8.
  • 39. 参考書籍 Wooldridge, Introductory Econometrics 5e, 2013 Joshua D. Angrist , Jorn-Steffen Pischke, Mostly Harmless Econometrics: An Empiricist's Companion, 2009

Editor's Notes

  • #3: Stata ivreg2
  • #6: Directed acyclic graph (DAG)
  • #7: 重要だと考えられる変数をモデルに含めることができれば、その変数に由来するerror成分との相関については考慮しなくともよくなる。 よって、操作変数法の適用は、重要なuが複数ある場合はより困難であると分かる。困難=調査設計がまずい! xとzの相関が弱いとStandard errorが大きくなってしまう。 Zとuの相関はわずかでもあれば、IVに大きな問題となる。(p521. Wooldridge2013 & Turkington) 多くの場合、xとzの相関係数は0.2未満であるが、zとuの相関係数が大きければ、IVよりもOLSの方がバイアスが少ないかもしれない。
  • #8: Exogenous=errorと相関しない :これは検証できない。 IV=endogenousな説明変数と相関する
  • #12: Davies 2013, p366 Table 5. A minority (n = 25, 28%) reported partial F-statistics or partial r2 of the association of the instruments with the exposures. Under monotonicity, studies identify a weighted average of local average treatment effects. This causal parameter is the effect of treatment on those persons whose treatment decision was affected by the instrumental variable. The assumption of no effect modification by the instrument among the treated identifies the average effect of treatment on the treated subpopulation. (Davies 2013 p365) intention-to-treatの結果とは違う。(Davies 2013 p365) Standard output from techniques such as two-stage least squares report standard errors that are valid under conditional homoscedasticity. If the variance of the error terms is heteroskedastic (eg, if the outcome is binary in a linear effects model), then the estimates of the confidence intervals may be biased. Therefore, studies should use heteroscedasticity robust standard errors (sandwich estimators). (Davies 2013 p365)
  • #13: 今回主に使用した事例は、医师の过去の処方を滨痴として颁翱齿2阻害剤と狈厂础滨顿の比较における胃肠障害および心筋梗塞の発症の差をみた研究。
  • #14: It is generally accepted that F-test values <10 indicate weak instruments.[10] 10. Staiger D, Stock JH. Instrumental variables regression with weak instruments. Econometrica 1997; 65:557–586. From the supplementary data of Mojtabai R, Crum RM. Cigarette smoking and onset of mood and anxiety disorders. Am J Public Health 2013; 103(9): 1656-65. 基準は、 Staiger and Stock (1997) が、一段回目の推定で操作変数の係数がゼロという帰無仮説を検定した時に、F-statisticsが10以下であれば経験的にweakだと書き、それをstock and yogo (2005)が補足したものがベースになっている Checklist: Davies 2013, p366 A minority (n = 25, 28%) reported partial F-statistics or partial r2 of the association of the instruments with the exposures. 事例: Davies 2013, p360 The F-statistic indicated that the instrumental variable results did not suffer from weak instruments.[46] Test of weak identification Kleibergen-Paap Wald statistic, robust to heteroskedasticity.
  • #15: The observed baseline covariables were strongly associated with prescriptions (Table 1).(事例 Davies 2013 p356)
  • #16: Palmer p231 There are two commonly used tests of over-identification; the Hansen test and the Sargan test.[39,48]Rejection of an over-identification test is taken to indicate that at least one of the instruments is not valid (i.e., it does not give the same estimate as the other instruments).[49] p235 The Hausman tests suggest that the IV estimates using multiple instruments differ from the OLS estimate. 竹林先生の2つ目の事例 116. Hansen LP. Large sample properties of generalized method of moments estimators. Econometrica. 1982;50:1029–1054. 117. Sargan J. The estimation of economic relationships using instrumental variables. Econometrica. 1958;26:393–415. It should be recalled that it is still necessary to assume that at least one instrument is exogenous. This means that if none of the instruments is exogenous, the Sargan, Hansen and Basmann statistics will be biased and inconsistent and can erroneously fail to reject the null hypothesis (Murray, 2006a).
  • #17: All combinations of surrogate instruments, prescriptions, and outcomes had one or more events (Table 2)(事例 Davies 2013 p357)
  • #18: Standard output from techniques such as two-stage least squares report standard errors that are valid under conditional homoscedasticity. If the variance of the error terms is heteroskedastic (eg, if the outcome is binary in a linear effects model), then the estimates of the confidence intervals may be biased. Therefore, studies should use heteroscedasticity robust standard errors (sandwich estimators). (Davies 2013 p365)
  • #19: Davies 2013, p366 A minority (n = 25, 28%) reported partial F-statistics or partial r2 of the association of the instruments with the exposures. Under monotonicity, studies identify a weighted average of local average treatment effects. This causal parameter is the effect of treatment on those persons whose treatment decision was affected by the instrumental variable. The assumption of no effect modification by the instrument among the treated identifies the average effect of treatment on the treated subpopulation. (Davies 2013 p365) intention-to-treatの結果とは違う。(Davies 2013 p365) Standard output from techniques such as two-stage least squares report standard errors that are valid under conditional homoscedasticity. If the variance of the error terms is heteroskedastic (eg, if the outcome is binary in a linear effects model), then the estimates of the confidence intervals may be biased. Therefore, studies should use heteroscedasticity robust standard errors (sandwich estimators). (Davies 2013 p365)
  • #20: intention-to-treatの結果とは違う。(Davies 2013 p365) Two options are the average treatment effect in the population and the local average treatment effect (LATE ) in the subpopulation of “compliers.” For nondichotomous instruments, LATE -like effects are weighted averages of the effect in multiple subgroups. Because “compliers” cannot be identified, the LATE is a causal effect in an unknown subset of the population, for example, if one found a beneficial effect of treatment, it is unclear who the “compliers” would be who would have this benefit. Because the average treatment effect and the LATE will generally differ, investigators should be explicit about their reasons for choosing one over the other; only 61% of studies in our review were explicit.(Swanson 2013 p372)
  • #22: 滨痴に関する仮定のおさらい、そして滨痴で推定した効果の范囲について
  • #23: Monotonicity is generally implausible for the commonly proposed preference-based instruments. (Swanson 2013, p373.)
  • #24: Monotonicity is generally implausible for the commonly proposed preference-based instruments. (Swanson 2013, p373.)
  • #25: Monotonicity is generally implausible for the commonly proposed preference-based instruments. (Swanson 2013, p373.) Whether estimating bounds or effects (see below), one needs to decide the causal effect of interest. Two options are the average treatment effect in the population and the local average treatment effect (LATE) in the subpopulation of “compliers.” For Davies et al, “compliers” are patients who would be prescribed a selective NSAID had they seen a physician who preferred selective NSAIDs, but would be prescribed a nonselective NSAID had they seen a physician who preferred nonselective NSAIDs. For nondichotomous instruments, LATE -like effects are weighted averages of the effect in multiple subgroups. Because “compliers” cannot be identified, the LATE is a causal effect in an unknown subset of the population, for example, if one found a beneficial effect of treatment, it is unclear who the “compliers” would be who would have this benefit. Because the average treatment effect and the LATE will generally differ, investigators should be explicit about their reasons for choosing one over the other; only 61% of studies in our review were explicit.(Swanson 2013, p372.) Homogeneity If interest is in the average treatment effect, the untestable fourth condition for point estimation may be either condition (4c) of identical (ie, constant) treatment effect for all individuals in the population—generally impossible for dichotomous outcomes and highly unlikely for others—or the weaker homogeneity condition (4h) of no additive effect modification across levels of the instrument within the treated and the untreated (no effect modification only in the treated would allow valid estimation of the effect in the treated). The next step in the flowchart is to assess this homogeneity condition (4h) using subject-matter knowledge. 事例: Davies p361 Limitations of instrumental variable analysis are its imprecision and the large sample sizes required, as well as the unverifiable assumptions required for point identification.
  • #30: intention-to-treatの結果とは違う。(Davies 2013 p365) Two options are the average treatment effect in the population and the local average treatment effect (LATE ) in the subpopulation of “compliers.” For nondichotomous instruments, LATE -like effects are weighted averages of the effect in multiple subgroups. Because “compliers” cannot be identified, the LATE is a causal effect in an unknown subset of the population, for example, if one found a beneficial effect of treatment, it is unclear who the “compliers” would be who would have this benefit. Because the average treatment effect and the LATE will generally differ, investigators should be explicit about their reasons for choosing one over the other; only 61% of studies in our review were explicit.(Swanson 2013 p372) ■事例  ●方法の節(no effect modification) ? Under the no-effect-modification assumption, ψ0 is equal to the average effect of prescription on those prescribed, E[Y(1) ? Y(0)|X = 1]. If no-effect-modification assumption also holds for the untreated, then the average causal effect is identified. However, as the prescriptions are binary, it is impossible for no-effect-modification assumption to hold simultaneously for those prescribed and not prescribed.[33] Assuming no effect modification, we further specified multiple previous prescriptions as instruments and used the generalized method of moments estimator to estimate weighted averages of the effect of prescription on those prescribed.[38,44] The size of bias is a decreasing function of the strength of association of Z and X, and the proportion of the patients with Z = 0 who were not prescribed COX-2s.
  • #35: *Studies that used instruments from multiple categories were counted more than once. Percentages are based on 187 total instrumental variable comparative effectiveness research studies. ? “Treatment” refers to instrument assignment to treatment group rather than actual receipt of treatment.
  • #38: 65 instrumental variable CER studies that used 1 of the 4 most common instruments and a mortality outcome to determine whether the authors discussed or controlled for the potential instrument–outcome confounders. None of the studies in our review controlled for all potential instrument–outcome confounders we identified in the literature. Most (39 of 65 [60%]) used data from only administrative databases, such as electronic medical records and insurer claims. * Analysis was limited to studies that used 1 of the 4 most commonly used instruments and a mortality outcome (see Supplement 3). Studies that used 1 of the 4 instruments appear in multiple columns. ? Studies that used procedure or facility volume as an instrument or independent variable were removed from the denominator.
  • #39: 65 instrumental variable CER studies that used 1 of the 4 most common instruments and a mortality outcome to determine whether the authors discussed or controlled for the potential instrument–outcome confounders.