論文の概要: A General Framework for Treatment Effect Estimation in Semi-Supervised
and High Dimensional Settings
- arxiv url: http://arxiv.org/abs/2201.00468v1
- Date: Mon, 3 Jan 2022 04:12:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 15:16:14.852094
- Title: A General Framework for Treatment Effect Estimation in Semi-Supervised
and High Dimensional Settings
- Title(参考訳): 半監督・高次元設定における処理効果推定のための一般的な枠組み
- Authors: Abhishek Chakrabortty, Guorong Dai and Eric Tchetgen Tchetgen
- Abstract要約: 我々は, より堅牢で, (2) 教師付きよりも効率的であるSS推定器群を開発した。
さらに、モデル内の正当性スコアが正しく指定されたときに、SS推定器のルート-n整合性と正規性を確立する。
我々の推定器は、すべてのニュアンス関数が正しく指定されている限り、半パラメトリックに効率的であることが示される。
- 参考スコア(独自算出の注目度): 0.1406313845556561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this article, we aim to provide a general and complete understanding of
semi-supervised (SS) causal inference for treatment effects. Specifically, we
consider two such estimands: (a) the average treatment effect and (b) the
quantile treatment effect, as prototype cases, in an SS setting, characterized
by two available data sets: (i) a labeled data set of size $n$, providing
observations for a response and a set of high dimensional covariates, as well
as a binary treatment indicator; and (ii) an unlabeled data set of size $N$,
much larger than $n$, but without the response observed. Using these two data
sets, we develop a family of SS estimators which are ensured to be: (1) more
robust and (2) more efficient than their supervised counterparts based on the
labeled data set only. Beyond the 'standard' double robustness results (in
terms of consistency) that can be achieved by supervised methods as well, we
further establish root-n consistency and asymptotic normality of our SS
estimators whenever the propensity score in the model is correctly specified,
without requiring specific forms of the nuisance functions involved. Such an
improvement of robustness arises from the use of the massive unlabeled data, so
it is generally not attainable in a purely supervised setting. In addition, our
estimators are shown to be semi-parametrically efficient as long as all the
nuisance functions are correctly specified. Moreover, as an illustration of the
nuisance estimators, we consider inverse-probability-weighting type kernel
smoothing estimators involving unknown covariate transformation mechanisms, and
establish in high dimensional scenarios novel results on their uniform
convergence rates, which should be of independent interest. Numerical results
on both simulated and real data validate the advantage of our methods over
their supervised counterparts with respect to both robustness and efficiency.
- Abstract(参考訳): 本稿では,治療効果に対する半教師付き(SS)因果推論の一般的かつ完全な理解を目指す。
具体的には2つの推定法を考える。
(a)平均的な治療効果及び
b) 2つの利用可能なデータセットを特徴とするss設定における,プロトタイプ事例としての質的処理効果
i) サイズ$n$のラベル付きデータセットであって、応答と高次元の共変量と二値処理指標のセットの観察を提供するもの
(ii) ラベルのないデータセットが$n$で、$n$よりはるかに大きいが、応答は観測されない。
これらの2つのデータセットを用いて, (1) ラベル付きデータセットのみに基づいて, 教師付きデータセットよりも頑健で (2) 効率的であることを保証する, ss 推定器群を開発した。
教師付き手法によっても達成できる「標準」二重ロバスト性結果(一貫性の観点から)の他に、モデルのプロペンサリティスコアが正しく指定されるたびに、関連するニュアサンス関数の特定の形式を必要とせずに、我々のss推定器のルートn一貫性と漸近正規性をさらに確立します。
このような堅牢性の改善は、大量のラベルのないデータを使用することから生じるため、一般には、純粋に教師なしの環境では達成できない。
さらに,すべてのニュアンス関数が正しく指定される限り,推定器は半パラメトリックに効率的であることが示されている。
さらに, ニュアサンス推定器の例示として, 未知共変量変換機構を含む逆確率重み付け型カーネル平滑化推定器について検討し, 高次元シナリオにおいて, 独立な関心を持つべき一様収束率に関する新たな結果を確立する。
シミュレーションデータと実データの両方の数値計算結果から,ロバスト性と効率性の両面から,本手法の利点を検証した。
関連論文リスト
- Efficient semi-supervised inference for logistic regression under
case-control studies [3.5485531932219243]
ラベル付きデータの結果がバイナリとなる半教師付き設定における推論問題を考える。
ケースコントロールサンプリングは、バイナリデータの不均衡構造を緩和するための効果的なサンプリング手法である。
ラベルのないデータが利用可能であれば、インターセプトパラメータを半教師付き学習設定で識別できることが分かる。
論文 参考訳(メタデータ) (2024-02-23T14:55:58Z) - Efficient adjustment for complex covariates: Gaining efficiency with
DOPE [56.537164957672715]
共変量によって表現される情報のサブセットを調整可能なフレームワークを提案する。
理論的な結果に基づいて,平均処理効果(ATE)の効率的な評価を目的とした,デバイアスドアウトカム適応確率推定器(DOPE)を提案する。
その結果,DOPE は様々な観測環境において ATE 推定のための効率的かつ堅牢な手法を提供することがわかった。
論文 参考訳(メタデータ) (2024-02-20T13:02:51Z) - The Decaying Missing-at-Random Framework: Doubly Robust Causal Inference
with Partially Labeled Data [10.021381302215062]
現実のシナリオでは、データ収集の制限によって部分的にラベル付けされたデータセットが生成されることが多く、信頼性の高い因果推論の描画が困難になる。
半パラメトリック(SS)や欠落したデータ文学における従来のアプローチは、これらの複雑さを適切に扱えないため、偏りのある見積もりにつながる可能性がある。
このフレームワークは、高次元設定における欠落した結果に対処し、選択バイアスを考慮に入れます。
論文 参考訳(メタデータ) (2023-05-22T07:37:12Z) - Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium
Learning from Offline Datasets [101.5329678997916]
両プレイヤーゼロサムマルコフゲーム(MG)をオフライン環境で研究する。
目標は、事前収集されたデータセットに基づいて、近似的なナッシュ均衡(NE)ポリシーペアを見つけることである。
論文 参考訳(メタデータ) (2022-02-15T15:39:30Z) - Semi-Supervised Quantile Estimation: Robust and Efficient Inference in High Dimensional Settings [0.5735035463793009]
2つの利用可能なデータセットを特徴とする半教師付き環境での量子推定を考察する。
本稿では,2つのデータセットに基づいて,応答量子化(s)に対する半教師付き推定器群を提案する。
論文 参考訳(メタデータ) (2022-01-25T10:02:23Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Doubly Robust Semiparametric Difference-in-Differences Estimators with
High-Dimensional Data [15.27393561231633]
不均一な治療効果を推定するための2段半パラメトリック差分差分推定器を提案する。
第1段階では、確率スコアを推定するために、一般的な機械学習手法が使用できる。
第2段階ではパラメトリックパラメータと未知関数の両方の収束率を導出する。
論文 参考訳(メタデータ) (2020-09-07T15:14:29Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。