Fugu-MT 論文翻訳(概要): Semi-Supervised Causal Inference: Generalizable and Double Robust Inference for Average Treatment Effects under Selection Bias with Decaying Overlap

論文の概要: Semi-Supervised Causal Inference: Generalizable and Double Robust Inference for Average Treatment Effects under Selection Bias with Decaying Overlap

arxiv url: http://arxiv.org/abs/2305.12789v1
Date: Mon, 22 May 2023 07:37:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-23 17:38:47.232319
Title: Semi-Supervised Causal Inference: Generalizable and Double Robust Inference for Average Treatment Effects under Selection Bias with Decaying Overlap
Title（参考訳）: 半監督型因果推論:選択バイアスによる平均治療効果の一般化と二重ロバスト推論
Authors: Yuqian Zhang, Abhishek Chakrabortty and Jelena Bradic
Abstract要約: 平均治療効果(ATE)推定は因果推論文学において重要な問題である。我々は、観測結果(またはラベル)自体が欠落している可能性がある場合、高次元でのATE推定問題を考察する。
参考スコア（独自算出の注目度）: 11.758346319792361
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Average treatment effect (ATE) estimation is an essential problem in the causal inference literature, which has received significant recent attention, especially with the presence of high-dimensional confounders. We consider the ATE estimation problem in high dimensions when the observed outcome (or label) itself is possibly missing. The labeling indicator's conditional propensity score is allowed to depend on the covariates, and also decay uniformly with sample size - thus allowing for the unlabeled data size to grow faster than the labeled data size. Such a setting fills in an important gap in both the semi-supervised (SS) and missing data literatures. We consider a missing at random (MAR) mechanism that allows selection bias - this is typically forbidden in the standard SS literature, and without a positivity condition - this is typically required in the missing data literature. We first propose a general doubly robust 'decaying' MAR (DR-DMAR) SS estimator for the ATE, which is constructed based on flexible (possibly non-parametric) nuisance estimators. The general DR-DMAR SS estimator is shown to be doubly robust, as well as asymptotically normal (and efficient) when all the nuisance models are correctly specified. Additionally, we propose a bias-reduced DR-DMAR SS estimator based on (parametric) targeted bias-reducing nuisance estimators along with a special asymmetric cross-fitting strategy. We demonstrate that the bias-reduced ATE estimator is asymptotically normal as long as either the outcome regression or the propensity score model is correctly specified. Moreover, the required sparsity conditions are weaker than all the existing doubly robust causal inference literature even under the regular supervised setting - this is a special degenerate case of our setting. Lastly, this work also contributes to the growing literature on generalizability in causal inference.
Abstract（参考訳）: 平均治療効果(ate)の推定は因果推論文献において重要な問題であり、特に高次元共同創設者の存在において近年注目されている。観測結果(ラベル)自体が欠落している可能性がある場合、高次元でのATE推定問題を考察する。ラベル付けインジケータの条件適合度スコアは、共変量に依存することができ、サンプルサイズと均一に崩壊する。このような設定は、半教師付き(SS)と欠落したデータ文学の両方において重要なギャップを埋める。我々は、選択バイアスを許容するランダム(MAR)メカニズムの欠如について検討する。これは標準SS文献では禁止され、実証条件がない場合が典型的には欠落データ文献では必須である。まず、フレキシブルな(おそらく非パラメトリックな)ニュアンス推定器に基づいて構築されたATEのための2倍頑健なMAR(DR-DMAR)SS推定器を提案する。一般のdr-dmar ss推定器は二重に頑健であり、全てのニュアサンスモデルが正しく指定されるとき漸近的に正常(かつ効率的)である。さらに,非対称クロスフィッティング戦略とともに,(パラメトリック)ターゲットのバイアス低減ニュアサンス推定器に基づくバイアス低減 dr-dmar ss 推定器を提案する。結果の回帰あるいは確率スコアモデルが正しく指定されている限り、バイアス低減ATE推定器は漸近的に正常であることを示す。さらに、必要空間条件は、通常の教師付き設定下であっても、既存の二重頑健な因果推論文献よりも弱く、これは我々の設定の特別な退化事例である。最後に、この研究は因果推論の一般化可能性に関する文学の発展にも寄与している。

関連論文リスト

Towards Anytime-Valid Statistical Watermarking [63.02116925616554]
我々は、任意の時間価推論で最適なサンプリングを統一する、最初のe-value-based watermarking frameworkであるAnchored E-Watermarkingを開発した。本フレームワークはサンプル効率を大幅に向上させ,最先端のベースラインに対して,検出に必要な平均トークン予算を13～15%削減する。
論文参考訳（メタデータ） (2026-02-19T18:32:26Z)
Causal Inference as Distribution Adaptation: Optimizing ATE Risk under Propensity Uncertainty [0.0]
我々は、分散シフトの下で、ATE推定をテキストドメイン適応問題として再フレーミングする。結果モデルの共同学習を行うためのtextbfJoint Robust Estimator (JRE) を提案する。
論文参考訳（メタデータ） (2025-12-19T21:40:46Z)
DistDF: Time-Series Forecasting Needs Joint-Distribution Wasserstein Alignment [92.70019102733453]
トレーニング時系列予測モデルは、モデル予測の条件分布とラベルシーケンスの条件分布の整合性を必要とする。本研究では,条件予測とラベル分布との差を最小限に抑えてアライメントを実現するDistDFを提案する。
論文参考訳（メタデータ） (2025-10-28T16:09:59Z)
Penalized Empirical Likelihood for Doubly Robust Causal Inference under Contamination in High Dimensions [0.720409153108429]
低サンプルサイズ方程式における平均処理効果を2倍頑健に推定する手法を提案する。提案した信頼区間は, 競合する推定値と比較して効率がよいことを示す。
論文参考訳（メタデータ） (2025-07-23T11:58:54Z)
Statistical Inference for Conditional Group Distributionally Robust Optimization with Cross-Entropy Loss [9.054486124506521]
本研究では,複数のソースドメインからラベル付きデータを抽出し,対象ドメインからラベル付きデータのみを抽出するマルチソース非教師付きドメイン適応について検討する。本稿では,条件条件分布の凸結合に対する最悪のクロスエントロピー損失を最小限に抑え,分類器を学習する新しい条件条件最適化(CG-DRO)フレームワークを提案する。理論的ブリッジとして機能する2つのサロゲート極小最適化問題を構築することにより、推定器の高速な統計的収束率を確立する。
論文参考訳（メタデータ） (2025-07-14T04:21:23Z)
A Distributionally-Robust Framework for Nuisance in Causal Effect Estimation [1.3053649021965603]
因果推論では、治療群と対照群の間のバランスの取れた分布のモデルを評価する必要がある。最も一般的な統計手法は、逆確率重み付け(IPW)によるこの分布シフトに対処するものである。誤差一般化を分解してこれらの問題 - 正当性あいまいさと統計的不安定さ - を分離し, 対向損失関数を通して対処する。
論文参考訳（メタデータ） (2025-05-23T10:34:28Z)
Graph-Based Prediction Models for Data Debiasing [6.221408085892461]
データ収集におけるバイアスは、低レポートと過剰レポートの両方から発生し、医療と公共の安全において重大な課題を提起する。グラフベースのOver- and Under-Reporting Debiasing (GROUD) は,真のインシデント数と関連するレポートバイアス確率を共同で推定することにより,レポートデータを排除する新しいグラフベースの最適化フレームワークである。 GROUDは、アトランタの緊急電話や新型コロナウイルスワクチンの有害事象報告を含む、挑戦的なシミュレーション実験と実世界のデータセットの両方で検証する。
論文参考訳（メタデータ） (2025-04-12T21:34:49Z)
Noise-Adaptive Conformal Classification with Marginal Coverage [53.74125453366155]
本稿では,ランダムラベルノイズによる交換性からの偏差を効率的に処理できる適応型共形推論手法を提案する。本手法は,合成および実データに対して,その有効性を示す広範囲な数値実験により検証する。
論文参考訳（メタデータ） (2025-01-29T23:55:23Z)
Learning from Noisy Labels via Conditional Distributionally Robust Optimization [5.85767711644773]
クラウドソーシングは、大規模なデータセットをラベル付けするための実用的なソリューションとして現れました。これは、様々なレベルの専門知識を持つアノテータからのノイズの多いラベルによって、正確なモデルを学習する上で大きな課題となる。
論文参考訳（メタデータ） (2024-11-26T05:03:26Z)
ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [1.194799054956877]
高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文参考訳（メタデータ） (2024-06-17T15:50:00Z)
DAGnosis: Localized Identification of Data Inconsistencies using Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文参考訳（メタデータ） (2024-02-26T11:29:16Z)
Learning with Complementary Labels Revisited: The Selected-Completely-at-Random Setting Is More Practical [66.57396042747706]
補完ラベル学習は、弱教師付き学習問題である。均一分布仮定に依存しない一貫したアプローチを提案する。相補的なラベル学習は、負のラベル付きバイナリ分類問題の集合として表現できる。
論文参考訳（メタデータ） (2023-11-27T02:59:17Z)
Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文参考訳（メタデータ） (2023-02-22T14:50:24Z)
Breaking the Spurious Causality of Conditional Generation via Fairness Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。この問題を緩和するための一般的な2段階戦略を提案する。
論文参考訳（メタデータ） (2022-12-05T08:09:33Z)
Rethinking Missing Data: Aleatoric Uncertainty-Aware Recommendation [59.500347564280204]
本稿では, Aleatoric Uncertainty-aware Recommendation (AUR) フレームワークを提案する。 AURは、新しい不確実性推定器と通常のレコメンデータモデルで構成されている。誤ラベルの可能性がペアの可能性を反映しているため、AURは不確実性に応じてレコメンデーションを行う。
論文参考訳（メタデータ） (2022-09-22T04:32:51Z)
Two-Stage Robust and Sparse Distributed Statistical Inference for Large-Scale Data [18.34490939288318]
本稿では,高次元データやオフレーヤによって汚染される可能性のある大規模データを含む設定において,統計的推論を行うという課題に対処する。空間性を促進することによって高次元モデルに対処する2段階の分散および頑健な統計的推論手法を提案する。
論文参考訳（メタデータ） (2022-08-17T11:17:47Z)
Holistic Robust Data-Driven Decisions [0.0]
実際にはオーバーフィッティングはひとつの原因ではなく、複数の要因を同時に引き起こすのが一般的である。ここでは, (i) 有限サンプルデータを用いた結果の統計的誤差, (ii) データポイントを有限精度で測定した場合に発生するデータノイズ, (iii) データのごく一部が完全に破損する可能性のあるデータ不特定性という3つの過度な結果について考察する。既存のデータ駆動型定式化は、これらの3つのソースのうちの1つに対して、独立して堅牢であるかもしれないが、すべてのオーバーフィットソースに対して、全体的な保護を提供していない、と我々は主張する。
論文参考訳（メタデータ） (2022-07-19T21:28:51Z)
Gray Learning from Non-IID Data with Out-of-distribution Samples [45.788789553551176]
専門家が注釈を付けたとしても、トレーニングデータの完全性は保証されていない。我々は,基本真実と相補的ラベルを両立させる新しいアプローチであるtextitGray Learningを導入する。統計学習理論における我々のアプローチを基礎として、一般化誤差の境界を導出し、GLが非IID設定でも厳密な制約を達成できることを実証する。
論文参考訳（メタデータ） (2022-06-19T10:46:38Z)
A General Framework for Treatment Effect Estimation in Semi-Supervised and High Dimensional Settings [0.0]
我々は, より堅牢で, (2) 教師付きよりも効率的であるSS推定器群を開発した。さらに、モデル内の正当性スコアが正しく指定されたときに、SS推定器のルート-n整合性と正規性を確立する。我々の推定器は、すべてのニュアンス関数が正しく指定されている限り、半パラメトリックに効率的であることが示される。
論文参考訳（メタデータ） (2022-01-03T04:12:44Z)
Double Robust Semi-Supervised Inference for the Mean: Selection Bias under MAR Labeling with Decaying Overlap [11.758346319792361]
近年,半教師付き推論 (SS) が注目されている。 SS文献の多くは、L と U が等しく分布していると暗黙的に仮定している。選択バイアスを許容するランダム(MAR)型ラベリングの欠落は、確率スコア(PS)の減衰特性によって必然的に悪化する。
論文参考訳（メタデータ） (2021-04-14T07:27:27Z)
Deconfounding Scores: Feature Representations for Causal Effect Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。特に,この手法が標準正規化の魅力的な代替となることを示す。
論文参考訳（メタデータ） (2021-04-12T18:50:11Z)
Scalable Marginal Likelihood Estimation for Model Selection in Deep Learning [78.83598532168256]
階層型モデル選択は、推定困難のため、ディープラーニングではほとんど使われない。本研究は,検証データが利用できない場合,限界的可能性によって一般化が向上し,有用であることを示す。
論文参考訳（メタデータ） (2021-04-11T09:50:24Z)
Unsupervised Robust Domain Adaptation without Source Data [75.85602424699447]
我々は、利用できないターゲットラベルとソースデータのコンテキストにおけるロバストなドメイン適応の問題について研究する。 4つのベンチマークデータセットでテストされたベースラインに対して10%以上の精度で一貫したパフォーマンス改善を示す。
論文参考訳（メタデータ） (2021-03-26T16:42:28Z)
Exploiting Sample Uncertainty for Domain Adaptive Person Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文参考訳（メタデータ） (2020-12-16T04:09:04Z)
Unlabelled Data Improves Bayesian Uncertainty Calibration under Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文参考訳（メタデータ） (2020-06-26T13:50:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。