論文の概要: Recover Experimental Data with Selection Bias using Counterfactual Logic
- arxiv url: http://arxiv.org/abs/2506.00335v2
- Date: Wed, 04 Jun 2025 17:00:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 13:54:39.502399
- Title: Recover Experimental Data with Selection Bias using Counterfactual Logic
- Title(参考訳): 対実論理を用いた選択バイアスを用いた実験データの復元
- Authors: Jingyang He, Shuai Wang, Ang Li,
- Abstract要約: 我々は、観測界における選択機構が反現実領域にどのように伝播するかを分析する。
偏りのない観測データを利用して、偏りのある実験データセットから$P(Y*_x*)$を回収する原理的手法を提案する。
- 参考スコア(独自算出の注目度): 12.014061086940817
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selection bias, arising from the systematic inclusion or exclusion of certain samples, poses a significant challenge to the validity of causal inference. While Bareinboim et al. introduced methods for recovering unbiased observational and interventional distributions from biased data using partial external information, the complexity of the backdoor adjustment and the method's strong reliance on observational data limit its applicability in many practical settings. In this paper, we formally discover the recoverability of $P(Y^*_{x^*})$ under selection bias with experimental data. By explicitly constructing counterfactual worlds via Structural Causal Models (SCMs), we analyze how selection mechanisms in the observational world propagate to the counterfactual domain. We derive a complete set of graphical and theoretical criteria to determine that the experimental distribution remain unaffected by selection bias. Furthermore, we propose principled methods for leveraging partially unbiased observational data to recover $P(Y^*_{x^*})$ from biased experimental datasets. Simulation studies replicating realistic research scenarios demonstrate the practical utility of our approach, offering concrete guidance for mitigating selection bias in applied causal inference.
- Abstract(参考訳): 選択バイアスは、特定のサンプルの体系的な包含や排除から生じるものであり、因果推論の妥当性に重大な課題をもたらす。
Bareinboimらは部分的な外部情報を用いてバイアスのない観測と介入の分布を復元する手法を導入したが、バックドア調整の複雑さと観測データへの強い依存は、多くの実践的な状況においてその適用性を制限した。
本稿では,実験データによる選択バイアス下での$P(Y^*_{x^*})$の回復可能性について正式に発見する。
構造因果モデル (Structure Causal Models, SCM) を用いて, 対物界を明示的に構築することにより, 観測界における選択機構が対物領域にどのように伝播するかを解析する。
我々は、実験的な分布が選択バイアスの影響を受けていないことを判断するために、グラフィカルおよび理論的基準の完全なセットを導出する。
さらに、偏りのない観測データを利用して、偏りのある実験データセットから$P(Y^*_{x^*})$を回収する原理的手法を提案する。
現実的な研究シナリオを再現するシミュレーション研究は、我々のアプローチの実用性を実証し、応用因果推論における選択バイアスを軽減するための具体的なガイダンスを提供する。
関連論文リスト
- The Hardness of Validating Observational Studies with Experimental Data [2.9593087583214173]
実験データを用いて,観測データから因果効果を推定する手法を提案する。
この定理は, 観測実験において, 補正関数の滑らかさを仮定することなく, 偏差を検出する実験データを用いることができるが, 除去には使用できないことを証明している。
論文 参考訳(メタデータ) (2025-03-19T00:06:23Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Causal Lifting of Neural Representations: Zero-Shot Generalization for Causal Inferences [56.23412698865433]
予測型因果推論(PPCI)に焦点をあてる
PPCIは、未ラベルの事実結果を用いた対象実験における治療効果を推定し、事前訓練されたモデルからゼロショットを取得する。
バニラ実験的リスク最小化によって解決不可能なインスタンスに対するソリューションを提供するため,本手法を合成および実世界の科学的データに対して検証する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Feature-Level Debiased Natural Language Understanding [86.8751772146264]
既存の自然言語理解(NLU)モデルは、特定のデータセットで高いパフォーマンスを達成するために、データセットバイアスに依存することが多い。
本稿では, バイアスの潜在特性を緩和し, バイアスの動的性質を無視するために, DCT(Debiasing contrastive learning)を提案する。
DCTは、ディストリビューション内のパフォーマンスを維持しながら、アウトオブディストリビューションデータセットの最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2022-12-11T06:16:14Z) - Detecting hidden confounding in observational data using multiple
environments [0.81585306387285]
本論では, 隠れた接尾辞が存在する場合にのみ欠落する, 検証可能な条件不一致の理論について述べる。
ほとんどの場合、提案手法は隠れた共起の存在を正確に予測する。
論文 参考訳(メタデータ) (2022-05-27T12:20:09Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。