論文の概要: Overcoming Selection Bias in Statistical Studies With Amortized Bayesian Inference
- arxiv url: http://arxiv.org/abs/2604.18319v1
- Date: Mon, 20 Apr 2026 14:20:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.932044
- Title: Overcoming Selection Bias in Statistical Studies With Amortized Bayesian Inference
- Title(参考訳): Amortized Bayesian Inferenceによる統計的研究における選択バイアスの克服
- Authors: Jonas Arruda, Sophie Chervet, Paula Staudt, Andreas Wieser, Michael Hoelscher, Isabelle Sermet-Gaudelus, Nadine Binder, Lulla Opatowski, Jan Hasenauer,
- Abstract要約: 選択バイアスは、観測がデータセットに入る確率が興味の量に関連する変数に依存するときに生じる。
我々は、選択を神経後部推定に明示的に組み込むバイアス対応シミュレーションベースの推論フレームワークを開発した。
- 参考スコア(独自算出の注目度): 1.9709458230153813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selection bias arises when the probability that an observation enters a dataset depends on variables related to the quantities of interest, leading to systematic distortions in estimation and uncertainty quantification. For example, in epidemiological or survey settings, individuals with certain outcomes may be more likely to be included, resulting in biased prevalence estimates with potentially substantial downstream impact. Classical corrections, such as inverse-probability weighting or explicit likelihood-based models of the selection process, rely on tractable likelihoods, which limits their applicability in complex stochastic models with latent dynamics or high-dimensional structure. Simulation-based inference enables Bayesian analysis without tractable likelihoods but typically assumes missingness at random and thus fails when selection depends on unobserved outcomes or covariates. Here, we develop a bias-aware simulation-based inference framework that explicitly incorporates selection into neural posterior estimation. By embedding the selection mechanism directly into the generative simulator, the approach enables amortized Bayesian inference without requiring tractable likelihoods. This recasting of selection bias as part of the simulation process allows us to both obtain debiased estimates and explicitly test for the presence of bias. The framework integrates diagnostics to detect discrepancies between simulated and observed data and to assess posterior calibration. The method recovers well-calibrated posterior distributions across three statistical applications with diverse selection mechanisms, including settings in which likelihood-based approaches yield biased estimates. These results recast the correction of selection bias as a simulation problem and establish simulation-based inference as a practical and testable strategy for parameter estimation under selection bias.
- Abstract(参考訳): 選択バイアスは、観測がデータセットに入る確率が興味の量に関連する変数に依存し、推定と不確実性定量化の体系的な歪みを引き起こすときに生じる。
例えば、疫学や調査の設定では、特定の結果を持つ個体は、より多く含まれる可能性があり、結果として、潜在的に下流に重大な影響を及ぼす可能性のある偏見のある有病率推定が生じる。
逆確率重み付け (inverse-probability weighting) や、選択過程の明示的可能性に基づくモデルのような古典的な補正は、潜在力学や高次元構造を持つ複素確率モデルにおけるそれらの適用性を制限したトラクタブルな可能性に依存する。
シミュレーションに基づく推論により、ベイズ解析は難解な確率を伴わないが、通常ランダムに欠落を仮定し、選択が観測されない結果や共変量に依存すると失敗する。
そこで我々は,選択を神経後部推定に明示的に組み込むバイアス対応シミュレーションベース推論フレームワークを開発した。
選択機構を直接生成シミュレータに埋め込むことで、抽出可能な確率を必要とせずに、ベイズ推論を償却することができる。
シミュレーションプロセスの一部として選択バイアスを再キャストすることにより、偏りのある推定値を取得し、偏りの有無を明示的にテストできる。
このフレームワークは診断を統合し、シミュレーションされたデータと観測されたデータの相違を検知し、後部校正を評価する。
この手法は,確率に基づくアプローチが偏りのある推定値を生成する設定を含む,多種多様な選択機構を持つ3つの統計応用にわたるよく校正された後部分布を復元する。
これらの結果は、選択バイアスの補正をシミュレーション問題として再放送し、シミュレーションに基づく推論を、選択バイアスの下でパラメータ推定を行うための実用的で検証可能な戦略として確立する。
関連論文リスト
- Statistical inference after variable selection in Cox models: A simulation study [0.0]
本稿では、ラッソ係数とその拡張であるアダプティブ・ラッソに対する変数選択後に適用されるいくつかの推論手順について検討する。
検討された手法には、サンプル分割、正確な選択後の推測、偏りのあるラッソが含まれる。
論文 参考訳(メタデータ) (2026-02-07T10:14:21Z) - Recover Experimental Data with Selection Bias using Counterfactual Logic [12.014061086940817]
我々は、観測界における選択機構が反現実領域にどのように伝播するかを分析する。
偏りのない観測データを利用して、偏りのある実験データセットから$P(Y*_x*)$を回収する原理的手法を提案する。
論文 参考訳(メタデータ) (2025-05-31T01:23:39Z) - Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Calibrating Neural Simulation-Based Inference with Differentiable
Coverage Probability [50.44439018155837]
ニューラルモデルのトレーニング目的に直接キャリブレーション項を含めることを提案する。
古典的なキャリブレーション誤差の定式化を緩和することにより、エンドツーエンドのバックプロパゲーションを可能にする。
既存の計算パイプラインに直接適用でき、信頼性の高いブラックボックス後部推論が可能である。
論文 参考訳(メタデータ) (2023-10-20T10:20:45Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Invariant Probabilistic Prediction [45.90606906307022]
任意の分布シフトは、一般に不変かつ頑健な確率的予測を認めないことを示す。
Invariant probabilistic predictions called IPP, and study the consistency of the underlying parameters。
論文 参考訳(メタデータ) (2023-09-18T18:50:24Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Double machine learning for sample selection models [0.12891210250935145]
本稿では,サンプル選択や帰属によるサブポピュレーションに対してのみ結果が観察される場合の個別分散処理の評価について考察する。
a)Neyman-orthogonal, Duubly robust, and efficient score function, which suggests the robustness of treatment effect Estimation to moderate regularization biases in the machine learning based Estimation of the outcome, treatment, or sample selection model and (b) sample splitting ( or cross-fitting) to prevent overfitting bias。
論文 参考訳(メタデータ) (2020-11-30T19:40:21Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。