論文の概要: Scalable Counterfactual Risk Estimation for Rare Events in Longitudinal Data
- arxiv url: http://arxiv.org/abs/2606.01539v1
- Date: Mon, 01 Jun 2026 01:41:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.778065
- Title: Scalable Counterfactual Risk Estimation for Rare Events in Longitudinal Data
- Title(参考訳): 時系列データにおける希少事象のスケーラブルな対実リスク推定
- Authors: Xiaohui Yin, Avijit Mitra, Ying Zhou, Kun Chen, Hong Yu,
- Abstract要約: 本稿では,既存の因果効果推定装置に適用可能な長手生存データに対する,原則的サブサンプリングと再重み付け戦略を提案する。
提案手法は, 整合性を保ちながら計算負荷を大幅に低減し, 希少な出力設定における推定安定性を向上する。
- 参考スコア(独自算出の注目度): 20.985792090921755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Estimating the causal effect of time-varying treatments on survival outcomes in large observational studies is computationally demanding, particularly when outcomes are rare. While g-formula-based methods such as the iterative conditional expectation (ICE) estimator provide a principled framework for longitudinal causal inference, they become computationally expensive, especially when bootstrap-based variance estimation is required. In addition, outcome rarity at each time point induces severe class imbalance, leading to instability and convergence issues in logistic regression and related models. To address these challenges, we propose a principled subsampling and reweighting strategy for longitudinal survival data that can be applied to a range of existing causal effect estimators in this setting, including the ICE estimator. The proposed method substantially reduces computational burden while preserving consistency and improving estimation stability in rare-outcome settings. We evaluate the method through simulations and validate it using a large-scale EHR cohort study on social and behavioral determinants of health (SBDH) and suicide risk, demonstrating its effectiveness for modeling rare outcomes in longitudinal data.
- Abstract(参考訳): 大規模な観察研究における生存結果に対する時間変化治療の因果効果の推定は、特に結果が稀な場合、計算的に要求される。
反復条件予測(ICE)推定法のようなg-formula-based methodは、経時的因果推論の原則的枠組みを提供するが、特にブートストラップに基づく分散推定が必要な場合、計算コストがかかる。
さらに、各時点における結果の希少性は、厳密なクラス不均衡を誘発し、ロジスティック回帰と関連するモデルにおける不安定性と収束の問題を引き起こす。
これらの課題に対処するために、ICE推定器を含む既存の因果効果推定器に適用可能な、長手生存データに対する原則的サブサンプリングと再重み付け戦略を提案する。
提案手法は, 整合性を保ちながら計算負荷を大幅に低減し, 希少な出力設定における推定安定性を向上する。
SBDH(Social and Behavioral Determinants of Health, SBDH)と自殺リスクに関する大規模EHRコホート研究を用いてシミュレーションによる評価を行い, 縦断データによる稀な結果のモデル化の有効性を実証した。
関連論文リスト
- Learning Survival Models with Right-Censored Reporting Delays [10.312968200748118]
生存分析(英: Survival analysis)とは、事象が起こるまでの時間を推定する統計手法である。
実務上の制約の下での報告遅延の調整は 保険業界にとって 重大な課題です。
本研究は,事象発生時のパラメトリックハザード関数と報告タイミングを共同でモデル化することによって,この問題に対処する。
論文 参考訳(メタデータ) (2025-10-06T01:16:57Z) - Penalized Empirical Likelihood for Doubly Robust Causal Inference under Contamination in High Dimensions [0.720409153108429]
低サンプルサイズ方程式における平均処理効果を2倍頑健に推定する手法を提案する。
提案した信頼区間は, 競合する推定値と比較して効率がよいことを示す。
論文 参考訳(メタデータ) (2025-07-23T11:58:54Z) - A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.53426007439564]
観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文 参考訳(メタデータ) (2025-05-16T17:00:52Z) - Self-Consistent Equation-guided Neural Networks for Censored Time-to-Event Data [11.550402345767141]
本稿では,自己整合方程式を利用した生成逆数ネットワークを用いた条件付き生存関数の非パラメトリック推定手法を提案する。
提案手法はモデルフリーであり,条件付き生存関数の構造に関するパラメトリックな仮定は不要である。
論文 参考訳(メタデータ) (2025-03-12T06:24:35Z) - Evidential time-to-event prediction with calibrated uncertainty quantification [12.446406577462069]
Time-to-event分析は、臨床予後と治療勧告に関する洞察を提供する。
本稿では,時間とイベントの予測に特化して設計された明らかな回帰モデルを提案する。
我々のモデルは正確かつ信頼性の高い性能を提供し、最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-11-12T15:06:04Z) - Risk and cross validation in ridge regression with correlated samples [72.59731158970894]
我々は,データポイントが任意の相関関係を持つ場合,リッジ回帰のイン・オブ・サンプルリスクのトレーニング例を提供する。
この設定では、一般化されたクロスバリデーション推定器(GCV)がサンプル外リスクを正確に予測できないことを示す。
さらに、テストポイントがトレーニングセットと非自明な相関を持つ場合、時系列予測でしばしば発生する設定にまで分析を拡張します。
論文 参考訳(メタデータ) (2024-08-08T17:27:29Z) - Enabling Counterfactual Survival Analysis with Balanced Representations [64.17342727357618]
生存データは様々な医学的応用、すなわち薬物開発、リスクプロファイリング、臨床試験で頻繁に見られる。
本稿では,生存結果に適用可能な対実的推論のための理論的基盤を持つ統一的枠組みを提案する。
論文 参考訳(メタデータ) (2020-06-14T01:15:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。