論文の概要: Counterfactual Survival Q Learning for Longitudinal Randomized Trials via Buckley James Boosting
- arxiv url: http://arxiv.org/abs/2508.11060v1
- Date: Thu, 14 Aug 2025 20:43:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.666046
- Title: Counterfactual Survival Q Learning for Longitudinal Randomized Trials via Buckley James Boosting
- Title(参考訳): Buckley James Boosting を用いた縦ランダム化試行のための実時間Q学習
- Authors: Jeongjin Lee, Jong-Min Kim,
- Abstract要約: 最適な動的治療体制を推定するためのBuckley James (BJ) Boost Q 学習フレームワークを提案する。
この手法は、高速化された故障時間モデルと、最小二乗木や回帰木を含む反復的なブースティング技術を統合する。
条件付き生存時間を直接モデル化することにより、BJ Boost Q 学習は制限的な比例的ハザードの仮定を避けることができる。
- 参考スコア(独自算出の注目度): 2.3246627516636935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a Buckley James (BJ) Boost Q learning framework for estimating optimal dynamic treatment regimes under right censored survival data, tailored for longitudinal randomized clinical trial settings. The method integrates accelerated failure time models with iterative boosting techniques, including componentwise least squares and regression trees, within a counterfactual Q learning framework. By directly modeling conditional survival time, BJ Boost Q learning avoids the restrictive proportional hazards assumption and enables unbiased estimation of stage specific Q functions. Grounded in potential outcomes, this framework ensures identifiability of the optimal treatment regime under standard causal assumptions. Compared to Cox based Q learning, which relies on hazard modeling and may suffer from bias under misspecification, our approach provides robust and flexible estimation. Simulation studies and analysis of the ACTG175 HIV trial demonstrate that BJ Boost Q learning yields higher accuracy in treatment decision making, especially in multistage settings where bias can accumulate.
- Abstract(参考訳): 我々は, 長期的ランダム化臨床試験の設定に適した, 正規化生存データに基づく最適な動的治療体制を推定するためのBuckley James (BJ) Boost Q 学習フレームワークを提案する。
この手法は, 高速化された故障時間モデルと, 最小二乗木や回帰木などの反復的促進技術とを, 対実的Q学習フレームワークに統合する。
条件付き生存時間を直接モデル化することにより、BJ Boost Q 学習は制限的な比例的ハザード仮定を回避し、ステージ固有のQ 関数の偏りのない推定を可能にする。
この枠組みは潜在的な結果に基づいており、標準的な因果仮定の下での最適な治療体制の識別可能性を保証する。
CoxをベースとしたQラーニングは、ハザードモデリングに依存し、不特定性の下で偏見に悩まされる可能性があるが、我々の手法は堅牢で柔軟な推定を提供する。
ACTG175HIV臨床試験のシミュレーション研究と解析により、BJ Boost Q学習は、特にバイアスが蓄積可能な多段階環境において、治療決定において高い精度が得られることが示された。
関連論文リスト
- Distribution-Free Uncertainty Quantification in Mechanical Ventilation Treatment: A Conformal Deep Q-Learning Framework [2.5070297884580874]
本研究では,集中治療室における機械的換気を最適化するための,分布自由な共形深度Q-ラーニング手法であるConformalDQNを紹介する。
我々はMIMIC-IVデータベースからICU患者記録を用いてモデルを訓練・評価した。
論文 参考訳(メタデータ) (2024-12-17T06:55:20Z) - FPBoost: Fully Parametric Gradient Boosting for Survival Analysis [4.09225917049674]
FPBoostは、完全にパラメトリックなハザード関数の重み付け和と勾配上昇を組み合わせたサバイバルモデルである。
FPBoostはいかにしてハザード関数の普遍的な近似器であり、完全なイベント時モデリングの柔軟性を提供するかを示す。
論文 参考訳(メタデータ) (2024-09-20T09:57:17Z) - Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.92633587914659]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。
トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文 参考訳(メタデータ) (2024-02-13T11:25:20Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Robust and Agnostic Learning of Conditional Distributional Treatment Effects [44.31792000298105]
問題クラスに対する条件付きDTE(Conditional DTE)を学習するための、新しい堅牢でモデルに依存しない方法論を提供する。
本手法は回帰モデルクラスにCDTEの最良のプロジェクションを提供することができるため,モデルに依存しない。
シミュレーションにおける提案手法の挙動と,富に対する401(k)の適格性の影響を事例として検討した。
論文 参考訳(メタデータ) (2022-05-23T17:40:31Z) - Cross Learning in Deep Q-Networks [82.20059754270302]
本稿では、値に基づく強化学習手法において、よく知られた過大評価問題を緩和することを目的とした、新しいクロスQ-ラーニングアルゴリズムを提案する。
本アルゴリズムは,並列モデルの集合を維持し,ランダムに選択されたネットワークに基づいてQ値を算出することによって,二重Q-ラーニングに基づいて構築する。
論文 参考訳(メタデータ) (2020-09-29T04:58:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。