論文の概要: Deep Optimal Individualized Treatment Rules for Bivariate Survival Outcomes via Adaptive Prediction-Powered Learning
- arxiv url: http://arxiv.org/abs/2605.29464v1
- Date: Thu, 28 May 2026 06:56:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.875355
- Title: Deep Optimal Individualized Treatment Rules for Bivariate Survival Outcomes via Adaptive Prediction-Powered Learning
- Title(参考訳): 適応予測型学習による二変量生存結果の深い個別化処理規則
- Authors: Kun Ren, Yifan Cui, Wen Su,
- Abstract要約: 本稿では,固定時間点を超える共同生存確率を最大化するために最適な個別化処理規則を導出する問題に対処する。
本稿では,ポリシーを経由した処理ルールのモデル化,リンク関数を介するフェール・アクセラレーション・アセスメント・タイム・モデルの提案を行う。
意思決定の堅牢性と有効性を高めるため,機械学習モデルからの補助的予測を活用する適応予測を用いた手法を提案する。
- 参考スコア(独自算出の注目度): 3.890091933986142
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In randomized trials involving multiple treatments, bivariate survival outcomes present significant analytical challenges for making decisions. This paper addresses the problem of deriving optimal individualized treatment rules to maximize the joint survival probability beyond fixed time points $(t_1, t_2)$ through deep neural networks, while accounting for right censoring. We propose a novel approach that models treatment rules via stochastic policies, coupling marginal accelerated failure time models via link function to capture bivariate dependence. To enhance robustness and effectiveness of decision making, we introduce an adaptive prediction-powered method that leverages auxiliary predictions from machine learning models.
- Abstract(参考訳): 複数の治療を含むランダム化試験では、二変量生存の結果は決定を下す上で重要な分析上の課題を示す。
本稿では, 適切な個別化処理規則を導出し, 固定時間点$(t_1, t_2)$を超えるジョイントサバイバル確率を, 右検閲を考慮したディープニューラルネットワークにより最大化する問題に対処する。
本稿では,二変量依存を捉えるために,確率的ポリシによる処理規則のモデル化,リンク関数による限界加速故障時間モデルの結合を提案する。
意思決定の堅牢性と有効性を高めるため,機械学習モデルからの補助的予測を活用する適応予測を用いた手法を提案する。
関連論文リスト
- Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning [0.3437656066916039]
本稿では,個別化されたno-show予測と強化学習を統合した適応型外来二重予約フレームワークを提案する。
提案するフレームワークは、単一書籍、ダブルブック、あるいは予約要求の拒否をいつ行うかを決定する。
論文 参考訳(メタデータ) (2026-03-07T15:58:38Z) - On the Optimality of Tracking Fisher Information in Adaptive Testing with Stochastic Binary Responses [3.491999371287298]
逐次二進応答から連続能力パラメータを推定する問題について検討する。
本稿では,フィッシャー情報を最大化するための質問を適応的に選択する簡単なアルゴリズムを提案する。
我々は,このフィッシャー追跡戦略が,固定信頼と固定予算の双方において最適な性能を達成することを証明した。
論文 参考訳(メタデータ) (2025-10-09T07:10:00Z) - An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.93922317950527]
DRQ-learnerと呼ばれる新しいメタラーナーを開発した。
DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文 参考訳(メタデータ) (2025-09-30T15:49:29Z) - LAPO: Internalizing Reasoning Efficiency via Length-Adaptive Policy Optimization [48.91511514636768]
長長適応ポリシー最適化は、理論的長さ制御を外部制約から本質的なモデル能力に変換する。
LAPOは、2段階の強化学習プロセスを通じて適切な推論深度を理解することができる。
数学的推論ベンチマークの実験では、LAPOはトークンの使用量を最大40.9%削減し、精度は2.3%向上した。
論文 参考訳(メタデータ) (2025-07-21T16:14:41Z) - Robust Spatiotemporal Epidemic Modeling with Integrated Adaptive Outlier Detection [7.5504472850103435]
疫病モデルでは、アウトレーヤはパラメータ推定を歪め、公衆衛生上の判断を誤ったものにすることができる。
本稿では、この歪みを軽減するために、ロバストな一般化加法モデル(RST-GAM)を導入する。
アメリカ合衆国における郡レベルのCOVID-19感染データを解析し,RTT-GAMの実用性を実証した。
論文 参考訳(メタデータ) (2025-07-12T19:23:25Z) - Likelihood Ratio Confidence Sets for Sequential Decision Making [51.66638486226482]
確率に基づく推論の原理を再検討し、確率比を用いて妥当な信頼シーケンスを構築することを提案する。
本手法は, 精度の高い問題に特に適している。
提案手法は,オンライン凸最適化への接続に光を当てることにより,推定器の最適シーケンスを確実に選択する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T00:10:21Z) - Uncertainty Informed Optimal Resource Allocation with Gaussian Process
based Bayesian Inference [4.7464518249313805]
本稿では,パラメータの不確かさを高精度かつ正確に表現するためのデータ駆動型手法を,新しい最適化問題定式化において開発する。
本実験は,重要な疫学的パラメータの不確実性を考慮することにより,時間クリティカルなアロケーション決定の有効性を4~8%向上させることを示唆している。
論文 参考訳(メタデータ) (2023-06-30T03:49:52Z) - TCFimt: Temporal Counterfactual Forecasting from Individual Multiple
Treatment Perspective [50.675845725806724]
個別多面的治療の観点からの時間的対実予測の包括的枠組み(TCFimt)を提案する。
TCFimtは、選択と時間変化バイアスを軽減するためにSeq2seqフレームワークの逆タスクを構築し、比較学習ベースのブロックを設計し、混合処理効果を分離した主治療効果と因果相互作用に分解する。
提案手法は, 特定の治療法による今後の結果予測と, 最先端手法よりも最適な治療タイプとタイミングを選択する上で, 良好な性能を示す。
論文 参考訳(メタデータ) (2022-12-17T15:01:05Z) - Post-hoc loss-calibration for Bayesian neural networks [25.05373000435213]
本研究では, 近似的後続予測分布の補正手法を開発し, 高ユーティリティな意思決定を推奨する。
従来の研究とは対照的に、我々のアプローチは近似推論アルゴリズムの選択に非依存である。
論文 参考訳(メタデータ) (2021-06-13T13:53:27Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。