論文の概要: Censoring-Aware Tree-Based Reinforcement Learning for Estimating Dynamic Treatment Regimes with Censored Outcomes
- arxiv url: http://arxiv.org/abs/2503.06690v1
- Date: Sun, 09 Mar 2025 16:53:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:50:30.798333
- Title: Censoring-Aware Tree-Based Reinforcement Learning for Estimating Dynamic Treatment Regimes with Censored Outcomes
- Title(参考訳): 木をベースとした木質強化学習による動的処理レジームの推定
- Authors: Animesh Kumar Paul, Russell Greiner,
- Abstract要約: Censoring-Aware Tree-Based Reinforcement Learning (CA-TRL)は、検閲データに関連する複雑さに対処する新しいフレームワークである。
本稿では,SANADエピレプシー・データセットを用いた広範囲なシミュレーションと実世界の応用を通して,その効果を実証する。
- 参考スコア(独自算出の注目度): 4.877686100899469
- License:
- Abstract: Dynamic Treatment Regimes (DTRs) provide a systematic approach for making sequential treatment decisions that adapt to individual patient characteristics, particularly in clinical contexts where survival outcomes are of interest. Censoring-Aware Tree-Based Reinforcement Learning (CA-TRL) is a novel framework to address the complexities associated with censored data when estimating optimal DTRs. We explore ways to learn effective DTRs, from observational data. By enhancing traditional tree-based reinforcement learning methods with augmented inverse probability weighting (AIPW) and censoring-aware modifications, CA-TRL delivers robust and interpretable treatment strategies. We demonstrate its effectiveness through extensive simulations and real-world applications using the SANAD epilepsy dataset, where it outperformed the recently proposed ASCL method in key metrics such as restricted mean survival time (RMST) and decision-making accuracy. This work represents a step forward in advancing personalized and data-driven treatment strategies across diverse healthcare settings.
- Abstract(参考訳): 動的治療規則 (Dynamic Treatment Regimes, DTRs) は、患者の個々の特徴、特に生存結果が関心のある臨床状況に適応するシーケンシャルな治療決定を行うための体系的なアプローチを提供する。
Censoring-Aware Tree-Based Reinforcement Learning (CA-TRL)は、最適なDTRを推定する際の検閲データに関連する複雑さに対処する新しいフレームワークである。
我々は観測データから効果的なDTRを学習する方法を探究する。
改良された逆確率重み付け(AIPW)と検閲対応の修正により、従来の木に基づく強化学習手法を強化することにより、CA-TRLは堅牢で解釈可能な治療戦略を提供する。
我々は,SANADエピレプシー・データセットを用いた広範囲なシミュレーションと実世界の応用により,その効果を実証し,最近提案されたASCL法を,制限平均生存時間(RMST)や意思決定精度などの重要な指標で上回った。
この取り組みは、さまざまな医療分野におけるパーソナライズされたデータ駆動型治療戦略の前進を示すものだ。
関連論文リスト
- DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime [18.443316087890324]
強化学習(Reinforcement Learning, RL)は、個人化医療における動的治療体制(DTR)を最適化する可能性の認知度を高めている。
多様な医療シナリオをシミュレートするベンチマークプラットフォームであるtextitDTR-Benchを紹介した。
我々はこれらの設定の様々な最先端のRLアルゴリズムを評価し、特に実世界の課題の中でその性能を強調した。
論文 参考訳(メタデータ) (2024-05-28T21:40:00Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Kernel-Based Distributed Q-Learning: A Scalable Reinforcement Learning Approach for Dynamic Treatment Regimes [20.62850899223748]
動的処理規則(DTR)を生成するためのスケーラブルなカーネルベースの分散Q-ラーニングアルゴリズムを提案する。
その結果,本アルゴリズムは,最先端の深層強化学習手法に関連する計算複雑性を著しく低減することを示した。
論文 参考訳(メタデータ) (2023-02-21T04:15:34Z) - Meta-analysis of individualized treatment rules via sign-coherency [3.432284729311483]
我々は、サイト固有のITRを共同で学習するITRの個別レベルのメタ分析法を開発した。
また、ITR学習問題に適した情報基準を用いて、モデルチューニングのための適応的な手順を開発する。
論文 参考訳(メタデータ) (2022-11-28T15:55:55Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Learning Optimal Dynamic Treatment Regimes Using Causal Tree Methods in
Medicine [20.401805132360654]
最適動的治療体制(DTR)を学習するための2つの新しい方法を開発した。
本手法は,原因木法を用いて不均一な処理効果をデータ駆動で推定する手法である。
提案手法を合成データを用いて評価し,それらを集中治療室からの実世界データに適用する。
論文 参考訳(メタデータ) (2022-04-14T17:27:08Z) - Ambiguous Dynamic Treatment Regimes: A Reinforcement Learning Approach [0.0]
動的処理レジーム(DTR)は、このプロセスの形式化のために広く研究されている。
最適な治療体制を効率的に学習するための強化学習法を開発した。
論文 参考訳(メタデータ) (2021-12-08T20:22:04Z) - Real-time landmark detection for precise endoscopic submucosal
dissection via shape-aware relation network [51.44506007844284]
内視鏡下粘膜下郭清術における高精度かつリアルタイムなランドマーク検出のための形状認識型関係ネットワークを提案する。
まず,ランドマーク間の空間的関係に関する先行知識を直感的に表現する関係キーポイント・ヒートマップを自動生成するアルゴリズムを考案する。
次に、事前知識を学習プロセスに段階的に組み込むために、2つの補完的な正規化手法を開発する。
論文 参考訳(メタデータ) (2021-11-08T07:57:30Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。