論文の概要: Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies
- arxiv url: http://arxiv.org/abs/2511.12075v1
- Date: Sat, 15 Nov 2025 07:37:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.589232
- Title: Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies
- Title(参考訳): 適応的治療戦略におけるオフライン強化学習の促進を目的としたシュレーディンガー橋による治療ストレッチング
- Authors: Dong-Hee Shin, Deok-Joong Lee, Young-Han Son, Tae-Eui Kam,
- Abstract要約: 臨床的に有効な治療トラジェクトリを生成する新しいデータ拡張フレームワークであるMessage Stitchingを提案する。
TreatStitchは、異なる軌跡にまたがる類似の患者状態を特定し、それぞれのセグメントを縫合する。
これらの合成軌道を元のデータセットに拡張することで、オフラインRLはより多様なデータセットから学習することができる。
- 参考スコア(独自算出の注目度): 16.34689464480395
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adaptive treatment strategies (ATS) are sequential decision-making processes that enable personalized care by dynamically adjusting treatment decisions in response to evolving patient symptoms. While reinforcement learning (RL) offers a promising approach for optimizing ATS, its conventional online trial-and-error learning mechanism is not permissible in clinical settings due to risks of harm to patients. Offline RL tackles this limitation by learning policies exclusively from historical treatment data, but its performance is often constrained by data scarcity-a pervasive challenge in clinical domains. To overcome this, we propose Treatment Stitching (TreatStitch), a novel data augmentation framework that generates clinically valid treatment trajectories by intelligently stitching segments from existing treatment data. Specifically, TreatStitch identifies similar intermediate patient states across different trajectories and stitches their respective segments. Even when intermediate states are too dissimilar to stitch directly, TreatStitch leverages the Schrödinger bridge method to generate smooth and energy-efficient bridging trajectories that connect dissimilar states. By augmenting these synthetic trajectories into the original dataset, offline RL can learn from a more diverse dataset, thereby improving its ability to optimize ATS. Extensive experiments across multiple treatment datasets demonstrate the effectiveness of TreatStitch in enhancing offline RL performance. Furthermore, we provide a theoretical justification showing that TreatStitch maintains clinical validity by avoiding out-of-distribution transitions.
- Abstract(参考訳): 適応的治療戦略(Adaptive treatment Strategy,ATS)は、患者症状の進行に応じて治療決定を動的に調整し、パーソナライズされたケアを可能にするシーケンシャルな意思決定プロセスである。
強化学習(RL)は、ATSを最適化するための有望なアプローチを提供するが、従来のオンライン試行錯誤学習メカニズムは、患者に害を与えるリスクがあるため、臨床環境では許容されない。
オフラインRLは、歴史的治療データからのみ学習ポリシーを学習することで、この制限に対処するが、そのパフォーマンスは、臨床領域におけるデータ不足によって制約されることが多い。
これを解決するために,既存の治療データからセグメントをインテリジェントに縫合することで,臨床的に有効な治療軌跡を生成する新しいデータ拡張フレームワークであるTreatStitchを提案する。
具体的には、TreatStitchは、異なる軌跡にまたがる類似の患者状態を特定し、それぞれのセグメントを縫合する。
中間状態が直接縫合するには相似すぎるとしても、TreatStitchはシュレーディンガー橋法を利用して、異種状態と接続する滑らかでエネルギー効率の良い架橋軌道を生成する。
これらの合成軌道を元のデータセットに拡張することで、オフラインRLはより多様なデータセットから学習し、ATSを最適化する能力を向上させることができる。
複数の処理データセットにわたる大規模な実験は、オフラインRLパフォーマンスの強化におけるTreatStitchの有効性を示している。
さらに,TreatStitchはアウト・オブ・ディストリビューション・トランジションを回避し,臨床的有効性を維持していることを示す理論的正当性を示す。
関連論文リスト
- Doubly Robust Fusion of Many Treatments for Policy Learning [7.943530359935207]
治療群間での共変量を安定的にバランスするキャリブレーション重み付き処理融合法を提案する。
我々は、一貫性、治療融合のオラクル特性、後悔境界を含む理論的保証を確立する。
本手法の実用性について,全国の電子健康記録由来の非識別データベースを用いて概説する。
論文 参考訳(メタデータ) (2025-05-12T21:55:57Z) - Enhancing Treatment Effect Estimation via Active Learning: A Counterfactual Covering Perspective [61.284843894545475]
治療効果推定のための複雑なアルゴリズムは、不十分なラベル付きトレーニングセットを扱う際には効果がない。
我々は,最適化目標をtextitFactual と textitCounterfactual Coverage Maximization に変換して,データ取得時の有効半径削減を実現するFCCMを提案する。
FCCMを他のベースラインに対してベンチマークすることは、完全に合成されたデータセットと半合成されたデータセットの両方にその優位性を示す。
論文 参考訳(メタデータ) (2025-05-08T13:42:00Z) - Censoring-Aware Tree-Based Reinforcement Learning for Estimating Dynamic Treatment Regimes with Censored Outcomes [4.877686100899469]
Censoring-Aware Tree-Based Reinforcement Learning (CA-TRL)は、検閲データに関連する複雑さに対処する新しいフレームワークである。
本稿では,SANADエピレプシー・データセットを用いた広範囲なシミュレーションと実世界の応用を通して,その効果を実証する。
論文 参考訳(メタデータ) (2025-03-09T16:53:09Z) - Training and Validating a Treatment Recommender with Partial Verification Evidence [1.0693162404690828]
現在の臨床意思決定支援システム(DSS)は,対象クリニックの観察データに基づいて訓練され,検証されている。
ランダム化臨床試験(RCT)で検証されるが、どの診療所にも導入されていない。
主な課題は、治療の割り当てに対する根拠の欠如(割り当てはランダムである)、証拠の欠如である。
論文 参考訳(メタデータ) (2024-06-10T09:23:00Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Deep Offline Reinforcement Learning for Real-world Treatment
Optimization Applications [3.770564448216192]
オフラインRLトレーニングにおける動作不均衡に対処するための,実践的かつ理論的に基礎的な遷移サンプリング手法を提案する。
糖尿病と敗血症治療最適化のための2つの現実的課題について広範な実験を行った。
本提案手法は, 様々な原則および臨床関連指標を用いて, 期待される健康影響を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2023-02-15T09:30:57Z) - Federated Offline Reinforcement Learning [55.326673977320574]
マルチサイトマルコフ決定プロセスモデルを提案する。
我々は,オフラインRLを対象とした最初のフェデレーション最適化アルゴリズムを設計する。
提案アルゴリズムでは,学習ポリシーの準最適性は,データが分散していないような速度に匹敵する,理論的保証を与える。
論文 参考訳(メタデータ) (2022-06-11T18:03:26Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。