論文の概要: ALPACA: A Reinforcement Learning Environment for Medication Repurposing and Treatment Optimization in Alzheimer's Disease
- arxiv url: http://arxiv.org/abs/2602.19298v1
- Date: Sun, 22 Feb 2026 18:22:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.573782
- Title: ALPACA: A Reinforcement Learning Environment for Medication Repurposing and Treatment Optimization in Alzheimer's Disease
- Title(参考訳): アルツハイマー病リハビリテーションと治療最適化のための強化学習環境「ALPACA」
- Authors: Nolan Brady, Tom Yeh,
- Abstract要約: 本稿では、パーソナライズされた治療戦略を検討するために、アルツハイマー学習プラットフォーム(Alzheimer's Learning Platform for Adaptive Care Agents, ALPACA)を紹介する。
ALPACAは、アルツハイマー病神経画像イニシアチブ(ADNI)の経時的軌跡に基づいて訓練された連続行動条件状態遷移(CAST)モデルによって駆動される
以上の結果から, ALPACA で訓練された RL は, 記憶関連疾患に対する非治療的および行動閉鎖的クリニックベースラインを上回り, 自己回帰的にリアルな薬物調和トラジェクトリーを生成できることが示唆された。
- 参考スコア(独自算出の注目度): 2.0411082897313984
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating personalized, sequential treatment strategies for Alzheimer's disease (AD) using clinical trials is often impractical due to long disease horizons and substantial inter-patient heterogeneity. To address these constraints, we present the Alzheimer's Learning Platform for Adaptive Care Agents (ALPACA), an open-source, Gym-compatible reinforcement learning (RL) environment for systematically exploring personalized treatment strategies using existing therapies. ALPACA is powered by the Continuous Action-conditioned State Transitions (CAST) model trained on longitudinal trajectories from the Alzheimer's Disease Neuroimaging Initiative (ADNI), enabling medication-conditioned simulation of disease progression under alternative treatment decisions. We show that CAST autoregressively generates realistic medication-conditioned trajectories and that RL policies trained in ALPACA outperform no-treatment and behavior-cloned clinician baselines on memory-related outcomes. Interpretability analyses further indicated that the learned policies relied on clinically meaningful patient features when selecting actions. Overall, ALPACA provides a reusable in silico testbed for studying individualized sequential treatment decision-making for AD.
- Abstract(参考訳): 臨床治験によるアルツハイマー病(AD)のパーソナライズ・シーケンシャルな治療戦略の評価は、長い疾患の地平線と患者間不均一性により、しばしば不可能である。
これらの制約に対処するため、我々は、既存の治療法を用いてパーソナライズされた治療戦略を体系的に探索するオープンソースのGym互換強化学習(RL)環境であるAlzheimer's Learning Platform for Adaptive Care Agents (ALPACA)を提示する。
ALPACAは、アルツハイマー病神経画像イニシアチブ (ADNI) の経時的軌跡に基づいて訓練された連続行動条件状態遷移 (Continuous Action- Conditioned State Transitions, CAST) モデルを用いており、代替治療決定の下で疾患の進行を薬物条件でシミュレーションすることができる。
以上の結果から, ALPACA で訓練された RL は, 記憶関連疾患に対する非治療的および行動閉鎖的クリニックベースラインを上回り, 自己回帰的にリアルな薬物調和トラジェクトリーを生成できることが示唆された。
解釈可能性分析の結果, 臨床に有意な患者の特徴に依存していることが明らかとなった。
全体として、ALPACAはADの個別化シーケンシャルな治療決定を研究するための再利用可能なシリコテストベッドを提供する。
関連論文リスト
- Treatment Stitching with Schrödinger Bridge for Enhancing Offline Reinforcement Learning in Adaptive Treatment Strategies [16.34689464480395]
臨床的に有効な治療トラジェクトリを生成する新しいデータ拡張フレームワークであるMessage Stitchingを提案する。
TreatStitchは、異なる軌跡にまたがる類似の患者状態を特定し、それぞれのセグメントを縫合する。
これらの合成軌道を元のデータセットに拡張することで、オフラインRLはより多様なデータセットから学習することができる。
論文 参考訳(メタデータ) (2025-11-15T07:37:49Z) - Learning Patient-Specific Spatial Biomarker Dynamics via Operator Learning for Alzheimer's Disease Progression [9.499341016835121]
アルツハイマー病(英語: Alzheimers disease、AD)は、複雑で多因子性神経変性疾患である。
近年の治療法の進歩にもかかわらず、個別の疾患軌跡を正確に予測できる予測モデルはまだ限られている。
本稿では、AD進行のパーソナライズされたモデリングのための機械学習に基づく演算子学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-22T01:52:28Z) - OMG-RL:Offline Model-based Guided Reward Learning for Heparin Treatment [0.4998632546280975]
オフライン逆RL(IRL)を実行するオフラインモデルに基づくガイド・リワード学習(OMG-RL)を導入する。
我々は,OMG-RLポリシーが学習報酬ネットワークだけでなく,活性化部分トロンボプラスチン時間(aPTT)においても肯定的に強化されていることを示した。
このアプローチはヘパリン服用問題だけでなく、一般のRLベースの薬物服用タスクにも広く利用することができる。
論文 参考訳(メタデータ) (2024-09-20T07:51:37Z) - Safe and Interpretable Estimation of Optimal Treatment Regimes [54.257304443780434]
我々は、最適な治療体制を特定するための安全かつ解釈可能な枠組みを運用する。
本研究は患者の医療歴と薬理学的特徴に基づくパーソナライズされた治療戦略を支援する。
論文 参考訳(メタデータ) (2023-10-23T19:59:10Z) - Pruning the Way to Reliable Policies: A Multi-Objective Deep Q-Learning Approach to Critical Care [46.2482873419289]
我々は、より信頼性の高いクリティカルケアポリシーを得るための深いQ-ラーニングアプローチを導入する。
本手法を,集中治療室のシミュレーション環境と実際の健康記録を用いて,オフライン・オフ・セッティングで評価した。
論文 参考訳(メタデータ) (2023-06-13T18:02:57Z) - Automated Fidelity Assessment for Strategy Training in Inpatient
Rehabilitation using Natural Language Processing [53.096237570992294]
戦略トレーニング (Strategy Training) とは、脳卒中後の認知障害患者に障害を減らすためのスキルを教える、リハビリテーションのアプローチである。
標準化された忠実度評価は治療原則の遵守度を測定するために用いられる。
本研究では,ルールベースNLPアルゴリズム,長短項メモリ(LSTM)モデル,および変換器(BERT)モデルからの双方向エンコーダ表現を開発した。
論文 参考訳(メタデータ) (2022-09-14T15:33:30Z) - Learning Optimal Treatment Strategies for Sepsis Using Offline
Reinforcement Learning in Continuous Space [4.031538204818658]
本稿では,臨床医がリアルタイム治療に最適な基準選択を推奨するのに役立つ,歴史的データに基づく新しい医療決定モデルを提案する。
本モデルでは, オフライン強化学習と深層強化学習を組み合わせることで, 医療における従来の強化学習が環境と相互作用できない問題に対処する。
論文 参考訳(メタデータ) (2022-06-22T16:17:21Z) - Optimal discharge of patients from intensive care via a data-driven
policy learning framework [58.720142291102135]
退院課題は、退院期間の短縮と退院決定後の退院や死亡のリスクとの不確実なトレードオフに対処することが重要である。
本研究は、このトレードオフを捉えるためのエンドツーエンドの汎用フレームワークを導入し、最適放電タイミング決定を推奨する。
データ駆動型アプローチは、患者の生理的状態を捉えた同種で離散的な状態空間表現を導出するために用いられる。
論文 参考訳(メタデータ) (2021-12-17T04:39:33Z) - Optimizing Medical Treatment for Sepsis in Intensive Care: from
Reinforcement Learning to Pre-Trial Evaluation [2.908482270923597]
本研究の目的は, 介入を最適化する強化学習(RL)が, 学習方針の治験に対する規制に適合する経路を遡及的に得る枠組みを確立することである。
我々は,死の主な原因の一つであり,複雑で不透明な患者動態のため治療が困難である集中治療室の感染症に焦点を当てた。
論文 参考訳(メタデータ) (2020-03-13T20:31:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。