論文の概要: Patient-Specific Deep Reinforcement Learning for Automatic Replanning in Head-and-Neck Cancer Proton Therapy
- arxiv url: http://arxiv.org/abs/2506.10073v1
- Date: Wed, 11 Jun 2025 18:00:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.37108
- Title: Patient-Specific Deep Reinforcement Learning for Automatic Replanning in Head-and-Neck Cancer Proton Therapy
- Title(参考訳): 頭頸部癌陽子治療における患者特異的深部強化学習
- Authors: Malvern Madondo, Yuan Shao, Yingzi Liu, Jun Zhou, Xiaofeng Yang, Zhen Tian,
- Abstract要約: プロトン療法中の解剖学的変化は、ブラッグのピークをシフトさせ、腫瘍のアンダードシングやオーガン・アット・リスクオーバードーシングを危険にさらす。
現在の手動のリプランニングプロセスはリソース集約的で時間を要する。
本稿では,IMPT自動更新のための患者固有の深層強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.677300387603356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anatomical changes during intensity-modulated proton therapy (IMPT) for head-and-neck cancer (HNC) can shift Bragg peaks, risking tumor underdosing and organ-at-risk overdosing. As a result, treatment replanning is often required to maintain clinically acceptable treatment quality. However, current manual replanning processes are resource-intensive and time-consuming. We propose a patient-specific deep reinforcement learning (DRL) framework for automated IMPT replanning, with a reward-shaping mechanism based on a $150$-point plan quality score addressing competing clinical objectives. We formulate the planning process as an RL problem where agents learn control policies to adjust optimization priorities, maximizing plan quality. Unlike population-based approaches, our framework trains personalized agents for each patient using their planning CT (Computed Tomography) and augmented anatomies simulating anatomical changes (tumor progression and regression). This patient-specific approach leverages anatomical similarities throughout treatment, enabling effective plan adaptation. We implemented two DRL algorithms, Deep Q-Network and Proximal Policy Optimization, using dose-volume histograms (DVHs) as state representations and a $22$-dimensional action space of priority adjustments. Evaluation on five HNC patients using actual replanning CT data showed both DRL agents improved initial plan scores from $120.63 \pm 21.40$ to $139.78 \pm 6.84$ (DQN) and $142.74 \pm 5.16$ (PPO), surpassing manual replans generated by a human planner ($137.20 \pm 5.58$). Clinical validation confirms that improvements translate to better tumor coverage and OAR sparing across diverse anatomical changes. This work demonstrates DRL's potential in addressing geometric and dosimetric complexities of adaptive proton therapy, offering efficient offline adaptation solutions and advancing online adaptive proton therapy.
- Abstract(参考訳): 頭頸部癌(HNC)に対するIMPT治療中の解剖学的変化は、ブラッグピークをシフトさせ、腫瘍のアンダードと臓器-アット・リスクオーバードーシングのリスクを負う。
その結果、臨床上許容できる治療品質を維持するために、治療の見直しが要求されることが多い。
しかし、現在の手作業によるリプランニングプロセスはリソース集約的で時間を要する。
本稿では,150ドル(約1,300円)のプラン品質スコアに基づく報酬形成機構を備えた,IMPT自動更新のための患者特異的深部強化学習(DRL)フレームワークを提案する。
エージェントが制御ポリシーを学習し、最適化の優先順位を調整し、計画品質を最大化するRL問題として計画過程を定式化する。
組織学的変化(腫瘍進展と退行)をシミュレートしたCT(Computed Tomography)と拡張解剖学を用いて各患者にパーソナライズされたエージェントを訓練した。
この患者固有のアプローチは、治療全体を通して解剖学的類似性を活用し、効果的な計画適応を可能にする。
我々は,2つのDRLアルゴリズム,Deep Q-Network と Proximal Policy Optimization を実装した。
実際のリプランニングCTデータを用いた5人のHNC患者の評価では、DRLエージェントが最初の計画スコアを120.63 \pm 21.40$から139.78 \pm 6.84$ (DQN) と142.74 \pm 5.16$ (PPO) に改善した。
臨床検証では、改善は腫瘍のカバレッジの改善と様々な解剖学的変化のOARスペーリングにつながることが確認されている。
本研究は、適応プロトン療法の幾何学的およびドシメトリックな複雑さに対処し、効率的なオフライン適応ソリューションを提供し、オンライン適応プロトン療法を進展させるDRLの可能性を示す。
関連論文リスト
- Automatic Treatment Planning using Reinforcement Learning for High-dose-rate Prostate Brachytherapy [3.198160082615183]
高用量(HDR)前立腺切断療法では、針の配置パターンは医師の経験にのみ依存する。
本研究は, プレプランニング段階における患者解剖学に基づいて, 針位置と居住時間を提供するための強化学習(RL)の有用性について検討した。
このアプローチは手続き時間を短縮し、一貫した計画品質を確保する。
論文 参考訳(メタデータ) (2025-06-11T14:46:42Z) - A Self-supervised Multimodal Deep Learning Approach to Differentiate Post-radiotherapy Progression from Pseudoprogression in Glioblastoma [5.98776969609135]
グリオ芽腫(GBM)に対する放射線治療後のPsPとTrue Progression(TP)の正確な鑑別は最適な治療計画に不可欠である。
本研究では, 日常的な解剖学的MRI画像, 臨床パラメータ, RT治療計画情報からの補完情報を利用して, 予測精度を向上させるマルチモーダル深層学習手法を提案する。
論文 参考訳(メタデータ) (2025-02-06T11:57:57Z) - Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning [0.7519872646378836]
本稿では,PPOアルゴリズムと線量分布に基づく報酬関数を用いた自動治療計画モデルを提案する。
実験的なルールのセットは、ターゲットのボリュームとリスクのある臓器から補助的な計画構造を作成するために使用される。
PPOを用いて訓練された意思決定ポリシーネットワークを開発し、連続的な行動空間において、関連する計画目標パラメータを反復的に調整する。
論文 参考訳(メタデータ) (2024-09-17T22:01:56Z) - Safe Deep RL for Intraoperative Planning of Pedicle Screw Placement [61.28459114068828]
安全な深部強化学習(DRL)に基づく訓練経路計画にリアルタイムな観察を活用するロボット脊椎手術の術中計画手法を提案する。
本手法は,ゴールドスタンダード (GS) 掘削計画に関して,90%の骨貫通を達成できた。
論文 参考訳(メタデータ) (2023-05-09T11:42:53Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Resource Planning for Hospitals Under Special Consideration of the
COVID-19 Pandemic: Optimization and Sensitivity Analysis [87.31348761201716]
新型コロナウイルス(covid-19)パンデミックのような危機は、医療機関にとって深刻な課題となる。
BaBSim.Hospitalは離散イベントシミュレーションに基づく容量計画ツールである。
BaBSim.Hospitalを改善するためにこれらのパラメータを調査し最適化することを目指しています。
論文 参考訳(メタデータ) (2021-05-16T12:38:35Z) - A feasibility study of a hyperparameter tuning approach to automated
inverse planning in radiotherapy [68.8204255655161]
本研究の目的は,計画品質を保ちながら,逆計画プロセスを自動化し,積極的な計画時間を短縮することである。
本研究では, 線量パラメータの選択, ランダムおよびベイズ探索法, ユーティリティ関数形式が計画時間と計画品質に及ぼす影響について検討した。
100個のサンプルを用いて良好な計画品質が得られ、平均計画時間は2.3時間であった。
論文 参考訳(メタデータ) (2021-05-14T18:37:00Z) - DTR Bandit: Learning to Make Response-Adaptive Decisions With Low Regret [59.81290762273153]
動的治療体制 (DTR) はパーソナライズされ適応された多段階の治療計画であり、治療決定を個人の初期特徴に適応させ、その後の各段階における中間結果と特徴に適応させる。
本稿では,探索と搾取を慎重にバランスさせることで,遷移モデルと報酬モデルが線形である場合に,速度-最適後悔を実現する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-06T13:03:42Z) - Patient-Specific Finetuning of Deep Learning Models for Adaptive
Radiotherapy in Prostate CT [1.3124513975412255]
OAR(Organs-At-Risk)は放射線治療計画において重要なステップである。
本研究では、治療セッションに蓄積されたパーソナライズされた解剖学的知識を活用し、事前学習された畳み込みニューラルネットワーク(CNN)のセグメンテーション精度を向上させる。
そこで我々は, より早い治療率で得られた画像に基づいて, CNNモデルを特定の患者に微調整するトランスファーラーニングアプローチについて検討した。
論文 参考訳(メタデータ) (2020-02-17T12:53:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。