論文の概要: Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2409.11576v1
- Date: Tue, 17 Sep 2024 22:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-19 19:49:52.774627
- Title: Automating proton PBS treatment planning for head and neck cancers using policy gradient-based deep reinforcement learning
- Title(参考訳): 政策勾配に基づく深部強化学習を用いた頭頸部癌に対するプロトンPBS治療計画の自動化
- Authors: Qingqing Wang, Chang Chang,
- Abstract要約: 本稿では,PPOアルゴリズムと線量分布に基づく報酬関数を用いた自動治療計画モデルを提案する。
実験的なルールのセットは、ターゲットのボリュームとリスクのある臓器から補助的な計画構造を作成するために使用される。
PPOを用いて訓練された意思決定ポリシーネットワークを開発し、連続的な行動空間において、関連する計画目標パラメータを反復的に調整する。
- 参考スコア(独自算出の注目度): 0.7519872646378836
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Proton pencil beam scanning (PBS) treatment planning for head and neck (H&N) cancers is a time-consuming and experience-demanding task where a large number of planning objectives are involved. Deep reinforcement learning (DRL) has recently been introduced to the planning processes of intensity-modulated radiation therapy and brachytherapy for prostate, lung, and cervical cancers. However, existing approaches are built upon the Q-learning framework and weighted linear combinations of clinical metrics, suffering from poor scalability and flexibility and only capable of adjusting a limited number of planning objectives in discrete action spaces. We propose an automatic treatment planning model using the proximal policy optimization (PPO) algorithm and a dose distribution-based reward function for proton PBS treatment planning of H&N cancers. Specifically, a set of empirical rules is used to create auxiliary planning structures from target volumes and organs-at-risk (OARs), along with their associated planning objectives. These planning objectives are fed into an in-house optimization engine to generate the spot monitor unit (MU) values. A decision-making policy network trained using PPO is developed to iteratively adjust the involved planning objective parameters in a continuous action space and refine the PBS treatment plans using a novel dose distribution-based reward function. Proton H&N treatment plans generated by the model show improved OAR sparing with equal or superior target coverage when compared with human-generated plans. Moreover, additional experiments on liver cancer demonstrate that the proposed method can be successfully generalized to other treatment sites. To the best of our knowledge, this is the first DRL-based automatic treatment planning model capable of achieving human-level performance for H&N cancers.
- Abstract(参考訳): 頭頸部癌(H&N)に対するプロトン鉛筆ビームスキャン(PBS)治療計画(英語版)は、多くの計画目標が関与する時間的・経験的な課題である。
深部強化学習(DRL)は近年,前立腺癌,肺がん,頸がんに対する強度変調放射線療法と気管支内療法の計画プロセスに導入されている。
しかし、既存のアプローチはQラーニングフレームワークと臨床メトリクスの重み付けされた線形結合の上に構築されており、スケーラビリティと柔軟性が貧弱で、個別のアクション空間において限られた数の計画目標を調整できるだけである。
H&N癌に対するプロトンPBS治療計画のためのPPOアルゴリズムと線量分布に基づく報酬関数を用いた自動治療計画モデルを提案する。
具体的には、実験的なルールのセットを使用して、対象のボリュームとオルガン・アット・リスク(OAR)から、関連する計画目的とともに補助的な計画構造を作成する。
これらの計画目標は、スポットモニタユニット(MU)値を生成するために、社内最適化エンジンに供給される。
PPOを用いて訓練された意思決定ポリシーネットワークを開発し、連続的な行動空間における計画目標パラメータを反復的に調整し、新しい線量分布に基づく報酬関数を用いてPBS処理計画を洗練させる。
モデルにより生成されたプロトンH&N処理計画は、人為的な計画と比較して、OARスペーリングを同等または優れた目標範囲で改善した。
さらに, 肝癌に対する追加実験により, 提案手法を他の治療部位に応用できることが示唆された。
我々の知る限りでは、H&N癌に対するヒトレベルのパフォーマンスを達成することができるDRLベースの自動治療計画モデルとしてはこれが初めてである。
関連論文リスト
- Hierarchical Preference Optimization: Learning to achieve goals via feasible subgoals prediction [71.81851971324187]
本研究は階層型強化学習(HRL)の新しいアプローチである階層型優先度最適化(HPO)を導入する。
HPOは、複雑なロボット制御タスクを解く際に、非定常性と非実用的なサブゴール生成の問題に対処する。
挑戦的なロボットナビゲーションと操作タスクの実験はHPOの素晴らしいパフォーマンスを示しており、ベースラインよりも最大35%改善されている。
論文 参考訳(メタデータ) (2024-11-01T04:58:40Z) - Automated radiotherapy treatment planning guided by GPT-4Vision [27.56613357226252]
本稿では,完全に自動化された治療計画フレームワークであるGPT-RadPlanを紹介する。
GPT-RadPlanはOpenAIのGPT-4Vision (GPT-4V)のような多モードの大規模言語モデルで符号化された放射線オンコロジーの知識を利用する。
GPT-RadPlanはAPIを通じて社内の逆処理計画システムに統合されます。
論文 参考訳(メタデータ) (2024-06-21T19:23:03Z) - Large-Language-Model Empowered Dose Volume Histogram Prediction for
Intensity Modulated Radiotherapy [11.055104826451126]
本研究では,非構造化画像から画像パッチノードと線量ノードからなる構造化グラフに変換するパイプラインを提案する。
構造グラフからDVH(Dose-Volume histograms)を予測するために,新しいDose Graph Neural Network(DoseGNN)モデルを開発した。
本研究では,IMRT(強度変調放射線療法)計画の自動化を目的とした概念の実践的実装として,オンライン人間とAIのコラボレーションシステムを導入した。
論文 参考訳(メタデータ) (2024-02-11T11:24:09Z) - Theoretically Guaranteed Policy Improvement Distilled from Model-Based
Planning [64.10794426777493]
モデルベース強化学習(RL)は、様々な連続制御タスクにおいて顕著な成功を収めた。
近年のプラクティスでは、最適化されたアクションシーケンスをトレーニングフェーズ中にRLポリシーに蒸留する傾向にある。
我々は,モデルに基づく計画から政策への蒸留アプローチを開発する。
論文 参考訳(メタデータ) (2023-07-24T16:52:31Z) - Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。
提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文 参考訳(メタデータ) (2023-03-20T14:51:10Z) - A Decision Making Approach for Chemotherapy Planning based on
Evolutionary Processing [0.0]
本稿では,がん化学療法のための多目的メタヒューリスティック法を提案する。
提案手法は, 薬物濃度, 腫瘍増殖量, 毒性量を測定するために, 数学的モデルを用いている。
以上の結果から, 提案手法は, より最近の類似手法と比較して, 治療性能が向上することが示された。
論文 参考訳(メタデータ) (2023-03-19T02:26:50Z) - OpenKBP-Opt: An international and reproducible evaluation of 76
knowledge-based planning pipelines [48.547200649819615]
放射線治療における知識ベース計画(KBP)のための計画最適化モデルを開発するためのオープンフレームワークを構築した。
当フレームワークは, 頭頸部癌100例の基準計画と, 19KBPモデルによる高用量予測を含む。
論文 参考訳(メタデータ) (2022-02-16T19:18:42Z) - A feasibility study of a hyperparameter tuning approach to automated
inverse planning in radiotherapy [68.8204255655161]
本研究の目的は,計画品質を保ちながら,逆計画プロセスを自動化し,積極的な計画時間を短縮することである。
本研究では, 線量パラメータの選択, ランダムおよびベイズ探索法, ユーティリティ関数形式が計画時間と計画品質に及ぼす影響について検討した。
100個のサンプルを用いて良好な計画品質が得られ、平均計画時間は2.3時間であった。
論文 参考訳(メタデータ) (2021-05-14T18:37:00Z) - Rapid treatment planning for low-dose-rate prostate brachytherapy with
TP-GAN [9.064664319018064]
低用量前立腺切断療法 (LDR-PB) の治療計画では, 前立腺に最小限の所定の用量を与える埋込み可能な放射性種子の配置を目標としている。
医師の視点からインプラントを「受け入れ可能」とみなすのではなく、この線量基準を満たす複数の種子の配置があります。
LDR-PBデータの大規模プールから学習するモデルをトレーニングすることで、このばらつきを低減する手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T03:02:45Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。