論文の概要: A reinforcement learning application of guided Monte Carlo Tree Search
algorithm for beam orientation selection in radiation therapy
- arxiv url: http://arxiv.org/abs/2004.06244v1
- Date: Tue, 14 Apr 2020 00:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 09:23:30.411363
- Title: A reinforcement learning application of guided Monte Carlo Tree Search
algorithm for beam orientation selection in radiation therapy
- Title(参考訳): 放射線治療におけるビーム配向選択のための誘導モンテカルロ木探索アルゴリズムの強化学習への応用
- Authors: Azar Sadeghnejad-Barkousaraie, Gyanendra Bohara, Steve Jiang, Dan
Nguyen
- Abstract要約: カラム生成(CG)のような放射線治療のための現在のビーム配向最適化アルゴリズムは、本質的には欲求的であり、準最適解をもたらす。
本稿では,モンテカルロ木探索を用いた強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.5735035463793008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the large combinatorial problem, current beam orientation optimization
algorithms for radiotherapy, such as column generation (CG), are typically
heuristic or greedy in nature, leading to suboptimal solutions. We propose a
reinforcement learning strategy using Monte Carlo Tree Search capable of
finding a superior beam orientation set and in less time than CG.We utilized a
reinforcement learning structure involving a supervised learning network to
guide Monte Carlo tree search (GTS) to explore the decision space of beam
orientation selection problem. We have previously trained a deep neural network
(DNN) that takes in the patient anatomy, organ weights, and current beams, and
then approximates beam fitness values, indicating the next best beam to add.
This DNN is used to probabilistically guide the traversal of the branches of
the Monte Carlo decision tree to add a new beam to the plan. To test the
feasibility of the algorithm, we solved for 5-beam plans, using 13 test
prostate cancer patients, different from the 57 training and validation
patients originally trained the DNN. To show the strength of GTS to other
search methods, performances of three other search methods including a guided
search, uniform tree search and random search algorithms are also provided. On
average GTS outperforms all other methods, it find a solution better than CG in
237 seconds on average, compared to CG which takes 360 seconds, and outperforms
all other methods in finding a solution with lower objective function value in
less than 1000 seconds. Using our guided tree search (GTS) method we were able
to maintain a similar planning target volume (PTV) coverage within 1% error,
and reduce the organ at risk (OAR) mean dose for body, rectum, left and right
femoral heads, but a slight increase of 1% in bladder mean dose.
- Abstract(参考訳): 大きな組合せ問題のため、コラム生成(cg)のような放射線治療のための現在のビーム配向最適化アルゴリズムは、自然界においてヒューリスティックまたは欲望であり、サブオプティマイズに繋がる。
本研究では,優れたビーム配向集合をcgよりも少ない時間で発見できるモンテカルロ木探索を用いた強化学習戦略を提案し,教師付き学習ネットワークを用いた強化学習構造を用いて,モンテカルロ木探索(gts)をガイドし,ビーム配向選択問題の決定空間を探索する。
我々は以前、患者の解剖、臓器の重量、そして現在のビームを取り入れたディープニューラルネットワーク(DNN)をトレーニングし、それからビームの適合値を近似し、次に追加すべきビームを示す。
このDNNは、モンテカルロ決定木の枝の移動を確率的にガイドし、計画に新たなビームを加えるために使用される。
このアルゴリズムの実現可能性をテストするために,13名の前立腺癌患者を用いて,dnnをトレーニングした57名の患者と異なる5ビーム計画について検討した。
他の探索法に対するgtsの強みを示すために、誘導探索、一様木探索、ランダム探索アルゴリズムを含む3つの他の探索法の性能も提供する。
平均的なGTSは他の全ての手法より優れており、平均237秒で解がCGより優れており、360秒で解が得られ、1000秒未満で目的関数値の低い解を見つけるのに他の方法よりも優れている。
ガイドツリーサーチ(GTS)法を用いて, 同様の計画目標容積(PTV)を1%の誤差で維持し, 体, 直腸, 左大腿頭および右大腿頭に対するOAR平均被曝量を減らすことができたが, 膀胱平均被曝量はわずか1%増加した。
関連論文リスト
- Meta-Learning from Learning Curves for Budget-Limited Algorithm Selection [11.409496019407067]
予算制限のシナリオでは、アルゴリズム候補を慎重に選択し、それを訓練するための予算を割り当てることが不可欠である。
本稿では,エージェントが十分に訓練されるまで待たずに,最も有望なアルゴリズムを学習する過程において,エージェントが選択しなければならない新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-10-10T08:09:58Z) - LiteSearch: Efficacious Tree Search for LLM [70.29796112457662]
本研究では,動的ノード選択とノードレベルの探索予算を備えた新しいガイド付き木探索アルゴリズムを提案する。
GSM8KおよびTabMWPデータセットを用いて行った実験により,本手法はベースライン法に比べて計算コストが大幅に低いことを示した。
論文 参考訳(メタデータ) (2024-06-29T05:14:04Z) - Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - A GPU-Accelerated Moving-Horizon Algorithm for Training Deep
Classification Trees on Large Datasets [13.02279265869312]
連続的な特徴を持つ分類木(MH-DEOCT)に対する移動水平微分アルゴリズムを提案する。
本手法は,隣接サンプル間の重複探索を除去する離散木復号法により構成する。
MH-DEOCTは、トレーニングとテストのほぼ最適性能を達成する。
論文 参考訳(メタデータ) (2023-11-12T20:34:00Z) - Monte-Carlo Tree Search for Multi-Agent Pathfinding: Preliminary Results [60.4817465598352]
マルチエージェントパスフィンディングに適したモンテカルロ木探索(MCTS)のオリジナル版を紹介する。
具体的には,エージェントの目標達成行動を支援するために,個別の経路を用いる。
また,木探索手順の分岐係数を低減するために,専用の分解手法を用いる。
論文 参考訳(メタデータ) (2023-07-25T12:33:53Z) - Provable and Practical: Efficient Exploration in Reinforcement Learning via Langevin Monte Carlo [104.9535542833054]
我々は、強化学習のためのトンプソンサンプリングに基づくスケーラブルで効果的な探索戦略を提案する。
代わりに、Langevin Monte Carlo を用いて、Q 関数をその後部分布から直接サンプリングする。
提案手法は,Atari57スイートからのいくつかの挑戦的な探索課題において,最先端の深部RLアルゴリズムと比較して,より優れた,あるいは類似した結果が得られる。
論文 参考訳(メタデータ) (2023-05-29T17:11:28Z) - CausNet : Generational orderings based search for optimal Bayesian
networks via dynamic programming with parent set constraints [5.7460673927330035]
動的プログラミングに基づくアルゴリズムを組込み次元削減と親集合同定により実装する。
これにより、探索空間が劇的に減少し、大規模データに適用できる。
合成データと実データの両方にアルゴリズムの有効性を示す。
論文 参考訳(メタデータ) (2022-07-18T03:26:41Z) - Reinforcement Learning for Branch-and-Bound Optimisation using
Retrospective Trajectories [72.15369769265398]
機械学習は分岐のための有望なパラダイムとして登場した。
分岐のための単純かつ効果的なRLアプローチであるレトロ分岐を提案する。
我々は現在最先端のRL分岐アルゴリズムを3~5倍に上回り、500の制約と1000の変数を持つMILP上での最高のILメソッドの性能の20%以内である。
論文 参考訳(メタデータ) (2022-05-28T06:08:07Z) - Pneumonia Detection in Chest X-Rays using Neural Networks [0.6639684533393106]
我々は,北米放射線学会における胸部X線画像の分類のためのCNNモデルを提案した。
提案手法は,非複雑CNNとXception, InceptionV3/V4, EfficientNetB7などの伝達学習アルゴリズムを用いた。
論文 参考訳(メタデータ) (2022-04-07T17:39:12Z) - Optimization of Residual Convolutional Neural Network for
Electrocardiogram Classification [0.9281671380673306]
本稿では,2段階のリカレント1次元畳み込みニューラルネットワークモデル(R-1D-CNN)を提案する。
第1段階では、残留畳み込み層と1次元畳み込みニューラルネットワーク層をトレーニングし、患者固有の心電図の特徴を学習する。
2番目のレベルは自動であり、提案アルゴリズムに基づくBOに基づいている。
論文 参考訳(メタデータ) (2021-12-11T16:52:23Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。