論文の概要: Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs
- arxiv url: http://arxiv.org/abs/2509.10504v1
- Date: Mon, 01 Sep 2025 21:44:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-21 06:05:45.760424
- Title: Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs
- Title(参考訳): 木構造MDPの最悪の経路政策最適化による再合成計画
- Authors: Mianchu Wang, Giovanni Montana,
- Abstract要約: 再合成計画は、標的分子を利用可能な構成要素に分解することを目的としており、各内部ノードが中間化合物を表す木を形成する。
既存のメソッドは、ブランチ全体の平均パフォーマンスを最適化することが多く、最悪のケースの感度を考慮していない。
木MDPと相互作用する対話的再合成計画(InterRetro)を導入し,最悪経路結果の値関数を学習する。
InterRetroは最先端の結果を達成し、Retro*-190ベンチマークの目標の100%を解決し、合成経路を4.9%短縮し、トレーニングデータの10%のみを使用して有望なパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 8.914988066868927
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Retrosynthesis planning aims to decompose target molecules into available building blocks, forming a synthesis tree where each internal node represents an intermediate compound and each leaf ideally corresponds to a purchasable reactant. However, this tree becomes invalid if any leaf node is not a valid building block, making the planning process vulnerable to the "weakest link" in the synthetic route. Existing methods often optimise for average performance across branches, failing to account for this worst-case sensitivity. In this paper, we reframe retrosynthesis as a worst-path optimisation problem within tree-structured Markov Decision Processes (MDPs). We prove that this formulation admits a unique optimal solution and offers monotonic improvement guarantees. Building on this insight, we introduce Interactive Retrosynthesis Planning (InterRetro), a method that interacts with the tree MDP, learns a value function for worst-path outcomes, and improves its policy through self-imitation, preferentially reinforcing past decisions with high estimated advantage. Empirically, InterRetro achieves state-of-the-art results, solving 100% of targets on the Retro*-190 benchmark, shortening synthetic routes by 4.9%, and achieving promising performance using only 10% of the training data - representing a significant advance in computational retrosynthesis planning.
- Abstract(参考訳): 再合成計画は、標的分子を利用可能な構造ブロックに分解することを目的としており、各内部ノードが中間化合物を表し、各葉が購入可能な反応剤に理想的に対応する合成木を形成する。
しかし、葉ノードが有効なビルディングブロックでない場合、この木は無効となり、合成経路の「最も弱いリンク」に脆弱な計画プロセスとなる。
既存のメソッドは、ブランチ全体の平均パフォーマンスを最適化することが多く、最悪のケースの感度を考慮していない。
本稿では,木構造マルコフ決定過程(MDP)において,再合成を最悪の経路最適化問題として再編成する。
この定式化が一意の最適解を認め、単調な改善を保証することを証明している。
この知見に基づいて, 木MDPと相互作用し, 最悪の経路結果の値関数を学習し, 自己刺激によって政策を改善し, 過去の意思決定を高い評価で優先的に補強する対話的再合成計画(InterRetro)を導入する。
実証的な結果として、InterRetroは最先端の結果を達成し、Retro*-190ベンチマークの目標の100%を解決し、合成経路を4.9%短縮し、トレーニングデータの10%しか使用せずに有望なパフォーマンスを達成する。
関連論文リスト
- Multi-Armed Bandits-Based Optimization of Decision Trees [0.0]
本稿では,マルチアーマッドバンド (MAB) に基づくプルーニング手法,強化学習 (RL) に基づく手法を提案する。
そこで我々はMABアルゴリズムを用いて各プルーニング動作からのフィードバックに基づいて最適な分岐ノードを見つける。
論文 参考訳(メタデータ) (2025-08-08T02:43:45Z) - Soft regression trees: a model variant and a decomposition training algorithm [0.24578723416255752]
そこで本研究では,各入力ベクトルに対して,単一の葉ノードに関連付けられた線形回帰として定義する,ソフト多変量回帰木(SRT)の新たな変種を提案する。
SRTは条件付き計算特性、すなわち各予測は少数のノードに依存する。
15のよく知られたデータセットの実験により、従来のソフトレグレッションツリーと比較して、我々のSRTと分解アルゴリズムは高い精度とロバスト性が得られることが示された。
論文 参考訳(メタデータ) (2025-01-10T13:06:36Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z) - bsnsing: A decision tree induction method based on recursive optimal
boolean rule composition [2.28438857884398]
本稿では,決定木帰納過程における分割規則選択を最適化するMIP(Mixed-integer Programming)の定式化を提案する。
商用の解法よりも高速に実例を解くことができる効率的な探索解法を開発した。
論文 参考訳(メタデータ) (2022-05-30T17:13:57Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Generalized and Scalable Optimal Sparse Decision Trees [56.35541305670828]
様々な目的に対して最適な決定木を生成する手法を提案する。
また,連続変数が存在する場合に最適な結果が得られるスケーラブルなアルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-06-15T19:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。