論文の概要: Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs
- arxiv url: http://arxiv.org/abs/2509.10504v1
- Date: Mon, 01 Sep 2025 21:44:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-21 06:05:45.760424
- Title: Retrosynthesis Planning via Worst-path Policy Optimisation in Tree-structured MDPs
- Title(参考訳): 木構造MDPの最悪の経路政策最適化による再合成計画
- Authors: Mianchu Wang, Giovanni Montana,
- Abstract要約: 再合成計画は、標的分子を利用可能な構成要素に分解することを目的としており、各内部ノードが中間化合物を表す木を形成する。
既存のメソッドは、ブランチ全体の平均パフォーマンスを最適化することが多く、最悪のケースの感度を考慮していない。
木MDPと相互作用する対話的再合成計画(InterRetro)を導入し,最悪経路結果の値関数を学習する。
InterRetroは最先端の結果を達成し、Retro*-190ベンチマークの目標の100%を解決し、合成経路を4.9%短縮し、トレーニングデータの10%のみを使用して有望なパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 8.914988066868927
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Retrosynthesis planning aims to decompose target molecules into available building blocks, forming a synthesis tree where each internal node represents an intermediate compound and each leaf ideally corresponds to a purchasable reactant. However, this tree becomes invalid if any leaf node is not a valid building block, making the planning process vulnerable to the "weakest link" in the synthetic route. Existing methods often optimise for average performance across branches, failing to account for this worst-case sensitivity. In this paper, we reframe retrosynthesis as a worst-path optimisation problem within tree-structured Markov Decision Processes (MDPs). We prove that this formulation admits a unique optimal solution and offers monotonic improvement guarantees. Building on this insight, we introduce Interactive Retrosynthesis Planning (InterRetro), a method that interacts with the tree MDP, learns a value function for worst-path outcomes, and improves its policy through self-imitation, preferentially reinforcing past decisions with high estimated advantage. Empirically, InterRetro achieves state-of-the-art results, solving 100% of targets on the Retro*-190 benchmark, shortening synthetic routes by 4.9%, and achieving promising performance using only 10% of the training data - representing a significant advance in computational retrosynthesis planning.
- Abstract(参考訳): 再合成計画は、標的分子を利用可能な構造ブロックに分解することを目的としており、各内部ノードが中間化合物を表し、各葉が購入可能な反応剤に理想的に対応する合成木を形成する。
しかし、葉ノードが有効なビルディングブロックでない場合、この木は無効となり、合成経路の「最も弱いリンク」に脆弱な計画プロセスとなる。
既存のメソッドは、ブランチ全体の平均パフォーマンスを最適化することが多く、最悪のケースの感度を考慮していない。
本稿では,木構造マルコフ決定過程(MDP)において,再合成を最悪の経路最適化問題として再編成する。
この定式化が一意の最適解を認め、単調な改善を保証することを証明している。
この知見に基づいて, 木MDPと相互作用し, 最悪の経路結果の値関数を学習し, 自己刺激によって政策を改善し, 過去の意思決定を高い評価で優先的に補強する対話的再合成計画(InterRetro)を導入する。
実証的な結果として、InterRetroは最先端の結果を達成し、Retro*-190ベンチマークの目標の100%を解決し、合成経路を4.9%短縮し、トレーニングデータの10%しか使用せずに有望なパフォーマンスを達成する。
関連論文リスト
- RS-ORT: A Reduced-Space Branch-and-Bound Algorithm for Optimal Regression Trees [2.612627266839037]
MIP(Mixed-integer Programming)は最適な決定木を学習するための強力なフレームワークとして登場した。
連続的な特徴を内在的にバイナライズすることは、グローバルな最適性を犠牲にし、しばしば不必要に深い木を産み出す。
最適回帰木学習を2段階最適化問題として再放送し、RS-ORT(Reduceed-Space Optimal Regression Trees)を提案する。
RS-ORTは木構造変数のみに枝分かれする特殊分岐結合(BB)アルゴリズムである。
論文 参考訳(メタデータ) (2025-10-27T22:17:09Z) - Multi-Armed Bandits-Based Optimization of Decision Trees [0.0]
本稿では,マルチアーマッドバンド (MAB) に基づくプルーニング手法,強化学習 (RL) に基づく手法を提案する。
そこで我々はMABアルゴリズムを用いて各プルーニング動作からのフィードバックに基づいて最適な分岐ノードを見つける。
論文 参考訳(メタデータ) (2025-08-08T02:43:45Z) - Optimas: Optimizing Compound AI Systems with Globally Aligned Local Rewards [98.0983122471875]
複合システムの効率的な最適化のための統一的なフレームワークであるOptimasを提案する。
各イテレーションにおいて、Optimasはローカルリワード関数(LRF)を効率よく適用し、各コンポーネントのローカル報酬を最大化しながら、この特性を維持する。
我々は,5つの実世界の化合物システムに対して広範な評価を行い,オプティマスが11.92%の平均的な改善によって強いベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-03T07:12:48Z) - Birch SGD: A Tree Graph Framework for Local and Asynchronous SGD Methods [51.54704494242525]
本稿では,分散SGD手法を解析・設計するための新しい統一フレームワークであるBirch SGDを提案する。
本研究では,Birch SGDを用いて8つの新しい手法を設計し,これまでに知られていた手法とともに解析する。
i) すべてのメソッドが$Oleft(frac(R + 1) L Deltavarepsilon + fracsigma2 L Deltavarepsilon2right)$と同じ"イテレーションレート"を共有している。
論文 参考訳(メタデータ) (2025-05-14T08:37:45Z) - Soft regression trees: a model variant and a decomposition training algorithm [0.24578723416255752]
そこで本研究では,各入力ベクトルに対して,単一の葉ノードに関連付けられた線形回帰として定義する,ソフト多変量回帰木(SRT)の新たな変種を提案する。
SRTは条件付き計算特性、すなわち各予測は少数のノードに依存する。
15のよく知られたデータセットの実験により、従来のソフトレグレッションツリーと比較して、我々のSRTと分解アルゴリズムは高い精度とロバスト性が得られることが示された。
論文 参考訳(メタデータ) (2025-01-10T13:06:36Z) - Calibrating LLMs with Preference Optimization on Thought Trees for Generating Rationale in Science Question Scoring [16.38771834692938]
より忠実な論理を生成できる新しいフレームワークを提案し、さらに重要なことに、ブラックボックススコアリングシステムと性能をマッチングする。
まず,Large Language Models (LLM) をクエリして思考木を生成することで,人間の評価プロセスを模倣する。
次に、各思考木経路から中間的評価決定を要約し、合成的合理性データと合理性選好データを作成する。
論文 参考訳(メタデータ) (2024-06-28T14:33:05Z) - Retrosynthetic Planning with Dual Value Networks [107.97218669277913]
我々は、PDVN(Planning with Dual Value Networks)と呼ばれる新しいオンライントレーニングアルゴリズムを提案する。
PDVNは計画段階と更新段階を交互に行い、分子の合成性とコストを予測する。
広く使われているUSPTOデータセットでは、PDVNアルゴリズムが既存のマルチステッププランナの探索成功率を改善する。
論文 参考訳(メタデータ) (2023-01-31T16:43:53Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z) - bsnsing: A decision tree induction method based on recursive optimal
boolean rule composition [2.28438857884398]
本稿では,決定木帰納過程における分割規則選択を最適化するMIP(Mixed-integer Programming)の定式化を提案する。
商用の解法よりも高速に実例を解くことができる効率的な探索解法を開発した。
論文 参考訳(メタデータ) (2022-05-30T17:13:57Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z) - RetCL: A Selection-based Approach for Retrosynthesis via Contrastive
Learning [107.64562550844146]
レトロシンセシスは深層学習の新たな研究分野である。
本稿では, 市販分子の候補群から, 反応物質の選択問題へとレトロシンセシスを再構成する新しいアプローチを提案する。
スコア機能を学ぶために、ハードネガティブマイニングを備えた新しいコントラストトレーニングスキームも提案します。
論文 参考訳(メタデータ) (2021-05-03T12:47:57Z) - Generalized and Scalable Optimal Sparse Decision Trees [56.35541305670828]
様々な目的に対して最適な決定木を生成する手法を提案する。
また,連続変数が存在する場合に最適な結果が得られるスケーラブルなアルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-06-15T19:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。