論文の概要: Reinforced Reasoning for End-to-End Retrosynthetic Planning
- arxiv url: http://arxiv.org/abs/2603.29723v1
- Date: Tue, 31 Mar 2026 13:22:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.677404
- Title: Reinforced Reasoning for End-to-End Retrosynthetic Planning
- Title(参考訳): エンド・ツー・エンドのレトロシンセティックプランニングのための強化推論
- Authors: Chenyang Zuo, Siqi Fan, Yizhen Luo, Zaiqing Nie,
- Abstract要約: 再合成計画は有機化学の基本的な課題である。
本稿では,レトロ合成を直接的連鎖推論タスクとして再構成する,エンドツーエンドの生成フレームワークであるReTriPを紹介する。
- 参考スコア(独自算出の注目度): 10.302276947570776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Retrosynthetic planning is a fundamental task in organic chemistry, yet remains challenging due to its combinatorial complexity. To address this, conventional approaches typically rely on hybrid frameworks that combine single-step predictions with external search heuristics, inevitably fracturing the logical coherence between local molecular transformations and global planning objectives. To bridge this gap and embed sophisticated strategic foresight directly into the model's chemical reasoning, we introduce ReTriP, an end-to-end generative framework that reformulates retrosynthesis as a direct Chain-of-Thought reasoning task. We establish a path-coherent molecular representation and employ a progressive training curriculum that transitions from reasoning distillation to reinforcement learning with verifiable rewards, effectively aligning stepwise generation with practical route utility. Empirical evaluation on RetroBench demonstrates that ReTriP achieves state-of-the-art performance, exhibiting superior robustness in long-horizon planning compared to hybrid baselines.
- Abstract(参考訳): 再合成計画(Retrosynthetic Planning)は有機化学の基本的な課題であるが、その組み合わせの複雑さのために依然として困難である。
これを解決するために、従来のアプローチは、単一ステップ予測と外部探索ヒューリスティックを組み合わせ、局所的な分子変換とグローバルな計画目標の間の論理的一貫性を必然的に破壊するハイブリッドフレームワークに依存している。
このギャップを埋めて、モデルの化学推論に直接洗練された戦略的な展望を組み込むために、直結連鎖推論タスクとしてレトロ合成を再構成するエンドツーエンド生成フレームワークであるReTriPを導入する。
我々は経路コヒーレントな分子表現を確立し、蒸留の推論から、検証可能な報酬で強化学習へ移行し、ステップワイズ生成と実用的なルートユーティリティを効果的に整合させるプログレッシブトレーニングカリキュラムを採用する。
RetroBenchの実証評価は、ReTriPが最先端性能を実現し、ハイブリッドベースラインに比べて長期計画において優れたロバスト性を示すことを示した。
関連論文リスト
- RetroReasoner: A Reasoning LLM for Strategic Retrosynthesis Prediction [10.722337545605626]
再合成は、与えられた生成物分子の反応物を予測することを目的とした有機合成のコアタスクである。
本稿では,化学者の戦略的思考を生かしたレトロシンセティック推論モデルRetroReasonerを提案する。
実験の結果、RetroReasonerは以前のベースラインを上回るだけでなく、より広い範囲の実行可能な反応提案を生成することがわかった。
論文 参考訳(メタデータ) (2026-03-13T05:20:56Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - Procrustean Bed for AI-Driven Retrosynthesis: A Unified Framework for Reproducible Evaluation [0.0]
RetroCastは、異種モデルの出力を共通スキーマに標準化する統合評価スイートである。
我々は、新しい標準ベンチマークスイートを用いて、検索ベースおよびシーケンスベースの主要なアルゴリズムを評価する。
論文 参考訳(メタデータ) (2025-12-08T01:26:39Z) - Step-Aware Policy Optimization for Reasoning in Diffusion Large Language Models [57.42778606399764]
拡散言語モデル(dLLM)は、テキスト生成に有望で非自己回帰的なパラダイムを提供する。
現在の強化学習アプローチは、しばしばスパースで結果に基づく報酬に頼っている。
これは推論の自然な構造との根本的なミスマッチに由来すると我々は主張する。
論文 参考訳(メタデータ) (2025-10-02T00:34:15Z) - Round-trip Reinforcement Learning: Self-Consistent Training for Better Chemical LLMs [51.29260537017623]
大規模言語モデル (LLM) は計算化学の汎用基盤モデルとして登場しつつある。
これらのモデルは、しばしば往復一貫性を欠いている。
本稿では,その一貫性を向上させるためにモデルをトレーニングする新しいフレームワークであるRound-Trip Reinforcement Learning(RTRL)を紹介する。
論文 参考訳(メタデータ) (2025-10-01T23:58:58Z) - LLM-Augmented Chemical Synthesis and Design Decision Programs [18.41721617026997]
反応経路を符号化する効率的な手法を導入し,新しい経路レベルの探索戦略を提案する。
我々は,LLMを付加したアプローチがレトロシンセプション計画に優れており,より広範な分子設計の課題に自然に及んでいることを示す。
論文 参考訳(メタデータ) (2025-05-11T15:43:00Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。