論文の概要: When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs
- arxiv url: http://arxiv.org/abs/2602.03554v1
- Date: Tue, 03 Feb 2026 14:03:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.493866
- Title: When Single Answer Is Not Enough: Rethinking Single-Step Retrosynthesis Benchmarks for LLMs
- Title(参考訳): シングルアンサーが不十分な場合 - LLMのシングルステップ再合成ベンチマークを再考する
- Authors: Bogdan Zagribelnyy, Ivan Ilin, Maksim Kuznetsov, Nikita Bondarev, Roman Schutski, Thomas MacDougall, Rim Shayakhmetov, Zulfat Miftakhutdinov, Mikolaj Mizera, Vladimir Aladinskiy, Alex Aliper, Alex Zhavoronkov,
- Abstract要約: 単段回帰合成のための新しいベンチマークフレームワークを提案する。
正確なマッチングに対する妥当性を強調することで、このアプローチは人間の合成計画プラクティスとよりよく一致します。
LLMトレーニングのための数百万のChemCensor-validated reaction recordからなる新しいデータセットCREEDについても紹介する。
- 参考スコア(独自算出の注目度): 3.973137925060284
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent progress has expanded the use of large language models (LLMs) in drug discovery, including synthesis planning. However, objective evaluation of retrosynthesis performance remains limited. Existing benchmarks and metrics typically rely on published synthetic procedures and Top-K accuracy based on single ground-truth, which does not capture the open-ended nature of real-world synthesis planning. We propose a new benchmarking framework for single-step retrosynthesis that evaluates both general-purpose and chemistry-specialized LLMs using ChemCensor, a novel metric for chemical plausibility. By emphasizing plausibility over exact match, this approach better aligns with human synthesis planning practices. We also introduce CREED, a novel dataset comprising millions of ChemCensor-validated reaction records for LLM training, and use it to train a model that improves over the LLM baselines under this benchmark.
- Abstract(参考訳): 近年の進歩は、合成計画を含む薬物発見における大規模言語モデル(LLM)の使用を拡大している。
しかし, 再合成性能の客観的評価は依然として限られている。
既存のベンチマークとメトリクスは、一般に、公開された合成手順と、単一の地上構造に基づくTop-Kの精度に依存しており、現実世界の合成計画のオープンな性質を捉えていない。
そこで本研究では,ChemCensorを用いた1段階の逆合成のための新しいベンチマークフレームワークを提案する。
正確なマッチングに対する妥当性を強調することで、このアプローチは人間の合成計画プラクティスとよりよく一致します。
LLMトレーニングのための数百万のChemCensor-validated reaction recordからなる新しいデータセットCREEDを導入し、このベンチマークに基づいてLLMベースラインを改善するモデルをトレーニングする。
関連論文リスト
- Synthelite: Chemist-aligned and feasibility-aware synthesis planning with LLMs [3.7129661557601854]
本稿では,大規模な言語モデルを用いてレトロシンセティック変換を提案する合成計画フレームワークであるSyntheliteを紹介する。
シンセライトは、LLMの本質的な化学知識と推論能力を活用することによって、エンドツーエンドの合成経路を生成することができる。
実験により,Syntheliteの計画軌道を多様なユーザ指定制約に柔軟に適用し,最大95%の成功率を達成することができた。
論文 参考訳(メタデータ) (2025-12-18T11:24:30Z) - A Scientific Reasoning Model for Organic Synthesis Procedure Generation [12.609346156252393]
本稿では、精密な構造化実験手順を生成できる科学的推論言語モデルQFANGを提案する。
本稿では,大規模に化学知識を基盤としたチェーン・オブ・シントデータを生成する,化学誘導推論(CGR)フレームワークを提案する。
RLVR(Reinforcement Learning from Verifiable Rewards)を応用して、手続き精度をさらに向上する。
論文 参考訳(メタデータ) (2025-12-15T18:55:39Z) - DeepRetro: Retrosynthetic Pathway Discovery using Iterative LLM Reasoning [0.0]
DeepRetroは、大規模言語モデル(LLM)、従来のレトロシンセティックエンジン、反復設計ループにおける専門家のフィードバックを密に統合する、新しいオープンソースのフレームワークである。
DeepRetroをオープンソースツールとしてリリースすることで、化学者がますます野心的な合成ターゲットに取り組むようにしたいと思っています。
論文 参考訳(メタデータ) (2025-07-07T19:41:39Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - Mitigating Catastrophic Forgetting in Large Language Models with Self-Synthesized Rehearsal [49.24054920683246]
大規模言語モデル(LLM)は、連続学習中に破滅的な忘れ込みに悩まされる。
自己合成リハーサル(Self-Synthesized Rehearsal, SSR)と呼ばれるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-02T16:11:23Z) - FusionRetro: Molecule Representation Fusion via In-Context Learning for
Retrosynthetic Planning [58.47265392465442]
再合成計画(Retrosynthetic Planning)は、開始物質から標的分子への完全な多段階合成経路を考案することを目的としている。
現在の戦略では、単一ステップの逆合成モデルと探索アルゴリズムの分離されたアプローチを採用している。
本稿では,文脈情報を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-30T08:44:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。