論文の概要: Coder as Editor: Code-driven Interpretable Molecular Optimization
- arxiv url: http://arxiv.org/abs/2510.14455v1
- Date: Thu, 16 Oct 2025 08:55:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.787497
- Title: Coder as Editor: Code-driven Interpretable Molecular Optimization
- Title(参考訳): Coder as Editor: Code-driven Interpretable Molecular Optimization
- Authors: Wenyu Zhu, Chengzhu Li, Xiaohe Tian, Yifan Wang, Yinjun Jia, Jianhui Wang, Bowen Gao, Ya-Qin Zhang, Wei-Ying Ma, Yanyan Lan,
- Abstract要約: 私たちは、編集アクションを実行可能なコードに変換することによって、推論と実行をブリッジするフレームワークMECoを紹介します。
提案手法は,化学反応とターゲット特異的化合物対からのリアルな編集を再現する際の精度を98%以上向上させる。
- 参考スコア(独自算出の注目度): 36.84386817559159
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Molecular optimization is a central task in drug discovery that requires precise structural reasoning and domain knowledge. While large language models (LLMs) have shown promise in generating high-level editing intentions in natural language, they often struggle to faithfully execute these modifications-particularly when operating on non-intuitive representations like SMILES. We introduce MECo, a framework that bridges reasoning and execution by translating editing actions into executable code. MECo reformulates molecular optimization for LLMs as a cascaded framework: generating human-interpretable editing intentions from a molecule and property goal, followed by translating those intentions into executable structural edits via code generation. Our approach achieves over 98% accuracy in reproducing held-out realistic edits derived from chemical reactions and target-specific compound pairs. On downstream optimization benchmarks spanning physicochemical properties and target activities, MECo substantially improves consistency by 38-86 percentage points to 90%+ and achieves higher success rates over SMILES-based baselines while preserving structural similarity. By aligning intention with execution, MECo enables consistent, controllable and interpretable molecular design, laying the foundation for high-fidelity feedback loops and collaborative human-AI workflows in drug discovery.
- Abstract(参考訳): 分子最適化は、正確な構造的推論とドメイン知識を必要とする薬物発見の中心的なタスクである。
大きな言語モデル(LLM)は、自然言語で高いレベルの編集意図を生成することを約束しているが、特にSMILESのような直観的でない表現で操作する場合は、これらの修正を忠実に実行するのに苦労することが多い。
私たちは、編集アクションを実行可能なコードに変換することによって、推論と実行をブリッジするフレームワークMECoを紹介します。
MECoは、LCMの分子最適化を、分子と特性目標から人間の解釈可能な編集意図を生成し、次にコード生成を通じてそれらの意図を実行可能な構造的編集に変換する、カスケードされたフレームワークとして再構成する。
提案手法は,化学反応とターゲット特異的な化合物対から得られたリアルな編集を再現する際の精度を98%以上向上させる。
物理化学的特性と目標活動にまたがる下流最適化ベンチマークでは、MECoは38~86ポイントの一貫性を90%以上向上し、SMILESベースのベースラインよりも高い成功率を達成するとともに、構造的類似性を保っている。
意図と実行を一致させることで、MECoは一貫性があり、制御可能で、解釈可能な分子設計を可能にし、薬物発見における高忠実なフィードバックループと協調的なヒューマンAIワークフローの基礎を築いた。
関連論文リスト
- ChemOrch: Empowering LLMs with Chemical Intelligence via Synthetic Instructions [52.79349601462865]
ChemOrchは化学的に接地した命令応答対を合成するフレームワークである。
ChemOrchは、生成したタスクに対して、制御可能な多様性と難易度を実現する。
論文 参考訳(メタデータ) (2025-09-20T05:43:58Z) - ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。
このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。
反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文 参考訳(メタデータ) (2025-06-30T05:11:19Z) - VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design [0.0]
VALID-Molは、化学検証とLCM駆動分子設計を統合する包括的なフレームワークである。
本手法は, 組織的迅速最適化, 自動化学検証, ドメイン適応微調整を合成し, 合成可能な分子の生成を確実にする。
論文 参考訳(メタデータ) (2025-06-29T17:17:04Z) - Beyond Chemical QA: Evaluating LLM's Chemical Reasoning with Modular Chemical Operations [43.623140005091535]
我々は、分子構造理解を算術に着想を得た演算でブリッジする推論フレームワークであるChemCoTBenchを紹介する。
ChemCoTBenchは、化学的問題解決を透明でステップバイステップの推論に形式化する。
分子特性最適化と化学反応予測という2つの高影響タスクのモデルを評価する。
論文 参考訳(メタデータ) (2025-05-27T15:15:44Z) - MolEditRL: Structure-Preserving Molecular Editing via Discrete Diffusion and Reinforcement Learning [4.430115182041077]
MolEditRLは、構造的制約と正確なプロパティ最適化を統合する分子編集フレームワークである。
包括的評価のために,最大かつ最も特性に富んだ分子編集データセットである MolEdit-Instruct を構築した。
論文 参考訳(メタデータ) (2025-05-26T15:29:08Z) - DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Molecular Design in Synthetically Accessible Chemical Space via Deep
Reinforcement Learning [0.0]
既存の生成法は、最適化中に分子特性の分布を好適にシフトできる能力に制限されていると論じる。
本稿では,分子設計のための新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T16:29:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。