論文の概要: FORGE: Fragment-Oriented Ranking and Generation for Context-Aware Molecular Optimization
- arxiv url: http://arxiv.org/abs/2605.10230v1
- Date: Mon, 11 May 2026 09:06:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.676041
- Title: FORGE: Fragment-Oriented Ranking and Generation for Context-Aware Molecular Optimization
- Title(参考訳): FORGE: コンテキスト対応分子最適化のためのフラグメント指向ランク付けと生成
- Authors: Qingchuan Zhang, He Cao, Hao Li, Yanjun Shao, Zhiyuan Liu, Shihang Wang, Shufang Xie, Shenghua Gao, Xinwu Ye,
- Abstract要約: FORGEは、コンテキスト対応の局所編集として分子最適化を再構成する2段階のフレームワークである。
コンパクトな0.6B言語モデルに基づいて構築されたFOGEは、従来よりも一貫して優れていた。
これらの結果は、自然言語学習の代替として、より容易に入手でき、拡張性があり、幻覚のないものとして、明確なフラグメントレベルの監督の価値を強調している。
- 参考スコア(独自算出の注目度): 38.801595580724616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular optimization seeks to improve a molecule through small structural edits while preserving similarity to the starting compound. Recent language-model approaches typically treat this task as prompt-conditioned sequence generation. However, relying on natural language introduces an inherent data-scaling bottleneck, often leads to chemical hallucinations, and ignores the strong context dependence of fragment effects. We present FORGE, a two-stage framework that reformulates molecular optimization as context-aware local editing. By utilizing automatically mined, verified low-to-high edit pairs instead of expensive human text annotations, Stage 1 ranks candidate fragments by their property contribution under the full molecular context to inject chemical prior, and Stage 2 generates explicit fragment replacements. Built on a compact 0.6B language model, FORGE further adapts to unseen black-box objectives through in-context demonstrations. Across Prompt-MolOpt, PMO-1k and ChemCoTBench, FORGE consistently outperforms prior methods, including substantially larger language models and graph methods. These results highlight the value of explicit fragment-level supervision as a more easily obtainable, scalable, and hallucination-less alternative to natural language training.
- Abstract(参考訳): 分子最適化は、開始化合物と類似性を保ちながら、小さな構造的な編集によって分子を改善することを目指している。
最近の言語モデルアプローチでは、このタスクをプロンプト条件付きシーケンス生成として扱うのが一般的である。
しかし、自然言語に依存することは、本質的にデータスケーリングのボトルネックをもたらし、しばしば化学幻覚を招き、断片効果の強い文脈依存を無視している。
分子最適化を文脈対応局所編集として再構成する2段階のフレームワークであるFOGEを提案する。
高価なテキストアノテーションの代わりに、自動で採掘され、検証された低レベルから高レベルの編集ペアを利用することで、ステージ1は、その特性的貢献によって候補フラグメントを完全な分子的文脈下でランク付けし、ステージ2は、明確なフラグメント置換を生成する。
コンパクトな0.6B言語モデルに基づいて構築されたFOGEは、コンテキスト内デモを通じて、見えないブラックボックスの目的に適応する。
Prompt-MolOpt、PMO-1k、ChemCoTBenchの他、ForGEはより大規模な言語モデルやグラフメソッドなど、従来手法よりも一貫して優れている。
これらの結果は、自然言語学習の代替として、より容易に入手でき、拡張性があり、幻覚のないものとして、明確なフラグメントレベルの監督の価値を強調している。
関連論文リスト
- RTMol: Rethinking Molecule-text Alignment in a Round-trip View [4.597922051722059]
分子キャプションとテキストからSMILES生成を自己教師付きラウンドトリップ学習により統合する双方向アライメントフレームワークであるRTMolを提案する。
実験により、RTMolは様々なLLMに対して、双方向アライメント性能を最大47%向上させることが示された。
論文 参考訳(メタデータ) (2025-11-15T09:55:55Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しいモデルである。
我々は、13のタスクのうち11のタスクで最先端のパフォーマンスを達成するMoleculeNetデータセット上で、FARMを評価した。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Expedited Training of Visual Conditioned Language Generation via
Redundancy Reduction [61.16125290912494]
$textEVL_textGen$は、視覚条件付き言語生成モデルの事前トレーニング用に設計されたフレームワークである。
提案手法は,視覚言語モデルの学習を5倍に加速させるが,全体的な性能に顕著な影響を与えないことを示す。
論文 参考訳(メタデータ) (2023-10-05T03:40:06Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - Graph Polish: A Novel Graph Generation Paradigm for Molecular
Optimization [7.1696593196695035]
本稿では,従来の「二言語翻訳」タスクから「単言語」タスクへ分子最適化を変換する新しい分子最適化パラダイムであるグラフポーランドを提案する。
本稿では,最適化段階における長期的依存関係を捉えるために,効果的で効率的な学習フレームワークT&Sの研磨法を提案する。
論文 参考訳(メタデータ) (2020-08-14T08:36:13Z) - A Deep Generative Model for Fragment-Based Molecule Generation [21.258861822241272]
フラグメントと呼ばれる小さな分子サブ構造のための言語モデルを開発した。
言い換えれば、原子のフラグメントではなく、フラグメントによって分子のフラグメントを生成します。
実験により、我々のモデルは、他の言語モデルベースの競合よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-02-28T15:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。