論文の概要: MolEditRL: Structure-Preserving Molecular Editing via Discrete Diffusion and Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2505.20131v1
- Date: Mon, 26 May 2025 15:29:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.571436
- Title: MolEditRL: Structure-Preserving Molecular Editing via Discrete Diffusion and Reinforcement Learning
- Title(参考訳): MolEditRL:離散拡散と強化学習による構造保存分子編集
- Authors: Yuanxin Zhuang, Dazhong Shen, Ying Sun,
- Abstract要約: MolEditRLは、構造的制約と正確なプロパティ最適化を統合する分子編集フレームワークである。
包括的評価のために,最大かつ最も特性に富んだ分子編集データセットである MolEdit-Instruct を構築した。
- 参考スコア(独自算出の注目度): 4.430115182041077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular editing aims to modify a given molecule to optimize desired chemical properties while preserving structural similarity. However, current approaches typically rely on string-based or continuous representations, which fail to adequately capture the discrete, graph-structured nature of molecules, resulting in limited structural fidelity and poor controllability. In this paper, we propose MolEditRL, a molecular editing framework that explicitly integrates structural constraints with precise property optimization. Specifically, MolEditRL consists of two stages: (1) a discrete graph diffusion model pretrained to reconstruct target molecules conditioned on source structures and natural language instructions; (2) an editing-aware reinforcement learning fine-tuning stage that further enhances property alignment and structural preservation by explicitly optimizing editing decisions under graph constraints. For comprehensive evaluation, we construct MolEdit-Instruct, the largest and most property-rich molecular editing dataset, comprising 3 million diverse examples spanning single- and multi-property tasks across 10 chemical attributes. Experimental results demonstrate that MolEditRL significantly outperforms state-of-the-art methods in both property optimization accuracy and structural fidelity, achieving a 74\% improvement in editing success rate while using 98\% fewer parameters.
- Abstract(参考訳): 分子編集は、構造的類似性を保ちながら、所望の化学的特性を最適化するために特定の分子を変更することを目的としている。
しかし、現在のアプローチは典型的には文字列ベースまたは連続表現に依存しており、これは分子の離散的でグラフ構造の性質を適切に捉えることができず、構造的忠実度が制限され、制御性が劣る。
本稿では,構造的制約と正確な特性最適化を明示的に統合する分子編集フレームワークであるMolEditRLを提案する。
具体的には,(1)ソース構造と自然言語命令で条件付けられた対象分子を再構成するために事前訓練された離散グラフ拡散モデル,(2)グラフ制約下での編集決定を明示的に最適化し,プロパティアライメントと構造保存をさらに強化する編集-認識強化学習微調整段階の2段階から構成される。
包括的評価のために,10個の化学属性にまたがる単一・多目的タスクにまたがる300万の多種多様な例からなる,最大かつ最も特性に富んだ分子編集データセットであるMolEdit-Instructを構築した。
実験結果から,MorEditRLは特性最適化精度と構造忠実度の両方において最先端の手法よりも優れており,98倍のパラメータを用いて,編集成功率を74倍に向上させることができた。
関連論文リスト
- Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - XMOL: Explainable Multi-property Optimization of Molecules [2.320539066224081]
複数の分子特性を同時に最適化するために,分子のマルチプロパティ最適化(XMOL)を提案する。
我々のアプローチは、最先端の幾何学的拡散モデルに基づいており、それらをマルチプロパティ最適化に拡張している。
最適化プロセス全体を通して解釈的および説明可能な技術を統合する。
論文 参考訳(メタデータ) (2024-09-12T06:35:04Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。
我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。
提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文 参考訳(メタデータ) (2020-11-14T05:42:15Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。