論文の概要: Guiding Diffusion Models with Reinforcement Learning for Stable Molecule Generation
- arxiv url: http://arxiv.org/abs/2508.16521v1
- Date: Fri, 22 Aug 2025 16:44:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.459979
- Title: Guiding Diffusion Models with Reinforcement Learning for Stable Molecule Generation
- Title(参考訳): 安定分子生成のための強化学習を用いた誘導拡散モデル
- Authors: Zhijian Zhou, Junyi An, Zongkai Liu, Yunfei Shi, Xuan Zhang, Fenglei Cao, Chao Qu, Yuan Qi,
- Abstract要約: 物理フィードバックを用いた強化学習(Reinforcement Learning with Physical Feedback, RLPF)は, 拡散政策最適化を3次元分子生成に拡張する新しいフレームワークである。
RLPFは、力場評価から得られる報酬関数を導入し、エネルギー的に安定で物理的に意味のある構造への生成を導く。
QM9およびGEOM-drugデータセットの実験により、RLPFは既存の方法と比較して分子安定性を著しく改善することが示された。
- 参考スコア(独自算出の注目度): 16.01877423456416
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generating physically realistic 3D molecular structures remains a core challenge in molecular generative modeling. While diffusion models equipped with equivariant neural networks have made progress in capturing molecular geometries, they often struggle to produce equilibrium structures that adhere to physical principles such as force field consistency. To bridge this gap, we propose Reinforcement Learning with Physical Feedback (RLPF), a novel framework that extends Denoising Diffusion Policy Optimization to 3D molecular generation. RLPF formulates the task as a Markov decision process and applies proximal policy optimization to fine-tune equivariant diffusion models. Crucially, RLPF introduces reward functions derived from force-field evaluations, providing direct physical feedback to guide the generation toward energetically stable and physically meaningful structures. Experiments on the QM9 and GEOM-drug datasets demonstrate that RLPF significantly improves molecular stability compared to existing methods. These results highlight the value of incorporating physics-based feedback into generative modeling. The code is available at: https://github.com/ZhijianZhou/RLPF/tree/verl_diffusion.
- Abstract(参考訳): 物理的に現実的な3次元分子構造の生成は、分子生成モデリングにおける中核的な課題である。
等変型ニューラルネットワークを備えた拡散モデルでは、分子のジオメトリーの捕捉が進んでいるが、力場整合性などの物理原理に従う平衡構造の生成に苦慮することが多い。
このギャップを埋めるために,3次元分子生成に拡散政策最適化を拡張する新しいフレームワークであるReinforcement Learning with Physical Feedback (RLPF)を提案する。
RLPFは、タスクをマルコフ決定プロセスとして定式化し、微調整等変拡散モデルに近似ポリシー最適化を適用する。
重要な点として、RLPFは力場評価から得られる報酬関数を導入し、エネルギー的に安定し、物理的に意味のある構造に向けて生成を導く直接的な物理的フィードバックを提供する。
QM9およびGEOM-drugデータセットの実験により、RLPFは既存の方法と比較して分子安定性を著しく改善することが示された。
これらの結果は、生成モデルに物理に基づくフィードバックを組み込むことの価値を強調している。
コードはhttps://github.com/ZhijianZhou/RLPF/tree/verl_diffusionで入手できる。
関連論文リスト
- FlowMol3: Flow Matching for 3D De Novo Small-Molecule Generation [0.0]
FlowMol3はオープンソースのマルチモーダルフローマッチングモデルで、全原子、小分子生成のための最先端技術である。
本研究は,拡散型および流動型分子生成モデルの安定性と品質を向上させるための,単純かつ伝達可能な戦略を強調した。
論文 参考訳(メタデータ) (2025-08-18T05:13:27Z) - Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design [53.93023688824764]
生体分子設計における報酬誘導生成のための微調整拡散モデルの問題に対処する。
本稿では,拡散モデルによる任意の報酬関数の最適化を可能にする,反復蒸留に基づく微調整フレームワークを提案する。
KLの発散最小化と相まって,既存のRL法と比較してトレーニングの安定性とサンプル効率を向上させる。
論文 参考訳(メタデータ) (2025-07-01T05:55:28Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Diffusion Models in $\textit{De Novo}$ Drug Design [0.0]
拡散モデルは、特に3次元分子構造の文脈において、分子生成の強力なツールとして登場した。
本稿では,3次元分子生成に適した拡散モデルの技術的実装について述べる。
論文 参考訳(メタデータ) (2024-06-07T06:34:13Z) - AUTODIFF: Autoregressive Diffusion Modeling for Structure-based Drug Design [16.946648071157618]
構造に基づく薬物設計のための拡散型フラグメントワイド自己回帰生成モデル(SBDD)を提案する。
我々はまず,分子の局所構造の整合性を保持する共形モチーフという新しい分子組立戦略を設計する。
次に、タンパク質-リガンド複合体とSE(3)等価な畳み込みネットワークとの相互作用をエンコードし、拡散モデルを用いて分子モチーフ・バイ・モチーフを生成する。
論文 参考訳(メタデータ) (2024-04-02T14:44:02Z) - Molecule Design by Latent Space Energy-Based Modeling and Gradual
Distribution Shifting [53.44684898432997]
化学的・生物学的性質が望ましい分子の生成は、薬物発見にとって重要である。
本稿では,分子の結合分布とその特性を捉える確率的生成モデルを提案する。
本手法は種々の分子設計タスクにおいて非常に強力な性能を発揮する。
論文 参考訳(メタデータ) (2023-06-09T03:04:21Z) - Geometric Latent Diffusion Models for 3D Molecule Generation [172.15028281732737]
生成モデル、特に拡散モデル(DM)は、特徴豊富な測地を生成する上で有望な結果を得た。
我々はGeoLDM(Geometric Latent Diffusion Models)と呼ばれる新しい3次元分子生成法を提案する。
論文 参考訳(メタデータ) (2023-05-02T01:07:22Z) - MUDiff: Unified Diffusion for Complete Molecule Generation [104.7021929437504]
本稿では,原子の特徴,2次元離散分子構造,および3次元連続分子座標を含む分子の包括的表現を生成する新しいモデルを提案する。
拡散過程を認知するための新しいグラフトランスフォーマーアーキテクチャを提案する。
我々のモデルは、安定で多様な分子を設計するための有望なアプローチであり、分子モデリングの幅広いタスクに適用できる。
論文 参考訳(メタデータ) (2023-04-28T04:25:57Z) - Geometry-Complete Diffusion for 3D Molecule Generation and Optimization [3.8366697175402225]
3次元分子生成のための幾何-完全拡散モデル(GCDM)を導入する。
GCDMは、既存の3次元分子拡散モデルよりも条件および非条件設定間で大きなマージンで優れている。
また、GCDMの幾何学的特徴は、既存の3次元分子の幾何学的および化学組成を一貫して最適化するために再利用可能であることも示している。
論文 参考訳(メタデータ) (2023-02-08T20:01:51Z) - Learning Neural Generative Dynamics for Molecular Conformation
Generation [89.03173504444415]
分子グラフから分子コンフォメーション(つまり3d構造)を生成する方法を検討した。
分子グラフから有効かつ多様なコンフォーメーションを生成する新しい確率論的枠組みを提案する。
論文 参考訳(メタデータ) (2021-02-20T03:17:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。