論文の概要: Fine-Tuning Diffusion Models for Molecular Generation via Reinforcement Learning and Fast Sampling
- arxiv url: http://arxiv.org/abs/2606.01220v1
- Date: Sun, 31 May 2026 13:11:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.392472
- Title: Fine-Tuning Diffusion Models for Molecular Generation via Reinforcement Learning and Fast Sampling
- Title(参考訳): 強化学習と高速サンプリングによる分子生成のための微調整拡散モデル
- Authors: Guang Lin, Shikui Tu, Lei Xu,
- Abstract要約: 既存の生成的アプローチは、サンプリング中にコストのかかるポストホック処理に依存したり、トレーニング中に慎重にキュレートされたデータセットを必要とする場合が多い。
構造制約下での拡散型分子生成に適した強化学習ファインチューニングフレームワークであるFTDiffを提案する。
FTDiffは、コストのかかるポストホック最適化や複雑なデータエンジニアリングを必要とせず、従来手法よりも一貫して優れていることを示す。
- 参考スコア(独自算出の注目度): 22.66917124518062
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Generating molecules that simultaneously satisfy drug-like properties and conform to the 3D structure of a target protein is a core challenge in structure-based drug design (SBDD). Existing generative approaches, however, often rely on costly post-hoc processing during Sampling or require carefully curated datasets during training, yet still achieve modest gains. These limitations are especially pronounced in multi-objective settings, where balancing conflicting criteria remains a core challenge. To address these challenges, We propose FTDiff, a reinforcement learning fine-tuning framework tailored for diffusion-based molecular generation under structural constraints. To ensure stable and sample-efficient optimization, FTDiff adopts a group relative policy optimization (GRPO) style strategy. Furthermore, FTDiff builds upon a time-free pretrained diffusion model and incorporates a fast sampling mechanism that reduces the number of denoising steps, significantly accelerating both training and inference while maintaining generation quality. By optimizing a fixed threshold-aware reward, FTDiff effectively guides the model to produce valid, diverse, and high- quality molecules that balance multiple drug design objectives. Extensive experiments on benchmark datasets demonstrate that FTDiff consistently outperforms prior methods, without requiring expensive post-hoc optimization or intricate data engineering.
- Abstract(参考訳): 標的タンパク質の3次元構造を同時に満足する分子の生成は、構造に基づく薬物設計(SBDD)における中核的な課題である。
しかし、既存の生成的アプローチは、サンプリング中にコストのかかるポストホック処理に依存したり、トレーニング中に慎重にキュレートされたデータセットを必要とする場合が多いが、それでも適度な利益は得られない。
これらの制限は、矛盾する基準のバランスが依然として重要な課題である、多目的設定において特に顕著である。
これらの課題に対処するために,構造制約下での拡散型分子生成に適した強化学習微調整フレームワークFTDiffを提案する。
安定かつサンプル効率の最適化を保証するため、FTDiffはグループ相対ポリシー最適化(GRPO)方式を採用する。
さらに、FTDiffは、時間のない事前学習拡散モデルを構築し、高速サンプリング機構を導入し、デノナイジングステップの数を削減し、生成品質を維持しながら、トレーニングと推論の両方を著しく加速する。
固定しきい値認識報酬を最適化することにより、FTDiffは、複数の医薬品設計目標のバランスをとる有効で多種多様で高品質な分子を生成するために、モデルを効果的にガイドする。
ベンチマークデータセットに関する大規模な実験は、FTDiffが高価なポストホック最適化や複雑なデータエンジニアリングを必要とせず、従来手法よりも一貫してパフォーマンスが向上していることを示している。
関連論文リスト
- Diff-ES: Stage-wise Structural Diffusion Pruning via Evolutionary Search [40.67449277026597]
textbfDiff-ESは、textbfEvolutionary textbfSearchを介して、段階的に構造化されたtextbfDiff-usion プルーニングフレームワークである。
筆者らのフレームワークは, 奥行きと幅幅を含む拡散モデルに対して, 既存の構造化プルーニング手法と自然に統合されている。
DiTとSDXLの実験により、Diff-ESは連続的にウォールクロックの高速化を実現し、生成品質の低下を最小限に抑えていることが示された。
論文 参考訳(メタデータ) (2026-03-05T12:18:40Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design [58.8094854658848]
生体分子設計における報酬誘導生成のための微調整拡散モデルの問題に対処する。
本稿では,拡散モデルによる任意の報酬関数の最適化を可能にする,反復蒸留に基づく微調整フレームワークを提案する。
KLの発散最小化と相まって,既存のRL法と比較してトレーニングの安定性とサンプル効率を向上させる。
論文 参考訳(メタデータ) (2025-07-01T05:55:28Z) - DEMO:Diffusion-based Evolutionary Optimization for 3D Multi-Objective Molecular Generation [25.82864719790724]
構造的制約を満足しながら複数の目的特性を最適化することは、3次元分子発見の大きな課題である。
本稿では,事前学習した拡散モデルの生成力を生かした新しい3次元分子多目的進化アルゴリズムを提案する。
本手法は,拡散モデルの前方処理で定義される雑音空間におけるクロスオーバー操作を行い,親の特徴や所望のフラグメントを子孫に融合させる。
論文 参考訳(メタデータ) (2025-05-16T09:32:40Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。