論文の概要: Constrained Flow Optimization via Sequential Fine Tuning for Molecular Design
- arxiv url: http://arxiv.org/abs/2605.30610v1
- Date: Thu, 28 May 2026 22:02:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 20:56:50.259049
- Title: Constrained Flow Optimization via Sequential Fine Tuning for Molecular Design
- Title(参考訳): 分子設計のための逐次微調整による拘束流最適化
- Authors: Sven Gutjahr, Riccardo De Santi, Luca Schaufelberger, Kjell Jorner, Andreas Krause,
- Abstract要約: 制約付き生成最適化(CFO)のためのフレームワークを提案する。
CFOは、元の問題を逐次微調整に還元することで、報酬と制約満足度をバランスさせる。
我々は,制約付き生成最適化と制約付き生成のための収束保証をCFOを介して提供する。
- 参考スコア(独自算出の注目度): 31.59334876687123
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Adapting generative foundation models, in particular diffusion and flow models, to optimize given reward functions (e.g., binding affinity) while satisfying constraints (e.g., molecular synthesizability) is fundamental for their adoption in real-world scientific discovery applications such as molecular design or protein engineering. While recent works have introduced scalable methods for reward-guided fine-tuning of such models via reinforcement learning and control schemes, it remains an open problem how to algorithmically trade-off reward maximization and constraint satisfaction in a reliable and predictable manner. Motivated by this challenge, we first present a rigorous framework for Constrained Generative Optimization, which brings an optimization viewpoint to the introduced adaptation problem and retrieves the relevant task of constrained generation as a sub-case. Then, we introduce Constrained Flow Optimization (CFO), an algorithm that automatically and provably balances reward maximization and constraint satisfaction by reducing the original problem to sequential fine-tuning via established, scalable methods. We provide convergence guarantees for constrained generative optimization and constrained generation via CFO. Ultimately, we present an experimental evaluation of CFO on both synthetic, yet illustrative, settings, and a molecular design task. Across these evaluations, CFO achieves consistent increases in reward while ensuring high constraint satisfaction, showcasing its practical utility for constrained generative optimization.
- Abstract(参考訳): 生成基礎モデル、特に拡散とフローモデルを適用して与えられた報酬関数(例えば、結合親和性)を最適化し、制約を満たす(例えば、分子合成可能性)ことは、分子設計やタンパク質工学のような現実世界の科学的発見アプリケーションに採用するための基礎となる。
近年の研究では、強化学習と制御スキームを通じて、報酬誘導型微調整のためのスケーラブルな手法を導入しているが、信頼性と予測可能な方法で報酬の最大化と制約満足度をアルゴリズム的にトレードオフする方法は、未解決の問題である。
この課題により、まず制約付き生成最適化のための厳密なフレームワークを提示し、導入した適応問題に最適化の視点をもたらし、制約付き生成の関連タスクをサブケースとして検索する。
そこで,提案手法では,従来の問題を,確立されたスケーラブルな手法による逐次微調整に還元することにより,報酬の最大化と制約満足度を自動的かつ確実にバランスさせるアルゴリズムであるConstrained Flow Optimization (CFO)を導入する。
我々は,制約付き生成最適化と制約付き生成のための収束保証をCFOを介して提供する。
最終的に, 合成, 図解的, 設定, 分子設計タスクの両面において, CFOを実験的に評価する。
これらの評価全体で、CFOは高い制約満足度を確保しつつ、一貫した報酬増加を実現し、制約付き生成最適化の実用性を示している。
関連論文リスト
- CVaR-Assisted Custom Penalty Function for Constrained Optimization [3.652509571098291]
制約付き最適化問題は2次非制約二元最適化(QUBO)モデルとして頻繁に修正される。
標準QUBOの定式化は、スラック変数と二次罰則を通じて不等式制約を強制する。
補助スラック変数を除去する制約付きバイナリ最適化のためのスラックフリーペナルティの定式化を提案する。
論文 参考訳(メタデータ) (2026-04-22T01:08:38Z) - Flow Density Control: Generative Optimization Beyond Entropy-Regularized Fine-Tuning [59.11663802446183]
フローおよび拡散生成モデルは、事前情報を保持しながらタスク固有の目的を最適化するために適応することができる。
本研究では,フロー密度制御(FDC)を導入し,複雑な問題をより単純な微調整タスクの特定のシーケンスに還元する。
我々は,近年のミラーフローの理解を活用して,現実的な仮定の下で提案されたスキームの収束保証を導出する。
論文 参考訳(メタデータ) (2025-11-27T17:19:01Z) - TCPO: Thought-Centric Preference Optimization for Effective Embodied Decision-making [75.29820290660065]
本稿では,効果的な具体的意思決定のための思考中心推論最適化(TCPO)を提案する。
モデルの中間的推論プロセスの整合性を強調し、モデル劣化の問題を緩和する。
ALFWorld環境での実験では、平均成功率は26.67%であり、RL4VLMよりも6%向上している。
論文 参考訳(メタデータ) (2025-09-10T11:16:21Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - Pseudo-Bayesian Optimization [7.556071491014536]
ブラックボックス最適化の収束を保証するために最小限の要件を課す公理的枠組みについて検討する。
我々は、単純な局所回帰と、不確実性を定量化するために適切な「ランダム化事前」構造を用いることが、収束を保証するだけでなく、常に最先端のベンチマークよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-10-15T07:55:28Z) - No-Regret Constrained Bayesian Optimization of Noisy and Expensive
Hybrid Models using Differentiable Quantile Function Approximations [0.0]
Constrained Upper Quantile Bound (CUQB) は、制約近似を避けるための概念的に単純で決定論的アプローチである。
CUQBは制約のある場合と制約のない場合の両方において従来のベイズ最適化よりも著しく優れることを示す。
論文 参考訳(メタデータ) (2023-05-05T19:57:36Z) - Conditional Denoising Diffusion for Sequential Recommendation [62.127862728308045]
GAN(Generative Adversarial Networks)とVAE(VAE)の2つの顕著な生成モデル
GANは不安定な最適化に苦しむ一方、VAEは後続の崩壊と過度に平らな世代である。
本稿では,シーケンスエンコーダ,クロスアテンティブデノナイジングデコーダ,ステップワイズディフューザを含む条件付きデノナイジング拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T15:32:59Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Faster Algorithm and Sharper Analysis for Constrained Markov Decision
Process [56.55075925645864]
制約付き意思決定プロセス (CMDP) の問題点について検討し, エージェントは, 複数の制約を条件として, 期待される累積割引報酬を最大化することを目的とする。
新しいユーティリティ・デュアル凸法は、正規化ポリシー、双対正則化、ネステロフの勾配降下双対という3つの要素の新たな統合によって提案される。
これは、凸制約を受ける全ての複雑性最適化に対して、非凸CMDP問題が$mathcal O (1/epsilon)$の低い境界に達する最初の実演である。
論文 参考訳(メタデータ) (2021-10-20T02:57:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。