論文の概要: Amortized Molecular Optimization via Group Relative Policy Optimization
- arxiv url: http://arxiv.org/abs/2602.12162v1
- Date: Thu, 12 Feb 2026 16:43:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.945698
- Title: Amortized Molecular Optimization via Group Relative Policy Optimization
- Title(参考訳): グループ相対的政策最適化による記憶分子最適化
- Authors: Muhammad bin Javaid, Hasham Hussain, Ashima Khanna, Berke Kisin, Jonathan Pirnay, Alexander Mitsos, Dominik G. Grimm, Martin Grohe,
- Abstract要約: GRXFormを導入し、逐次原子結合付加により分子を最適化する事前学習グラフトランスモデルを適用した。
GRXFormは、推論時のオラクルコールや精細化なしに、分布外の分子足場に一般化する。
- 参考スコア(独自算出の注目度): 38.75198089892667
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular design encompasses tasks ranging from de-novo design to structural alteration of given molecules or fragments. For the latter, state-of-the-art methods predominantly function as "Instance Optimizers'', expending significant compute restarting the search for every input structure. While model-based approaches theoretically offer amortized efficiency by learning a policy transferable to unseen structures, existing methods struggle to generalize. We identify a key failure mode: the high variance arising from the heterogeneous difficulty of distinct starting structures. To address this, we introduce GRXForm, adapting a pre-trained Graph Transformer model that optimizes molecules via sequential atom-and-bond additions. We employ Group Relative Policy Optimization (GRPO) for goal-directed fine-tuning to mitigate variance by normalizing rewards relative to the starting structure. Empirically, GRXForm generalizes to out-of-distribution molecular scaffolds without inference-time oracle calls or refinement, achieving scores in multi-objective optimization competitive with leading instance optimizers.
- Abstract(参考訳): 分子設計は、デノボ設計から与えられた分子や断片の構造的変化までを含む。
後者の場合、最先端のメソッドは主に"インスタンスオプティマイザ'として機能し、全ての入力構造の探索を再起動する重要な計算を出力する。
モデルに基づくアプローチは理論的には、目に見えない構造に伝達可能なポリシーを学ぶことによって、償却効率を提供するが、既存の手法は一般化に苦慮している。
我々は、異なる開始構造の不均一な難易度から生じる高分散という、重要な障害モードを同定する。
これを解決するために, GRXFormを導入し, 逐次原子結合付加により分子を最適化するグラフトランスモデルを事前訓練した。
我々は、目標指向の微調整にGRPO(Group Relative Policy Optimization)を用い、開始構造に対する報酬の正規化による分散を緩和する。
実験的に、GRXFormは、推論時オラクル呼び出しや改善なしに、分配外の分子足場に一般化し、主要なインスタンスオプティマイザと競合する多目的最適化においてスコアを得る。
関連論文リスト
- Symplectic Optimization on Gaussian States [0.0]
ボソニックな基底状態問題を解決するためのシンプレクティック最適化フレームワークを提案する。
このフレームワークは、弱い非四面体相互作用の大規模近似処理の基礎を提供する。
論文 参考訳(メタデータ) (2026-01-28T18:31:50Z) - Bayesian Optimization for Molecules Should Be Pareto-Aware [6.877358955271652]
多目的ベイズ最適化(MOBO)は、分子設計におけるトレードオフをナビゲートするための原則的な枠組みを提供する。
我々は、期待改善(EI)を用いた単純な固定重スカラー化ベースラインに対して単純なMOBO戦略をベンチマークする。
以上の結果から, 強い決定論的インスタンス化であっても, 低データ体制下では性能が低下する可能性が示唆された。
論文 参考訳(メタデータ) (2025-07-18T07:12:19Z) - Return of the Latent Space COWBOYS: Re-thinking the use of VAEs for Bayesian Optimisation of Structured Spaces [13.38402522324075]
本稿では、生成モデルとガウス過程(GP)を個別にシュロゲートし、単純だが原理化されたベイズ更新規則を介してそれらを結合する分離されたアプローチを提案する。
我々は, 分子最適化問題における高ポテンシャル候補を制約評価予算下で同定する能力を, 分離した手法により向上することを示した。
論文 参考訳(メタデータ) (2025-07-05T05:53:04Z) - Cliqueformer: Model-Based Optimization with Structured Transformers [102.55764949282906]
大規模なニューラルネットワークは予測タスクに優れるが、タンパク質工学や材料発見といった設計問題への応用には、オフラインモデルベース最適化(MBO)の問題を解決する必要がある。
機能的グラフィカルモデル(FGM)を用いてブラックボックス関数の構造を学習するトランスフォーマーベースのアーキテクチャであるCliqueformerを提案する。
化学および遺伝子設計タスクを含む様々な領域において、Cliqueformerは既存の方法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-17T00:35:47Z) - DecompOpt: Controllable and Decomposed Diffusion Models for Structure-based Molecular Optimization [49.85944390503957]
DecompOptは、制御可能・拡散モデルに基づく構造に基づく分子最適化手法である。
DecompOptは強いde novoベースラインよりも優れた特性を持つ分子を効率よく生成できることを示す。
論文 参考訳(メタデータ) (2024-03-07T02:53:40Z) - Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。
1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。
本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文 参考訳(メタデータ) (2023-01-28T01:50:42Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。