論文の概要: Generative Pseudo-Force Fields for Molecular Generation
- arxiv url: http://arxiv.org/abs/2605.19050v1
- Date: Mon, 18 May 2026 19:14:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.958812
- Title: Generative Pseudo-Force Fields for Molecular Generation
- Title(参考訳): 分子生成のための擬似力場
- Authors: Stefaan Simon Pierre Hessmann, Khaled Kahouli, Stefan Gugler, Michael Plainer, Frank Noé, Klaus-Robert Müller, Niklas Wolf Andreas Gebauer,
- Abstract要約: 本稿では,2次擬ポテンシャルエネルギー表面上でMLFFをトレーニングすることにより,パラダイムを橋渡しする生成擬力場(GPFF)を提案する。
GPFFは分散爆発DMの時間-ステップに依存しない変種を構成する。
QM9では、GPFFは256個の神経機能評価(NFE)で100%、わずか6個のNFEで50%以上有効であり、全試料の拡散ベースラインよりも優れていた。
- 参考スコア(独自算出の注目度): 15.599051502026242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating stable molecular conformations typically forces a tradeoff between the physical realism of energy-based relaxation and the sampling efficiency of data-driven generative models. While machine learning force fields (MLFFs) can sample stable conformations by relaxing molecular geometries according to physical forces, they require costly ab-initio training data. Conversely, diffusion models (DMs) learn from equilibrium data alone but are dependent on noise schedules and time-step conditioning. In this work, we propose generative pseudo-force fields (GPFFs) to bridge these paradigms by training an MLFF on a quadratic pseudo-potential energy surface relative to reference equilibrium structures. Because no ab-initio calculations are required for the perturbed geometries, non-equilibrium training data can be generated on the fly by perturbing the equilibria with Gaussian noise. We show that GPFFs constitute a time-step-agnostic variant of variance exploding DMs: the score comes from the predicted pseudo-forces but because force magnitudes implicitly encode the noise level, no time-step conditioning is needed. Our GPFF can hence be used as a drop-in replacement in standard diffusion sampling (ancestral, Heun) but also facilitates more efficient, adaptive variants and an MLFF inspired direct denoising scheme. Our proposed sampling algorithms support arbitrary structural priors and geometric constraints. On QM9, GPFF has 100 % validity at 256 neural function evaluations (NFE) and over 50 % at just 6 NFE, outperforming diffusion baselines across all samplers. Combined with custom priors, we showcase the fast and accurate generation process of our method in a molecular editor for a drug design setting, where a molecule is generated in real time.
- Abstract(参考訳): 安定な分子配座の生成は、通常、エネルギーベースの緩和の物理的リアリズムとデータ駆動生成モデルのサンプリング効率の間のトレードオフを強いる。
機械学習力場(MLFF)は、物理力に応じて分子のジオメトリーを緩和することで安定したコンフォメーションをサンプリングすることができるが、それらは高価なアブ・イニシアト訓練データを必要とする。
逆に拡散モデル(DM)は平衡データのみから学習するが、ノイズスケジュールや時間ステップ条件に依存する。
本研究では,2次擬ポテンシャルエネルギー面上のMLFFを基準平衡構造に対してトレーニングすることにより,これらのパラダイムを橋渡しする生成擬力場(GPFF)を提案する。
摂動ジオメトリーにはab-initio計算は必要ないため、平衡をガウス雑音で摂動することで非平衡トレーニングデータを生成することができる。
GPFFが分散爆発DMの時間-ステップに依存しない変種であることを示し、そのスコアは予測された擬似力から生じるが、力の大きさが暗黙的にノイズレベルを符号化するので、時間-ステップ条件付けは不要である。
したがって、GPFFは標準拡散サンプリング(ancestral, Heun)のドロップイン置換として使用できるが、より効率的で適応的な変種やMLFFにインスパイアされた直接復調スキームも容易である。
提案するサンプリングアルゴリズムは,任意の構造的制約と幾何的制約をサポートする。
QM9では、GPFFは256個の神経機能評価(NFE)で100%、わずか6個のNFEで50%以上有効であり、全試料の拡散ベースラインよりも優れていた。
本稿では, 分子がリアルタイムで生成される薬物設計のための分子編集装置において, 従来の手法と組み合わせて, 迅速かつ正確な生成過程を示す。
関連論文リスト
- EFF-Grasp: Energy-Field Flow Matching for Physics-Aware Dexterous Grasp Generation [54.09734511705173]
EFF-Graspは、物理を意識したデクサラスグリップ生成のためのフローマッチング合成ベースのフレームワークである。
我々は、スムーズな確率フローによる効率的な安定な生成を可能にする決定論的常微分方程式(ODE)プロセスとして、グリップを再構成する。
EFF-Graspは、拡散ベースラインよりもサンプリングステップを著しく少なくしながら、把握品質と物理的実現性において優れた性能を実現する。
論文 参考訳(メタデータ) (2026-03-17T06:11:56Z) - Physics Aware Neural Networks: Denoising for Magnetic Navigation [3.624059602945058]
空中システムは、地磁気データを抽出する上で重要な課題に直面している。
本研究では, 分散自由ベクトル場とE(3)等分散という, 物理学に基づく2つの制約に基づく枠組みを提案する。
実験により、これらの制約を埋め込むことで予測精度と物理的妥当性が大幅に向上し、古典的なディープラーニングアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2026-02-14T09:23:57Z) - Is Flow Matching Just Trajectory Replay for Sequential Data? [46.770624059457724]
時系列生成には、フローマッチング(FM)がますます使われている。
一般的な力学構造を学ぶのか、それとも単に効果的な「軌道再生」を行うのかはよく分かっていない。
インプリッドサンプリングは、非パラメトリックなメモリ拡張型連続時間力学系を構成するODEであることを示す。
論文 参考訳(メタデータ) (2026-02-09T06:48:45Z) - Elign: Equivariant Diffusion Model Alignment from Foundational Machine Learning Force Fields [7.740456623132954]
両コストを償却するポストトレーニングフレームワークであるElignを紹介します。
我々は、高価なDFT評価を、より高速で事前訓練された基礎学習力場に置き換える。
実験により、エリーンは安定性を改善しつつ、より低い金標準のDFTエネルギーと力でコンフォメーションを生成することが示された。
論文 参考訳(メタデータ) (2026-01-29T17:00:09Z) - Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Self-Refining Training for Amortized Density Functional Theory [5.5541132320126945]
そこで本稿では,自己修復学習戦略を導入することにより,大規模な事前コンパイルデータセットに対するアモータイズDFTソルバの依存性を低減する手法を提案する。
本手法は, 生成試料と基底状態エネルギーで定義される対象ボルツマン分布との差分を測定するKL偏差の変動上界の最小化として導出する。
論文 参考訳(メタデータ) (2025-06-02T00:32:32Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。