論文の概要: Inference-time optimization for experiment-grounded protein ensemble generation
- arxiv url: http://arxiv.org/abs/2602.24007v2
- Date: Wed, 04 Mar 2026 22:31:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 15:25:24.061857
- Title: Inference-time optimization for experiment-grounded protein ensemble generation
- Title(参考訳): 実験場タンパク質アンサンブル生成のための推論時間最適化
- Authors: Advaith Maddipatla, Anar Rzayev, Marco Pegoraro, Martin Pacesa, Paul Schanda, Ailie Marx, Sanketh Vedula, Alex M. Bronstein,
- Abstract要約: これらの課題を解決するために、一般的な推論時最適化フレームワークを導入する。
まず,係留後の構造を摂動するのではなく,潜時表現を最適化し,アンサンブルの対数類似度を最大化する。
AlphaFold3の構造的先行と力場に基づく先行性を組み合わせることで、実験可能性のバランスを保ちながら、製品分布からサンプルを採取する。
- 参考スコア(独自算出の注目度): 5.793690609818543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein function relies on dynamic conformational ensembles, yet current generative models like AlphaFold3 often fail to produce ensembles that match experimental data. Recent experiment-guided generators attempt to address this by steering the reverse diffusion process. However, these methods are limited by fixed sampling horizons and sensitivity to initialization, often yielding thermodynamically implausible results. We introduce a general inference-time optimization framework to solve these challenges. First, we optimize over latent representations to maximize ensemble log-likelihood, rather than perturbing structures post hoc. This approach eliminates dependence on diffusion length, removes initialization bias, and easily incorporates external constraints. Second, we present novel sampling schemes for drawing Boltzmann-weighted ensembles. By combining structural priors from AlphaFold3 with force-field-based priors, we sample from their product distribution while balancing experimental likelihoods. Our results show that this framework consistently outperforms state-of-the-art guidance, improving diversity, physical energy, and agreement with data in X-ray crystallography and NMR, often fitting the experimental data better than deposited PDB structures. Finally, inference-time optimization experiments maximizing ipTM scores reveal that perturbing AlphaFold3 embeddings can artificially inflate model confidence. This exposes a vulnerability in current design metrics, whose mitigation could offer a pathway to reduce false discovery rates in binder engineering.
- Abstract(参考訳): タンパク質機能は動的コンフォメーションアンサンブルに依存しているが、AlphaFold3のような現在の生成モデルは実験データと一致するアンサンブルを生成できないことが多い。
最近の実験誘導発電機は逆拡散過程を操り、この問題に対処しようと試みている。
しかし、これらの手法は固定されたサンプリング地平線と初期化に対する感度によって制限され、しばしば熱力学的に不可能な結果をもたらす。
これらの課題を解決するために、一般的な推論時最適化フレームワークを導入する。
まず,係留後の構造を摂動するのではなく,潜時表現を最適化し,アンサンブルの対数類似度を最大化する。
このアプローチは拡散長への依存を排除し、初期化バイアスを排除し、外部制約を容易に組み込む。
第二に、ボルツマン重み付きアンサンブルを描画するための新しいサンプリングスキームを提案する。
AlphaFold3の構造的先行と力場に基づく先行性を組み合わせることで、実験可能性のバランスを保ちながら、製品分布からサンプルを採取する。
以上の結果から, このフレームワークは, X線結晶学およびNMRにおけるデータとの整合性, 多様性, 物理エネルギーの向上, およびデータとの整合性など, 常に最先端のガイダンスよりも優れており, しばしば沈着したPDB構造よりも実験データに適合することが示唆された。
最後に、ipTMスコアを最大化する推論時間最適化実験により、AlphaFold3埋め込みの摂動がモデル信頼性を人工的に向上させることを示した。
これにより、現在の設計メトリクスの脆弱性が露呈し、バインダーエンジニアリングにおける誤った発見率を減らすための経路を提供する可能性がある。
関連論文リスト
- Plug-and-Play Diffusion Meets ADMM: Dual-Variable Coupling for Robust Medical Image Reconstruction [45.25461515976432]
画像再構成のための強力なパラダイムとして,DP(Plug-and-Play diffusion prior)フレームワークが登場した。
本稿では, バイアス・ハロシン化トレードオフを解消し, 収束を著しく加速した最先端の勾配を実現するための新しい手法を提案する。
論文 参考訳(メタデータ) (2026-02-26T16:58:43Z) - Robust Inference-Time Steering of Protein Diffusion Models via Embedding Optimization [6.097829741846035]
EmbedOptは、条件埋め込み空間における実験可能性の最適化のために、拡散モデルを操るための推論時アプローチである。
EmbedOptは地図適合タスクにおいて座標に基づく後続サンプリング法よりも優れており、距離制約タスクのパフォーマンスと一致していることを示す。
論文 参考訳(メタデータ) (2026-02-05T04:13:33Z) - On Stability and Robustness of Diffusion Posterior Sampling for Bayesian Inverse Problems [42.76879947185353]
拡散に基づく解法は、生成過程を導くために、BIPにおける観測が想定される可能性に依存する。
このギャップを後部近似誤差を特徴付けることにより橋渡しし,拡散型解法のエンハンスタビリティを実証する。
本稿では, 既存の勾配型後方サンプリング装置と互換性があり, イントロバスト拡散後サンプリング法を提案する。
論文 参考訳(メタデータ) (2026-02-02T12:47:15Z) - Predict-Project-Renoise: Sampling Diffusion Models under Hard Constraints [5.539946449743145]
物理法則や観測整合性などの厳しい制約を世代毎に適用する制約付きサンプリングフレームワークを導入する。
提案手法では,制約条件を満たすサンプルの集合にのみ拡散する制約付き前方過程を定義し,制約付き辺縁分布を誘導する。
本稿では,制約された辺縁領域から,予測と予測を交互に行い,実現可能なセットに投影し,再現性のあるアルゴリズムであるPredict-Project-Renoise (PPR)を提案する。
論文 参考訳(メタデータ) (2026-01-28T20:50:19Z) - Breaking the Bottlenecks: Scalable Diffusion Models for 3D Molecular Generation [0.0]
拡散モデルは分子設計のための強力な生成モデルとして登場した。
彼らの使用は、長いサンプリング軌道、逆過程のばらつき、そして力学の認知における構造的認識の制限によって制限されている。
直接分極拡散モデル(英語版)は、逆MCMC更新を決定論的分極ステップに置き換えることでこれらの非効率性を緩和する。
論文 参考訳(メタデータ) (2026-01-13T20:09:44Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [55.95767828747407]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Elucidating Subspace Perturbation in Zeroth-Order Optimization: Theory and Practice at Scale [33.38543010618118]
Zeroth-order (ZO) 最適化は、勾配ベースのバックプロパゲーション法に代わる有望な代替手段として登場した。
高次元性が主要なボトルネックであることを示し、サブスペースの摂動が勾配ノイズを減らし収束を加速させる方法について説明するために、テキストサブスペースアライメントの概念を導入する。
本稿では,ブロック座標降下法(MeZO-BCD)を用いた効率的なZO法を提案し,各ステップでパラメータのサブセットのみを摂動・更新する。
論文 参考訳(メタデータ) (2025-01-31T12:46:04Z) - Bayesian Experimental Design via Contrastive Diffusions [2.2186678387006435]
実験設計(BOED)は、一連の実験の実行コストを削減する強力なツールである。
コスト効率の良いサンプリング特性を持つプール勾配分布を導入し、新しいEIG式によるEIGコントラスト後部へのトラクタアクセスを提供する。
BOEDフレームワークに生成モデルを組み込むことで、適用範囲を拡大し、非現実的なシナリオでの利用を拡大する。
論文 参考訳(メタデータ) (2024-10-15T17:53:07Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。
提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文 参考訳(メタデータ) (2023-04-10T17:54:38Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - Efficient Semi-Implicit Variational Inference [65.07058307271329]
効率的でスケーラブルな半単純外挿 (SIVI) を提案する。
本手法はSIVIの証拠を低勾配値の厳密な推測にマッピングする。
論文 参考訳(メタデータ) (2021-01-15T11:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。