論文の概要: EPO: Diverse and Realistic Protein Ensemble Generation via Energy Preference Optimization
- arxiv url: http://arxiv.org/abs/2511.10165v1
- Date: Fri, 14 Nov 2025 01:36:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.725407
- Title: EPO: Diverse and Realistic Protein Ensemble Generation via Energy Preference Optimization
- Title(参考訳): EPO:エネルギー選好最適化による多変量リアルタンパク質アンサンブル生成
- Authors: Yuancheng Sun, Yuxuan Ren, Zhaoming Chen, Xu Han, Kang Liu, Qiwei Ye,
- Abstract要約: 本稿では,事前学習したタンパク質アンサンブル生成体をエネルギ対応サンプリング器に変換するオンライン改良であるEnergy Preference Optimization (EPO)を提案する。
テトラペプチド、ATLAS、Fast-Foldingベンチマークでは、EPOは多様な物理的に現実的なアンサンブルを生成することに成功した。
- 参考スコア(独自算出の注目度): 14.859985641146672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate exploration of protein conformational ensembles is essential for uncovering function but remains hard because molecular-dynamics (MD) simulations suffer from high computational costs and energy-barrier trapping. This paper presents Energy Preference Optimization (EPO), an online refinement algorithm that turns a pretrained protein ensemble generator into an energy-aware sampler without extra MD trajectories. Specifically, EPO leverages stochastic differential equation sampling to explore the conformational landscape and incorporates a novel energy-ranking mechanism based on list-wise preference optimization. Crucially, EPO introduces a practical upper bound to efficiently approximate the intractable probability of long sampling trajectories in continuous-time generative models, making it easily adaptable to existing pretrained generators. On Tetrapeptides, ATLAS, and Fast-Folding benchmarks, EPO successfully generates diverse and physically realistic ensembles, establishing a new state-of-the-art in nine evaluation metrics. These results demonstrate that energy-only preference signals can efficiently steer generative models toward thermodynamically consistent conformational ensembles, providing an alternative to long MD simulations and widening the applicability of learned potentials in structural biology and drug discovery.
- Abstract(参考訳): タンパク質コンホメーションアンサンブルの正確な探索は機能を明らかにするのに不可欠であるが、分子力学(MD)シミュレーションは高い計算コストとエネルギーバリアトラップに悩まされているため、依然として困難である。
本稿では,事前学習したタンパク質アンサンブル生成体を,余分なMDトラジェクトリを使わずに,エネルギーを意識したサンプリング装置に変換するオンライン改良アルゴリズムであるEnergy Preference Optimization (EPO)を提案する。
具体的には、確率微分方程式のサンプリングを利用してコンフォメーションランドスケープを探索し、リストワイドの選好最適化に基づく新しいエネルギーレベルメカニズムを取り入れる。
重要なことに、EPOは、連続時間生成モデルにおける長いサンプリング軌跡の抽出可能な確率を効率的に近似する実用的な上限を導入し、既存の事前訓練された発電機に容易に適応できるようにする。
テトラペプチド、ATLAS、Fast-Foldingベンチマークでは、EPOは様々な、物理的に現実的なアンサンブルをうまく生成し、9つの評価基準において新しい最先端の指標を確立した。
これらの結果は、エネルギーのみの選好信号が、熱力学的に一貫したコンフォメーションアンサンブルに対して効率的に生成モデルを操り、長いMDシミュレーションの代替となり、構造生物学や薬物発見における学習電位の適用性を広げることができることを示している。
関連論文リスト
- Divergence Minimization Preference Optimization for Diffusion Model Alignment [66.31417479052774]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。
DMPOは、異なるベースモデルとテストセットで既存のテクニックを一貫して上回り、適合させることができる。
論文 参考訳(メタデータ) (2025-07-10T07:57:30Z) - Iterative Distillation for Reward-Guided Fine-Tuning of Diffusion Models in Biomolecular Design [58.8094854658848]
生体分子設計における報酬誘導生成のための微調整拡散モデルの問題に対処する。
本稿では,拡散モデルによる任意の報酬関数の最適化を可能にする,反復蒸留に基づく微調整フレームワークを提案する。
KLの発散最小化と相まって,既存のRL法と比較してトレーニングの安定性とサンプル効率を向上させる。
論文 参考訳(メタデータ) (2025-07-01T05:55:28Z) - EnerBridge-DPO: Energy-Guided Protein Inverse Folding with Markov Bridges and Direct Preference Optimization [8.642286608437344]
この研究は、低エネルギーで安定なタンパク質配列を直接生成するモデルを開発することで、制限を克服することを目的としている。
本稿では,低エネルギーで高安定性なタンパク質配列を生成することを目的とした,新しい逆フォールディングフレームワークであるEnerBridge-DPOを提案する。
評価の結果,EnerBridge-DPOは,最先端モデルに匹敵する配列回復率を維持しつつ,低エネルギーのタンパク質複合体配列を設計可能であることが示された。
論文 参考訳(メタデータ) (2025-06-11T08:12:26Z) - Aligning Protein Conformation Ensemble Generation with Physical Feedback [29.730515284798397]
エネルギーベースアライメント(EBA、Energy-based Alignment)は、生成モデルと物理モデルからのフィードバックを整合させる手法である。
EBAは、高品質なタンパク質アンサンブルを生成する際に最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-05-30T04:33:39Z) - From expNN to sinNN: automatic generation of sum-of-products models for potential energy surfaces in internal coordinates using neural networks and sparse grid sampling [0.0]
本研究の目的は,積の和形におけるポテンシャルエネルギー面を表す正弦波活性化関数を持つ単一層人工ニューラルネットワークの実現性を評価することである。
sinNNという名前のフィッティングアプローチはHONOのPSSをモデル化し、トランス異性体とシス異性体の両方をカバーする。
sinNN PESモデルは、利用可能な基本振動遷移エネルギーを17cm-1の根平均二乗誤差で再現することができた。
論文 参考訳(メタデータ) (2025-04-30T07:31:32Z) - LightCPPgen: An Explainable Machine Learning Pipeline for Rational Design of Cell Penetrating Peptides [0.32985979395737786]
我々は,機械学習(ML)と最適化アルゴリズムの長所を活かして,CPPのデノボ設計に革新的なアプローチを導入する。
私たちの戦略はLight CPPgenと呼ばれ、LightGBMベースの予測モデルと遺伝的アルゴリズム(GA)を統合しています。
GAソリューションは、元の非貫通ペプチドとの類似性を最大化しつつ、候補配列の透過性スコアを特にターゲットとしている。
論文 参考訳(メタデータ) (2024-05-31T10:57:25Z) - Str2Str: A Score-based Framework for Zero-shot Protein Conformation
Sampling [23.74897713386661]
タンパク質の動的性質は、その生物学的機能や性質を決定するために重要である。
既存の学習ベースのアプローチでは、直接サンプリングを行うが、トレーニングにはターゲット固有のシミュレーションデータに大きく依存する。
ゼロショットコンフォーメーションサンプリングが可能な新しい構造間翻訳フレームワークStr2Strを提案する。
論文 参考訳(メタデータ) (2023-06-05T15:19:06Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。