論文の概要: Scaling Atomistic Protein Binder Design with Generative Pretraining and Test-Time Compute
- arxiv url: http://arxiv.org/abs/2603.27950v1
- Date: Mon, 30 Mar 2026 01:54:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.18991
- Title: Scaling Atomistic Protein Binder Design with Generative Pretraining and Test-Time Compute
- Title(参考訳): 生成前処理とテスト時間計算による原子性タンパク質結合体のスケーリング
- Authors: Kieran Didi, Zuobai Zhang, Guoqing Zhou, Danny Reidenbach, Zhonglin Cao, Sooyoung Cha, Tomas Geffner, Christian Dallago, Jian Tang, Michael M. Bronstein, Martin Steinegger, Emine Kucukbenli, Arash Vahdat, Karsten Kreis,
- Abstract要約: 両パラダイムを統一する新規な完全原子結合体生成法であるProteina-Complexaを提案する。
Proteina-Complexa は計算バインダー設計ベンチマークにおける新しい技術状態を設定する。
また, 界面水素結合最適化, フォールドクラス誘導結合体生成, 小分子ターゲットへの拡張, 酵素設計タスクについても述べる。
- 参考スコア(独自算出の注目度): 64.59043351161004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Protein interaction modeling is central to protein design, which has been transformed by machine learning with applications in drug discovery and beyond. In this landscape, structure-based de novo binder design is cast as either conditional generative modeling or sequence optimization via structure predictors ("hallucination"). We argue that this is a false dichotomy and propose Proteina-Complexa, a novel fully atomistic binder generation method unifying both paradigms. We extend recent flow-based latent protein generation architectures and leverage the domain-domain interactions of monomeric computationally predicted protein structures to construct Teddymer, a new large-scale dataset of synthetic binder-target pairs for pretraining. Combined with high-quality experimental multimers, this enables training a strong base model. We then perform inference-time optimization with this generative prior, unifying the strengths of previously distinct generative and hallucination methods. Proteina-Complexa sets a new state of the art in computational binder design benchmarks: it delivers markedly higher in-silico success rates than existing generative approaches, and our novel test-time optimization strategies greatly outperform previous hallucination methods under normalized compute budgets. We also demonstrate interface hydrogen bond optimization, fold class-guided binder generation, and extensions to small molecule targets and enzyme design tasks, again surpassing prior methods. Code, models and new data will be publicly released.
- Abstract(参考訳): タンパク質相互作用モデリングは、タンパク質設計の中心であり、機械学習によって変換され、薬物発見などにも応用されている。
このランドスケープでは、構造ベースのde novoバインダー設計が、条件付き生成モデルまたは構造予測子("hallucination")によるシーケンス最適化としてキャストされる。
これは誤った二分法であり、両パラダイムを統一する新しい完全な原子結合体生成法であるProteina-Complexaを提案する。
我々は最近のフローベース潜在タンパク質生成アーキテクチャを拡張し、単量体で予測されたタンパク質構造のドメインドメイン間相互作用を活用して、前トレーニングのための合成バインダー-ターゲットペアの大規模データセットであるTeddymerを構築した。
高品質な実験的なマルチマーと組み合わせることで、強力なベースモデルのトレーニングが可能になる。
次に、この生成前の推論時間最適化を行い、前述した生成法と幻覚法の強みを統一する。
proteina-Complexaは計算バインダー設計ベンチマークにおいて、既存の生成手法よりもシリコン内での成功率が大きく向上し、我々の新しいテスト時間最適化戦略は、正規化された計算予算下での従来の幻覚法を大幅に上回っている。
また, 界面水素結合最適化, フォールドクラス誘導結合体生成, 小分子ターゲットおよび酵素設計タスクへの拡張を実証し, 従来手法をまた上回った。
コード、モデル、新しいデータが公開される。
関連論文リスト
- Efficient Protein Optimization via Structure-aware Hamiltonian Dynamics [16.336540408998598]
HADESはハミルトニアン力学を利用したベイズ最適化法であり、構造対応の近似後部から効率的にサンプリングする。
このような連続状態系から離散的なタンパク質配列を提案するために、位置離散化手順を導入する。
実験により,本手法はシリコン内評価において最先端のベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-01-16T05:53:53Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Geometric-informed GFlowNets for Structure-Based Drug Design [4.8722087770556906]
我々は生成フローネットワーク(GFlowNets)を用いて、薬物様分子の広大な空間を探索する。
三角的に一貫した埋め込みを組み込むことにより,GFlowNetフレームワークに新たな改良を加える。
CrossDocked 2020を用いて行った実験では、生成された分子とタンパク質ポケットの結合親和性が改善された。
論文 参考訳(メタデータ) (2024-06-16T09:32:19Z) - Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。
PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。
PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2024-01-26T12:47:54Z) - Progressive Multi-Modality Learning for Inverse Protein Folding [47.095862120116976]
マルチモーダルトランスファー学習を利用するMMDesignと呼ばれる新しいタンパク質設計パラダイムを提案する。
MMDesignは、事前訓練された構造モジュールと事前訓練されたコンテキストモジュールを組み合わせる最初のフレームワークである。
実験結果は、小さなデータセットでのみトレーニングした結果、MMDesignが様々な公開ベンチマークのベースラインを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-12-11T10:59:23Z) - Target-aware Variational Auto-encoders for Ligand Generation with
Multimodal Protein Representation Learning [2.01243755755303]
ターゲット認識型自動エンコーダであるTargetVAEを導入し、任意のタンパク質標的に対する高い結合親和性で生成する。
これは、タンパク質の異なる表現を単一のモデルに統一する最初の試みであり、これは我々がタンパク質マルチモーダルネットワーク(PMN)と呼ぶ。
論文 参考訳(メタデータ) (2023-08-02T12:08:17Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。