論文の概要: La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching
- arxiv url: http://arxiv.org/abs/2507.09466v1
- Date: Sun, 13 Jul 2025 03:01:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:23.268109
- Title: La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching
- Title(参考訳): La-Proteina:部分遅延フローマッチングによる原子性タンパク質生成
- Authors: Tomas Geffner, Kieran Didi, Zhonglin Cao, Danny Reidenbach, Zuobai Zhang, Christian Dallago, Emine Kucukbenli, Karsten Kreis, Arash Vahdat,
- Abstract要約: 本稿では,新しい部分潜伏タンパク質表現に基づく原子性タンパク質設計のためのLa-Proteinaを紹介する。
La-Proteinaは、全原子共設計可能性、多様性、構造的妥当性を含む、複数の世代ベンチマークで最先端のパフォーマンスを達成する。
La-Proteinaは800個の残基の共設計可能なタンパク質を生成できる。
- 参考スコア(独自算出の注目度): 36.32031583420137
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, many generative models for de novo protein structure design have emerged. Yet, only few tackle the difficult task of directly generating fully atomistic structures jointly with the underlying amino acid sequence. This is challenging, for instance, because the model must reason over side chains that change in length during generation. We introduce La-Proteina for atomistic protein design based on a novel partially latent protein representation: coarse backbone structure is modeled explicitly, while sequence and atomistic details are captured via per-residue latent variables of fixed dimensionality, thereby effectively side-stepping challenges of explicit side-chain representations. Flow matching in this partially latent space then models the joint distribution over sequences and full-atom structures. La-Proteina achieves state-of-the-art performance on multiple generation benchmarks, including all-atom co-designability, diversity, and structural validity, as confirmed through detailed structural analyses and evaluations. Notably, La-Proteina also surpasses previous models in atomistic motif scaffolding performance, unlocking critical atomistic structure-conditioned protein design tasks. Moreover, La-Proteina is able to generate co-designable proteins of up to 800 residues, a regime where most baselines collapse and fail to produce valid samples, demonstrating La-Proteina's scalability and robustness.
- Abstract(参考訳): 近年、デノボタンパク質構造設計のための多くの生成モデルが出現している。
しかし、基盤となるアミノ酸配列と結合して完全な原子構造を直接生成する難しい課題に取り組むのは、ごくわずかである。
例えば、モデルが世代毎に変化するサイドチェーンを推論しなければならないため、これは難しい問題です。
粗いバックボーン構造は明示的にモデル化され、配列と原子の細部は固定次元の残余潜時変数を介してキャプチャされ、これにより、明示的な側鎖表現のサイドステッピングの課題が効果的に解決される。
この部分潜在空間におけるフローマッチングは、配列とフル原子構造の結合分布をモデル化する。
La-Proteinaは、詳細な構造解析と評価を通じて確認されたように、全原子共設計可能性、多様性、構造的妥当性を含む、複数の世代ベンチマークで最先端のパフォーマンスを達成する。
La-Proteinaはまた、原子論的な構造条件のタンパク質設計タスクを解き放ち、原子論的なモチーフの足場性能の以前のモデルを上回っている。
さらに、La-Proteinaは800個の残基の共設計可能なタンパク質を生成することができ、ほとんどの塩基が崩壊し、有効なサンプルの生成に失敗し、La-Proteinaのスケーラビリティと堅牢性を示す。
関連論文リスト
- All-atom inverse protein folding through discrete flow matching [11.47007092758602]
本稿では, タンパク質配列を設計するための生成モデルとしてADFLIP(All-atom Discrete FLow matching Inverse Protein folding)を提案する。
本モデルは, 単一構造および多構造逆折り畳みタスクにおける最先端性能を実現し, 全原子タンパク質設計に優れた可能性を示す。
論文 参考訳(メタデータ) (2025-07-04T11:57:38Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - A Hierarchical Training Paradigm for Antibody Structure-sequence
Co-design [54.30457372514873]
抗体配列構造共設計のための階層的訓練パラダイム(HTP)を提案する。
HTPは4段階の訓練段階から構成され、それぞれが特定のタンパク質のモダリティに対応する。
実証実験により、HTPは共同設計問題において新しい最先端性能を設定できることが示されている。
論文 参考訳(メタデータ) (2023-10-30T02:39:15Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - Generating Novel, Designable, and Diverse Protein Structures by
Equivariantly Diffusing Oriented Residue Clouds [0.0]
構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。
生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。
我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
論文 参考訳(メタデータ) (2023-01-29T16:44:19Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - Protein structure generation via folding diffusion [16.12124223972183]
本稿では,タンパク質のバックボーン構造を設計する拡散モデルを提案する。
ランダムな展開状態から安定な折り畳み構造へデノイングすることで、新しい構造を生成する。
有用な資源として、タンパク質構造拡散のための最初のオープンソースおよび訓練されたモデルをリリースする。
論文 参考訳(メタデータ) (2022-09-30T17:35:53Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Protein Structure and Sequence Generation with Equivariant Denoising
Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。
タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文 参考訳(メタデータ) (2022-05-26T16:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。