論文の概要: All-atom inverse protein folding through discrete flow matching
- arxiv url: http://arxiv.org/abs/2507.14156v1
- Date: Fri, 04 Jul 2025 11:57:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-27 08:26:15.926073
- Title: All-atom inverse protein folding through discrete flow matching
- Title(参考訳): 離散フローマッチングによる全原子逆タンパク質の折り畳み
- Authors: Kai Yi, Kiarash Jamali, Sjors H. W. Scheres,
- Abstract要約: 本稿では, タンパク質配列を設計するための生成モデルとしてADFLIP(All-atom Discrete FLow matching Inverse Protein folding)を提案する。
本モデルは, 単一構造および多構造逆折り畳みタスクにおける最先端性能を実現し, 全原子タンパク質設計に優れた可能性を示す。
- 参考スコア(独自算出の注目度): 11.47007092758602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent breakthrough of AlphaFold3 in modeling complex biomolecular interactions, including those between proteins and ligands, nucleotides, or metal ions, creates new opportunities for protein design. In so-called inverse protein folding, the objective is to find a sequence of amino acids that adopts a target protein structure. Many inverse folding methods struggle to predict sequences for complexes that contain non-protein components, and perform poorly with complexes that adopt multiple structural states. To address these challenges, we present ADFLIP (All-atom Discrete FLow matching Inverse Protein folding), a generative model based on discrete flow-matching for designing protein sequences conditioned on all-atom structural contexts. ADFLIP progressively incorporates predicted amino acid side chains as structural context during sequence generation and enables the design of dynamic protein complexes through ensemble sampling across multiple structural states. Furthermore, ADFLIP implements training-free classifier guidance sampling, which allows the incorporation of arbitrary pre-trained models to optimise the designed sequence for desired protein properties. We evaluated the performance of ADFLIP on protein complexes with small-molecule ligands, nucleotides, or metal ions, including dynamic complexes for which structure ensembles were determined by nuclear magnetic resonance (NMR). Our model achieves state-of-the-art performance in single-structure and multi-structure inverse folding tasks, demonstrating excellent potential for all-atom protein design. The code is available at https://github.com/ykiiiiii/ADFLIP.
- Abstract(参考訳): タンパク質とリガンド、ヌクレオチド、金属イオンなどの複雑な生体分子相互作用をモデル化するAlphaFold3の最近の進歩は、タンパク質設計の新しい機会を生み出している。
いわゆる逆タンパク質折り畳みでは、標的タンパク質構造を採用するアミノ酸の配列を見つけることが目的である。
多くの逆折り畳み法は、非タンパク質成分を含む錯体の配列を予測するのに苦労し、複数の構造状態を持つ錯体では性能が良くない。
これらの課題に対処するため,ADFLIP (All-atom Discrete FLow matching Inverse Protein folding) を提案する。
ADFLIPは、予測されたアミノ酸側鎖を配列生成中の構造的文脈として徐々に組み込み、複数の構造状態にわたるアンサンブルサンプリングを通して動的タンパク質複合体の設計を可能にする。
さらに、ADFLIPは、任意の事前学習モデルの組み込みにより、設計した配列を所望のタンパク質の性質に最適化する、トレーニング不要な分類器誘導サンプリングを実装している。
核磁気共鳴(NMR)により構造アンサンブルが決定される動的複合体を含む,小分子リガンド,ヌクレオチド,金属イオンを含むタンパク質複合体におけるADFLIPの性能を評価した。
本モデルは, 単一構造および多構造逆折り畳みタスクにおける最先端性能を実現し, 全原子タンパク質設計に優れた可能性を示す。
コードはhttps://github.com/ykiiiiii/ADFLIPで入手できる。
関連論文リスト
- La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching [36.32031583420137]
本稿では,新しい部分潜伏タンパク質表現に基づく原子性タンパク質設計のためのLa-Proteinaを紹介する。
La-Proteinaは、全原子共設計可能性、多様性、構造的妥当性を含む、複数の世代ベンチマークで最先端のパフォーマンスを達成する。
La-Proteinaは800個の残基の共設計可能なタンパク質を生成できる。
論文 参考訳(メタデータ) (2025-07-13T03:01:50Z) - A Model-Centric Review of Deep Learning for Protein Design [0.0]
ディープラーニングはタンパク質設計を変換し、正確な構造予測、シーケンス最適化、de novoタンパク質生成を可能にした。
ProtGPT2、ProteinMPNN、RFdiffusionなどの生成モデルは、自然進化に基づく制限を超えてシーケンスとバックボーンの設計を可能にした。
最近では、ESM3を含む共同シーケンス構造共設計モデルが両方のモダリティを統一されたフレームワークに統合し、設計性が向上した。
論文 参考訳(メタデータ) (2025-02-26T14:31:21Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。
我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。
我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文 参考訳(メタデータ) (2024-05-30T17:53:50Z) - FFF: Fragments-Guided Flexible Fitting for Building Complete Protein
Structures [10.682516227941592]
タンパク質構造予測とタンパク質構造認識を柔軟に組み合わせた新しいFFF法を提案する。
まず、入力された3次元Cryo-EMマップから様々な構造的特徴を捉えるために、マルチレベル認識ネットワークを使用する。
次に、これらの特徴に基づいて擬似ペプチドベクターとタンパク質配列アライメント法を用いてタンパク質構造断片を生成する。
論文 参考訳(メタデータ) (2023-08-07T15:10:21Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - Protein Sequence and Structure Co-Design with Equivariant Translation [19.816174223173494]
既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。
本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。
我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。
全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
論文 参考訳(メタデータ) (2022-10-17T06:00:12Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。