Fugu-MT 論文翻訳(概要): Protein Sequence and Structure Co-Design with Equivariant Translation

論文の概要: Protein Sequence and Structure Co-Design with Equivariant Translation

arxiv url: http://arxiv.org/abs/2210.08761v1
Date: Mon, 17 Oct 2022 06:00:12 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-18 21:51:58.803241
Title: Protein Sequence and Structure Co-Design with Equivariant Translation
Title（参考訳）: 等価翻訳を伴うタンパク質の配列と構造共設計
Authors: Chence Shi, Chuanrui Wang, Jiarui Lu, Bozitao Zhong, Jian Tang
Abstract要約: 既存のアプローチは自己回帰モデルまたは拡散モデルを用いてタンパク質配列と構造の両方を生成する。本稿では,タンパク質配列と構造共設計が可能な新しいアプローチを提案する。我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法を意識したエンコーダで構成されている。全てのタンパク質アミノ酸は翻訳工程で1ショットずつ更新され、推論プロセスが大幅に加速される。
参考スコア（独自算出の注目度）: 19.816174223173494
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Proteins are macromolecules that perform essential functions in all living organisms. Designing novel proteins with specific structures and desired functions has been a long-standing challenge in the field of bioengineering. Existing approaches generate both protein sequence and structure using either autoregressive models or diffusion models, both of which suffer from high inference costs. In this paper, we propose a new approach capable of protein sequence and structure co-design, which iteratively translates both protein sequence and structure into the desired state from random initialization, based on context features given a priori. Our model consists of a trigonometry-aware encoder that reasons geometrical constraints and interactions from context features, and a roto-translation equivariant decoder that translates protein sequence and structure interdependently. Notably, all protein amino acids are updated in one shot in each translation step, which significantly accelerates the inference process. Experimental results across multiple tasks show that our model outperforms previous state-of-the-art baselines by a large margin, and is able to design proteins of high fidelity as regards both sequence and structure, with running time orders of magnitude less than sampling-based methods.
Abstract（参考訳）: タンパク質はすべての生物に必須の機能を持つ高分子である。特定の構造と所望の機能を持つ新規タンパク質の設計は、バイオエンジニアリングの分野で長年の課題であった。既存のアプローチは、自己回帰モデルまたは拡散モデルを用いて、タンパク質配列と構造の両方を生成する。本稿では,タンパク質配列と構造をランダム初期化から所望の状態へと反復的に翻訳する,タンパク質配列と構造共設計が可能な新しい手法を提案する。我々のモデルは、幾何学的制約と文脈特徴からの相互作用を推論する三角法対応エンコーダと、タンパク質配列と構造を相互に翻訳するロト翻訳同変デコーダからなる。特に、すべてのタンパク質アミノ酸は翻訳ステップごとに1ショットで更新され、推論プロセスが大幅に加速される。複数のタスクにまたがる実験結果から,我々のモデルは従来の最先端のベースラインを大きなマージンで上回り,配列と構造の両方について高い忠実度を持つタンパク質を設計できることがわかった。

関連論文リスト

Swarms of Large Language Model Agents for Protein Sequence Design with Experimental Validation [0.9332987715848714]
大規模言語モデル(LLM)エージェントは並列に動作し、それぞれ特定の残基位置に割り当てられる。この位置的、非集中的な調整は、多様で明確に定義されたシーケンスの創発的設計を可能にする。提案手法は,数時間以内に効率よく客観的な設計を実現し,微調整や特殊訓練を行なわずに完全に動作させる。
論文参考訳（メタデータ） (2025-11-27T10:42:52Z)
ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文参考訳（メタデータ） (2025-10-12T14:30:32Z)
Let Physics Guide Your Protein Flows: Topology-aware Unfolding and Generation [42.116704617358636]
拡散に基づく生成モデルはタンパク質の設計に革命をもたらし、新しいタンパク質の創出を可能にした。タンパク質を二次構造に展開する物理的動機付けのない非線形ノイズ発生過程を古典物理学に基礎として導入する。次に、このプロセスとSE(3)上のフローマッチングパラダイムを統合し、高い忠実度を持つタンパク質のバックボーンの不変分布をモデル化する。
論文参考訳（メタデータ） (2025-09-29T18:31:22Z)
Demystify Protein Generation with Hierarchical Conditional Diffusion Models [17.174551222714722]
本稿では,特定の機能によって誘導される効率的なエンド・ツー・エンドタンパク質設計のための新しい条件付き拡散モデルを提案する。異なるレベルの表現を同時に生成することにより、我々のフレームワークは、異なるレベルの階層関係を効果的にモデル化することができる。また,生成したタンパク質の品質を評価するため,新しい信頼性評価指標であるProtein-MMDを提案する。
論文参考訳（メタデータ） (2025-07-24T17:34:02Z)
La-Proteina: Atomistic Protein Generation via Partially Latent Flow Matching [36.32031583420137]
本稿では,新しい部分潜伏タンパク質表現に基づく原子性タンパク質設計のためのLa-Proteinaを紹介する。 La-Proteinaは、全原子共設計可能性、多様性、構造的妥当性を含む、複数の世代ベンチマークで最先端のパフォーマンスを達成する。 La-Proteinaは800個の残基の共設計可能なタンパク質を生成できる。
論文参考訳（メタデータ） (2025-07-13T03:01:50Z)
Multi-Scale Representation Learning for Protein Fitness Prediction [31.735234482320283]
これまでの手法は主に、巨大でラベルなしのタンパク質配列や構造データセットに基づいて訓練された自己教師型モデルに依存してきた。本稿では,タンパク質の機能を統合する新しいマルチモーダル表現学習フレームワークであるSequence-Structure-Surface Fitness (S3F)モデルを紹介する。提案手法は,タンパク質言語モデルからの配列表現と,タンパク質のバックボーンと詳細な表面トポロジーをコードするGeometric Vector Perceptronネットワークを組み合わせる。
論文参考訳（メタデータ） (2024-12-02T04:28:10Z)
ProteinWeaver: A Divide-and-Assembly Approach for Protein Backbone Design [61.19456204667385]
本稿では,タンパク質のバックボーン設計のための2段階フレームワークであるProteinWeaverを紹介する。プロテインウィーバーは、多用途ドメインアセンブリを通じて高品質で新規なタンパク質のバックボーンを生成する。分割組立パラダイムを導入することにより、タンパク質工学を進歩させ、機能的タンパク質設計のための新たな道を開く。
論文参考訳（メタデータ） (2024-11-08T08:10:49Z)
Sequence-Augmented SE(3)-Flow Matching For Conditional Protein Backbone Generation [55.93511121486321]
タンパク質構造生成のための新しいシーケンス条件付きフローマッチングモデルFoldFlow-2を紹介する。我々は、以前の作業のPDBデータセットよりも桁違いに大きい新しいデータセットでFoldFlow-2を大規模にトレーニングします。我々はFoldFlow-2が従来のタンパク質構造に基づく生成モデルよりも優れていることを実証的に観察した。
論文参考訳（メタデータ） (2024-05-30T17:53:50Z)
Diffusion on language model embeddings for protein sequence generation [0.5442686600296733]
連続拡散を利用したアミノ酸配列生成モデルであるDiMAを導入する。優れたパフォーマンスをもたらす設計選択の影響を定量的に説明します。我々のアプローチは、タンパク質空間の構造的および機能的多様性を正確に反映する、新規で多様なタンパク質配列を一貫して生成する。
論文参考訳（メタデータ） (2024-03-06T14:15:20Z)
FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.19308144551836]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文参考訳（メタデータ） (2024-02-04T12:18:51Z)
Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。 pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文参考訳（メタデータ） (2023-02-03T10:49:52Z)
Generating Novel, Designable, and Diverse Protein Structures by Equivariantly Diffusing Oriented Residue Clouds [0.0]
構造に基づくタンパク質設計は、設計可能で、新規で多様な構造を見つけることを目的としている。生成モデルは、複雑なデータの低次元構造を暗黙的に学習することで、魅力的な代替手段を提供する。我々は,3次元空間における配向参照フレームの雲を用いて離散時間拡散を行うタンパク質構造の生成モデルであるGenieを開発する。
論文参考訳（メタデータ） (2023-01-29T16:44:19Z)
State-specific protein-ligand complex structure prediction with a multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文参考訳（メタデータ） (2022-09-30T01:46:38Z)
Protein Structure and Sequence Generation with Equivariant Denoising Diffusion Probabilistic Models [3.5450828190071646]
バイオエンジニアリングにおける重要な課題は、特定の3D構造と標的機能を可能にする化学的性質を持つタンパク質を設計することである。タンパク質の構造と配列の両方の生成モデルを導入し、従来の分子生成モデルよりもはるかに大きなスケールで操作できる。
論文参考訳（メタデータ） (2022-05-26T16:10:09Z)
Learning Geometrically Disentangled Representations of Protein Folding Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文参考訳（メタデータ） (2022-05-20T19:38:00Z)
BERTology Meets Biology: Interpreting Attention in Protein Language Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文参考訳（メタデータ） (2020-06-26T21:50:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。