論文の概要: Protein generation with embedding learning for motif diversification
- arxiv url: http://arxiv.org/abs/2510.18790v1
- Date: Tue, 21 Oct 2025 16:43:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:13.933006
- Title: Protein generation with embedding learning for motif diversification
- Title(参考訳): 組込み学習によるタンパク質生成によるモチーフの多様化
- Authors: Kevin Michalewicz, Chen Jin, Philip Alexander Teare, Tom Diethe, Mauricio Barahona, Barbara Bravi, Asher Mullokandov,
- Abstract要約: タンパク質設計における根本的な課題は、構造多様性の生成とモチーフの生物学的機能保存のトレードオフである。
本稿では,標的モチーフの構造的特徴とエンコード配列の高次元埋め込みを学習するフレームワークであるPGEL(Protein Generation with Embedding Learning)を紹介する。
PGELは、典型的な設計基準を満たしながら、幾何学的制約を緩めることができ、より多様だが実行可能な構造へと繋がる。
- 参考スコア(独自算出の注目度): 7.130556396588862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A fundamental challenge in protein design is the trade-off between generating structural diversity while preserving motif biological function. Current state-of-the-art methods, such as partial diffusion in RFdiffusion, often fail to resolve this trade-off: small perturbations yield motifs nearly identical to the native structure, whereas larger perturbations violate the geometric constraints necessary for biological function. We introduce Protein Generation with Embedding Learning (PGEL), a general framework that learns high-dimensional embeddings encoding sequence and structural features of a target motif in the representation space of a diffusion model's frozen denoiser, and then enhances motif diversity by introducing controlled perturbations in the embedding space. PGEL is thus able to loosen geometric constraints while satisfying typical design metrics, leading to more diverse yet viable structures. We demonstrate PGEL on three representative cases: a monomer, a protein-protein interface, and a cancer-related transcription factor complex. In all cases, PGEL achieves greater structural diversity, better designability, and improved self-consistency, as compared to partial diffusion. Our results establish PGEL as a general strategy for embedding-driven protein generation allowing for systematic, viable diversification of functional motifs.
- Abstract(参考訳): タンパク質設計における根本的な課題は、モチーフの生物学的機能を保持しながら構造的な多様性を生み出すことの間のトレードオフである。
RF拡散における部分拡散のような現在の最先端の手法は、しばしばこのトレードオフを解決するのに失敗する: 小さな摂動はネイティブ構造とほぼ同じモチーフをもたらすが、大きな摂動は生物学的機能に必要な幾何学的制約に反する。
本稿では,拡散モデルの凍結復調器の表現空間におけるターゲットモチーフの高次元エンコーディング配列と構造的特徴を学習する一般的なフレームワークであるProtein Generation with Embedding Learning (PGEL)を紹介し,埋め込み空間に制御摂動を導入することでモチーフの多様性を高める。
これによりPGELは、典型的な設計基準を満たしつつ、幾何学的制約を緩めることができ、より多様だが実行可能な構造へと繋がる。
PGELは, モノマー, タンパク質界面, 癌関連転写因子複合体の3つの症例で示される。
すべてのケースにおいて、PGELは部分拡散と比較して、より構造的多様性、設計性の向上、自己整合性の向上を実現している。
PGELは, 機能モチーフの系統的, 実行可能な多様化を実現するため, 組込み型タンパク質生成の一般的な戦略として確立されている。
関連論文リスト
- ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - UniGenX: a unified generative foundation model that couples sequence, structure and function to accelerate scientific design across proteins, molecules and materials [62.72989417755985]
自然系における関数の統一生成モデルUniGenXを提案する。
UniGenXはシンボルトークンと数値トークンの混合ストリームとして異種入力を表す。
ドメイン間のファンクション・アウェア・ジェネレーションに対して、最先端または競合的なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Structure Language Models for Protein Conformation Generation [66.42864253026053]
伝統的な物理学に基づくシミュレーション手法は、しばしばサンプリング平衡整合に苦しむ。
深い生成モデルは、より効率的な代替としてタンパク質のコンホメーションを生成することを約束している。
本稿では,効率的なタンパク質コンホメーション生成のための新しいフレームワークとして構造言語モデリングを紹介する。
論文 参考訳(メタデータ) (2024-10-24T03:38:51Z) - Learning the Language of Protein Structure [8.364087723533537]
本稿では,タンパク質構造を離散表現に効果的にトークン化するベクトル量子化オートエンコーダを用いたアプローチを提案する。
学習した表現の有効性を示すために、コードブック上でトレーニングされた単純なGPTモデルにより、新規で多様性があり、設計可能なタンパク質構造を生成することができることを示す。
論文 参考訳(メタデータ) (2024-05-24T16:03:47Z) - Diffusion on language model encodings for protein sequence generation [0.5088559194265662]
DiMAは、タンパク質言語モデル表現で動作する潜伏拡散フレームワークである。
新規で高品質で多様なタンパク質配列を生産する。
これは、タンパク質ファミリーの生成、モチーフの足場と埋め込み、折りたたみ特異的な配列設計を含む条件付き生成タスクをサポートする。
論文 参考訳(メタデータ) (2024-03-06T14:15:20Z) - Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot
Antibody Designer [58.97153056120193]
抗体の特異性は、その相補性決定領域(CDR)によって決定される
従来の研究では、複雑な技術を使ってCDRを生成するが、不適切な幾何学的モデリングに悩まされている。
本稿では,CDRの1次元配列と3次元構造を1ショットで共設計できるテクスタイスシンプルで効果的なモデルを提案する。
論文 参考訳(メタデータ) (2023-04-21T13:24:26Z) - G-VAE, a Geometric Convolutional VAE for ProteinStructure Generation [41.66010308405784]
本稿では,3次元タンパク質構造の比較,変形,生成のための統合幾何学的ニューラルネットワーク手法を提案する。
本手法は, トレーニングデータの構造と異なり, 可塑性構造を生成することができる。
論文 参考訳(メタデータ) (2021-06-22T16:52:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。