論文の概要: JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention
- arxiv url: http://arxiv.org/abs/2504.03278v2
- Date: Mon, 14 Apr 2025 18:11:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-25 07:01:56.472997
- Title: JanusDDG: A Thermodynamics-Compliant Model for Sequence-Based Protein Stability via Two-Fronts Multi-Head Attention
- Title(参考訳): JanusDDG: 2Fronts Multi-Head Attentionによる配列ベースタンパク質の安定性に関する熱力学モデル
- Authors: Guido Barducci, Ivan Rossi, Francesco Codicè, Cesare Rollo, Valeria Repetto, Corrado Pancotti, Virginia Iannibelli, Tiziana Sanavia, Piero Fariselli,
- Abstract要約: 残基の変化がタンパク質の安定性にどのように影響するかを理解することは 機能的なタンパク質を設計するのに重要である。
タンパク質言語モデル(PLM)の最近の進歩は、計算タンパク質分析に革命をもたらした。
我々は PLM 由来の埋め込みと双方向のクロスアテンショントランスフォーマアーキテクチャを利用するディープラーニングフレームワーク JanusDDG を紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Understanding how residue variations affect protein stability is crucial for designing functional proteins and deciphering the molecular mechanisms underlying disease-related mutations. Recent advances in protein language models (PLMs) have revolutionized computational protein analysis, enabling, among other things, more accurate predictions of mutational effects. In this work, we introduce JanusDDG, a deep learning framework that leverages PLM-derived embeddings and a bidirectional cross-attention transformer architecture to predict $\Delta \Delta G$ of single and multiple-residue mutations while simultaneously being constrained to respect fundamental thermodynamic properties, such as antisymmetry and transitivity. Unlike conventional self-attention, JanusDDG computes queries (Q) and values (V) as the difference between wild-type and mutant embeddings, while keys (K) alternate between the two. This cross-interleaved attention mechanism enables the model to capture mutation-induced perturbations while preserving essential contextual information. Experimental results show that JanusDDG achieves state-of-the-art performance in predicting $\Delta \Delta G$ from sequence alone, matching or exceeding the accuracy of structure-based methods for both single and multiple mutations. Code Availability:https://github.com/compbiomed-unito/JanusDDG
- Abstract(参考訳): 残基の変異がタンパク質の安定性にどのように影響するかを理解することは、機能的タンパク質を設計し、疾患関連突然変異の基礎となる分子機構を解読するために重要である。
タンパク質言語モデル(PLM)の最近の進歩は、計算タンパク質分析に革命をもたらし、特に突然変異効果のより正確な予測を可能にした。
本研究では, PLM由来の埋め込みと双方向のクロスアテンション・トランスフォーマー・アーキテクチャを活用するディープラーニングフレームワークであるJanusDDGを紹介し, 反対称性や推移性などの基本的な熱力学特性を考慮しつつ, 単一および複数残基突然変異の$\Delta \Delta G$を予測する。
従来の自己アテンションとは異なり、JanusDDGはクエリ(Q)と値(V)をワイルドタイプとミュータント埋め込みの違いとして計算する。
この相互インターリーブされた注意機構により、本質的な文脈情報を保持しながら、モデルが突然変異によって引き起こされる摂動を捉えることができる。
実験結果から,JanusDDGは単一変異と複数変異の2つの構造に基づく手法の精度を一致または超え,シーケンス単独で$\Delta \Delta G$を予測し,最先端の性能を達成することが示された。
コードアベイラビリティ:https://github.com/compbiomed-unito/JanusDDG
関連論文リスト
- A Simple yet Effective DDG Predictor is An Unsupervised Antibody Optimizer and Explainer [53.85265022754878]
高速な突然変異スクリーニングのための軽量DDG予測器(Light-DDG)を提案する。
また、Light-DDGを事前学習するための数百万の突然変異データを含む大規模データセットもリリースした。
対象抗体について,変異選好を学習するための新しい変異説明器を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:26:57Z) - AlgoRxplorers | Precision in Mutation: Enhancing Drug Design with Advanced Protein Stability Prediction Tools [0.6749750044497732]
単一点アミノ酸変異がタンパク質の安定性に与える影響を予測することは、疾患のメカニズムを理解し、薬物開発を促進するために不可欠である。
タンパク質の安定性はギブス自由エネルギーの変化によって定量化され(DeltaDelta G$)、これらの変異の影響を受けている。
本研究は,タンパク質の安定性の景観を特徴的に表現するために,伝達学習を活用し,異なるモデルからの相補的情報を融合するディープニューラルネットワークの応用を提案する。
論文 参考訳(メタデータ) (2025-01-13T02:17:01Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Retrieval-Enhanced Mutation Mastery: Augmenting Zero-Shot Prediction of Protein Language Model [3.4494754789770186]
タンパク質モデリングの深層学習法は従来の手法に比べて低コストで優れた結果を示した。
突然変異効果予測において、事前学習されたディープラーニングモデルの鍵は、タンパク質配列、構造、機能の間の複雑な関係を正確に解釈することにある。
本研究では,配列と局所構造相互作用から自然特性を包括的に解析する検索強化タンパク質言語モデルを提案する。
論文 参考訳(メタデータ) (2024-10-28T15:28:51Z) - Boltzmann-Aligned Inverse Folding Model as a Predictor of Mutational Effects on Protein-Protein Interactions [48.58317905849438]
結合自由エネルギーの変化を予測する(Delta Delta G$)ことはタンパク質-タンパク質相互作用の理解と調節に不可欠である。
本稿では,事前学習した逆折り畳みモデルから$Delta Delta G$予測への知識伝達のためのボルツマンアライメント手法を提案する。
論文 参考訳(メタデータ) (2024-10-12T14:13:42Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Protein binding affinity prediction under multiple substitutions applying eGNNs on Residue and Atomic graphs combined with Language model information: eGRAL [1.840390797252648]
ディープラーニングは、シリコン内予測と生体内観測のギャップを埋めることのできる強力なツールとして、ますます認識されている。
タンパク質複合体中のアミノ酸置換物からの結合親和性変化を予測するための新しいグラフニューラルネットワークアーキテクチャであるeGRALを提案する。
eGralは、タンパク質の大規模言語モデルから抽出された特徴のおかげで、残基、原子スケール、進化スケールを利用する。
論文 参考訳(メタデータ) (2024-05-03T10:33:19Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - Score-based Causal Representation Learning with Interventions [54.735484409244386]
本稿では,潜在因果変数を間接的に観察する際の因果表現学習問題について検討する。
目的は、 (i) 未知の線形変換(スケーリングまで)を回復し、 (ii) 潜在変数の下の有向非巡回グラフ(DAG)を決定することである。
論文 参考訳(メタデータ) (2023-01-19T18:39:48Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - Sparse generative modeling via parameter-reduction of Boltzmann
machines: application to protein-sequence families [0.0]
ボルツマン機械(BM)は生成モデルとして広く使われている。
BMの一般パラメータ推論手法を提案する。
いくつかのタンパク質ファミリーでは、PM結合の90%以上を除去することができる。
論文 参考訳(メタデータ) (2020-11-23T08:01:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。