論文の概要: Fast and Interpretable Protein Substructure Alignment via Optimal Transport
- arxiv url: http://arxiv.org/abs/2510.11752v1
- Date: Sun, 12 Oct 2025 10:47:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.029657
- Title: Fast and Interpretable Protein Substructure Alignment via Optimal Transport
- Title(参考訳): 最適輸送による高速かつ解釈可能なタンパク質サブ構造アライメント
- Authors: Zhiyu Wang, Bingxin Zhou, Jing Wang, Yang Tan, Weishu Zhao, Pietro Liò, Liang Hong,
- Abstract要約: 本研究は,残基レベルのタンパク質サブ構造アライメントを効率的かつ解釈可能な最初のディープラーニングフレームワークであるPLASMAを提案する。
PLASMAは, 精度, 軽量, 解釈可能な残差レベルのアライメントを実現する。
本手法は,タンパク質構造解析ツールにおける重要なギャップに対処し,機能的アノテーション,進化的研究,構造に基づく薬物設計の新しい機会を提供する。
- 参考スコア(独自算出の注目度): 24.342562385561134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins are essential biological macromolecules that execute life functions. Local motifs within protein structures, such as active sites, are the most critical components for linking structure to function and are key to understanding protein evolution and enabling protein engineering. Existing computational methods struggle to identify and compare these local structures, which leaves a significant gap in understanding protein structures and harnessing their functions. This study presents PLASMA, the first deep learning framework for efficient and interpretable residue-level protein substructure alignment. We reformulate the problem as a regularized optimal transport task and leverage differentiable Sinkhorn iterations. For a pair of input protein structures, PLASMA outputs a clear alignment matrix with an interpretable overall similarity score. Through extensive quantitative evaluations and three biological case studies, we demonstrate that PLASMA achieves accurate, lightweight, and interpretable residue-level alignment. Additionally, we introduce PLASMA-PF, a training-free variant that provides a practical alternative when training data are unavailable. Our method addresses a critical gap in protein structure analysis tools and offers new opportunities for functional annotation, evolutionary studies, and structure-based drug design. Reproducibility is ensured via our official implementation at https://github.com/ZW471/PLASMA-Protein-Local-Alignment.git.
- Abstract(参考訳): タンパク質は生命機能を実行する重要な生体高分子である。
活性部位などのタンパク質構造内の局所モチーフは、構造を機能にリンクするための最も重要な構成要素であり、タンパク質の進化を理解し、タンパク質工学を可能にする鍵となる。
既存の計算手法ではこれらの局所構造を同定し比較するのに苦労しており、タンパク質の構造を理解し、それらの機能を利用する際に大きなギャップが残されている。
本研究は,残基レベルのタンパク質サブ構造アライメントを効率的かつ解釈可能な最初のディープラーニングフレームワークであるPLASMAを提案する。
我々は、問題を正規化された最適輸送タスクとして再構成し、微分可能なシンクホーン反復を利用する。
一対の入力タンパク質構造に対して、PLASMAは解釈可能な全体的な類似点を持つクリアアライメント行列を出力する。
広範にわたる定量的評価と3つの生物学的ケーススタディにより、PLASMAは正確で、軽量で、解釈可能な残基レベルのアライメントを実現することを実証した。
さらに、トレーニングデータが利用できない場合に、実用的な代替手段を提供するトレーニングフリー版であるPLASMA-PFを導入する。
本手法は,タンパク質構造解析ツールにおける重要なギャップに対処し,機能的アノテーション,進化的研究,構造に基づく薬物設計の新しい機会を提供する。
再現性は、https://github.com/ZW471/PLASMA-Protein-Local-Alignment.gitでの公式実装を通じて保証されます。
関連論文リスト
- CPE-Pro: A Structure-Sensitive Deep Learning Method for Protein Representation and Origin Evaluation [7.161099050722313]
タンパク質構造評価用結晶対予測学習モデル(CPE-Pro)を開発した。
CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。
我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文 参考訳(メタデータ) (2024-10-21T02:21:56Z) - A PLMs based protein retrieval framework [3.878994100846403]
本稿では,配列類似性に対するバイアスを緩和する新規なタンパク質検索フレームワークを提案する。
我々のフレームワークは、タンパク質の配列を高次元の特徴空間に埋め込むために、タンパク質言語モデル(PLM)を主導的に活用する。
大規模な実験により、我々のフレームワークは類似タンパク質と異種タンパク質の両方を等しく回収できることが示された。
論文 参考訳(メタデータ) (2024-07-16T09:52:42Z) - Protein Representation Learning with Sequence Information Embedding: Does it Always Lead to a Better Performance? [4.7077642423577775]
本稿では,アミノ酸構造表現のみに基づく局所幾何アライメント手法ProtLOCAを提案する。
本手法は,構造的に整合性のあるタンパク質ドメインとより迅速かつ正確にマッチングすることで,既存の配列および構造に基づく表現学習法より優れる。
論文 参考訳(メタデータ) (2024-06-28T08:54:37Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - CCPL: Cross-modal Contrastive Protein Learning [47.095862120116976]
我々は、新しい教師なしタンパク質構造表現事前学習法、クロスモーダルコントラスト型タンパク質学習(CCPL)を導入する。
CCPLは堅牢なタンパク質言語モデルを活用し、教師なしのコントラストアライメントを用いて構造学習を強化する。
さまざまなベンチマークでモデルを評価し,フレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2023-03-19T08:19:10Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。