論文の概要: Learning Protein Structure-Function Relationships through Knowledge-guided Representation Decomposition
- arxiv url: http://arxiv.org/abs/2605.23960v1
- Date: Tue, 12 May 2026 07:12:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-01 02:55:42.978773
- Title: Learning Protein Structure-Function Relationships through Knowledge-guided Representation Decomposition
- Title(参考訳): タンパク質の構造を学習する-知識誘導表現分解による機能相関
- Authors: Mingqing Wang, Zhiwei Nie, Athanasios V. Vasilakos, Yonghong He, Zhixiang Ren,
- Abstract要約: ProtDiSは、事前訓練されたタンパク質のマイクロ環境埋め込みを生物学的に接地された次元に分解する知識誘導フレームワークである。
情報ボトルネックの原則にインスパイアされたProtDiSは、情報量と圧縮のバランスをとる表現を学ぶ。
タンパク質および残基レベルの分析により、ProtDiSは類似の折りたたみを持つタンパク質を区別するが、異なる機能を持ち、きめ細かい生物学的シグナルを捕捉する。
- 参考スコア(独自算出の注目度): 13.468392186646382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins encode diverse functions within complex three-dimensional structures, yet most deep learning representations remain highly entangled, obscuring the biophysical signals that underlie function. Here we introduce ProtDiS, a knowledge-guided framework that decomposes pretrained protein micro-environment embeddings into biologically grounded and task-relevant dimensions. Inspired by the information bottleneck principle, ProtDiS learns representations that balance informativeness and compression, yielding structural features that are more specific, independent, and information-efficient, and achieving consistent improvements across twelve downstream tasks, with the largest gains under structure-based splits. Protein- and residue-level analyses further show that ProtDiS differentiates proteins with similar folds but divergent functions and captures fine-grained biophysical signals critical. These findings suggest that knowledge-guided decomposition provides a general and interpretable approach for structuring latent spaces in protein structural modeling. The source code and implementation details are publicly available at https://github.com/AI-HPC-Research-Team/ProtDiS.
- Abstract(参考訳): タンパク質は複雑な3次元構造の中で多様な機能をコードするが、ほとんどの深層学習表現は高い絡み合いを保ち、機能不足の生体物理信号を隠蔽する。
本稿では, 知識誘導型フレームワークであるProtDiSを紹介する。
情報ボトルネックの原則にインスパイアされたProtDiSは、情報伝達性と圧縮のバランスをとる表現を学び、より具体的で独立的で情報効率のよい構造的特徴を与え、12の下流タスクで一貫した改善を実現し、構造ベースの分割で最大の利益を得る。
タンパク質および残基レベルの分析により、ProtDiSは類似の折りたたみを持つタンパク質を識別するが、異なる機能を持ち、微細な生体物理シグナルを捕捉する。
これらの結果は、知識誘導分解は、タンパク質構造モデリングにおける潜在空間を構築するための一般的かつ解釈可能なアプローチをもたらすことを示唆している。
ソースコードと実装の詳細はhttps://github.com/AI-HPC-Research-Team/ProtDiS.comで公開されている。
関連論文リスト
- S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.89086338778098]
タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。
最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。
第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。
この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文 参考訳(メタデータ) (2025-11-10T11:57:47Z) - Fast and Interpretable Protein Substructure Alignment via Optimal Transport [24.342562385561134]
本研究は,残基レベルのタンパク質サブ構造アライメントを効率的かつ解釈可能な最初のディープラーニングフレームワークであるPLASMAを提案する。
PLASMAは, 精度, 軽量, 解釈可能な残差レベルのアライメントを実現する。
本手法は,タンパク質構造解析ツールにおける重要なギャップに対処し,機能的アノテーション,進化的研究,構造に基づく薬物設計の新しい機会を提供する。
論文 参考訳(メタデータ) (2025-10-12T10:47:29Z) - BioBlobs: Differentiable Graph Partitioning for Protein Representation Learning [3.6641231031729173]
動的に構造を柔軟に大きめのサブ構造(「ブロブ」)に分割することで、タンパク質を表現するプラグアンドプレイモジュールであるBioBlobsを紹介した。
得られたブロブは共有および解釈可能なコードブックに量子化され、タンパク質の埋め込みを計算するのに使用される機能関連タンパク質のサブ構造を個別に語彙化する。
また,BioBlobsの表現により,GVP-GNNなどの広く使われているタンパク質エンコーダの性能が,PRLタスクで向上することを示す。
論文 参考訳(メタデータ) (2025-10-02T03:25:02Z) - CPE-Pro: A Structure-Sensitive Deep Learning Method for Protein Representation and Origin Evaluation [7.161099050722313]
タンパク質構造評価用結晶対予測学習モデル(CPE-Pro)を開発した。
CPE-Proはタンパク質の構造情報を学習し、構造間の差異を捉え、4つのデータクラスの正確なトレーサビリティを実現する。
我々は Foldseek を用いてタンパク質構造を「構造配列」にエンコードし、タンパク質構造配列言語モデル SSLM を訓練した。
論文 参考訳(メタデータ) (2024-10-21T02:21:56Z) - Protein Representation Learning with Sequence Information Embedding: Does it Always Lead to a Better Performance? [4.7077642423577775]
本稿では,アミノ酸構造表現のみに基づく局所幾何アライメント手法ProtLOCAを提案する。
本手法は,構造的に整合性のあるタンパク質ドメインとより迅速かつ正確にマッチングすることで,既存の配列および構造に基づく表現学習法より優れる。
論文 参考訳(メタデータ) (2024-06-28T08:54:37Z) - Integration of Pre-trained Protein Language Models into Geometric Deep
Learning Networks [68.90692290665648]
我々は、タンパク質言語モデルから学んだ知識を、いくつかの最先端の幾何学的ネットワークに統合する。
以上の結果から,ベースラインを20%上回る総合的な改善が見られた。
強い証拠は、タンパク質言語モデルの知識を取り入れることで、幾何学的ネットワークの能力が著しく向上することを示している。
論文 参考訳(メタデータ) (2022-12-07T04:04:04Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。