論文の概要: BioBlobs: Differentiable Graph Partitioning for Protein Representation Learning
- arxiv url: http://arxiv.org/abs/2510.01632v1
- Date: Thu, 02 Oct 2025 03:25:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.968167
- Title: BioBlobs: Differentiable Graph Partitioning for Protein Representation Learning
- Title(参考訳): BioBlobs:タンパク質表現学習のための微分可能なグラフ分割
- Authors: Xin Wang, Carlos Oliver,
- Abstract要約: 動的に構造を柔軟に大きめのサブ構造(「ブロブ」)に分割することで、タンパク質を表現するプラグアンドプレイモジュールであるBioBlobsを紹介した。
得られたブロブは共有および解釈可能なコードブックに量子化され、タンパク質の埋め込みを計算するのに使用される機能関連タンパク質のサブ構造を個別に語彙化する。
また,BioBlobsの表現により,GVP-GNNなどの広く使われているタンパク質エンコーダの性能が,PRLタスクで向上することを示す。
- 参考スコア(独自算出の注目度): 3.6641231031729173
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Protein function is driven by coherent substructures which vary in size and topology, yet current protein representation learning models (PRL) distort these signals by relying on rigid substructures such as k-hop and fixed radius neighbourhoods. We introduce BioBlobs, a plug-and-play, fully differentiable module that represents proteins by dynamically partitioning structures into flexibly-sized, non-overlapping substructures ("blobs"). The resulting blobs are quantized into a shared and interpretable codebook, yielding a discrete vocabulary of function-relevant protein substructures used to compute protein embeddings. We show that BioBlobs representations improve the performance of widely used protein encoders such as GVP-GNN across various PRL tasks. Our approach highlights the value of architectures that directly capture function-relevant protein substructures, enabling both improved predictive performance and mechanistic insight into protein function.
- Abstract(参考訳): タンパク質機能は、大きさやトポロジーの異なるコヒーレントなサブストラクチャーによって駆動されるが、現在のタンパク質表現学習モデル(PRL)は、kホップや固定半径近傍などの固いサブストラクチャーに依存してこれらの信号を歪めている。
そこで我々はBioBlobsを紹介した。BioBlobsは、動的に構造を柔軟にサイズの非重なり合うサブ構造("blob")に分割することで、タンパク質を表現する、プラグアンドプレイで完全に分化可能なモジュールである。
得られたブロブは共有および解釈可能なコードブックに量子化され、タンパク質の埋め込みを計算するのに使用される機能関連タンパク質のサブ構造を個別に語彙化する。
また,BioBlobsの表現により,GVP-GNNなどの広く使われているタンパク質エンコーダの性能が,PRLタスクで向上することを示す。
提案手法では,機能関連タンパク質サブ構造を直接キャプチャするアーキテクチャの価値を強調し,予測性能の向上とタンパク質機能に関する機械的知見の両立を可能にした。
関連論文リスト
- Aligning Proteins and Language: A Foundation Model for Protein Retrieval [30.32156711268032]
本稿では,大規模タンパク質データセットから類似した構造と意味を持つタンパク質を検索することを目的とする。
近年のビジョンキャプチャーモデル (VLM) の進歩により, 3次元タンパク質構造と機能アノテーションを協調するCLIPスタイルのフレームワークが提案されている。
論文 参考訳(メタデータ) (2025-05-27T08:13:08Z) - Bidirectional Hierarchical Protein Multi-Modal Representation Learning [4.682021474006426]
大規模タンパク質配列で事前訓練されたタンパク質言語モデル(pLM)は、配列ベースタスクにおいて大きな成功を収めた。
3次元構造情報を活用するために設計されたグラフニューラルネットワーク(GNN)は、タンパク質関連予測タスクにおいて有望な一般化を示している。
本稿では、よりリッチで包括的なタンパク質表現を捉えるために、双方向かつ階層的な(双階層的な)融合アプローチを提案する。
論文 参考訳(メタデータ) (2025-04-07T06:47:49Z) - ProteinRPN: Towards Accurate Protein Function Prediction with Graph-Based Region Proposals [4.525216077859531]
本稿では,タンパク質機能予測のためのタンパク質領域提案ネットワーク(ProteinRPN)を紹介する。
proteinRPNは、階層型ノードドロッププーリング層を通じて洗練される潜在的な機能領域(アンカー)を識別する。
予測された機能ノードの表現は、注意機構を使用して強化され、グラフマルチセット変換器に入力される。
論文 参考訳(メタデータ) (2024-09-01T04:40:04Z) - ProtFAD: Introducing function-aware domains as implicit modality towards protein function prediction [4.299777426056576]
本稿では,タンパク質の異なる機能を識別するために,機能認識ドメイン表現とドメイン結合型学習戦略を提案する。
提案手法は, 様々なベンチマークにおいて, 最先端の手法よりも大きく, 包括的に優れている。
論文 参考訳(メタデータ) (2024-05-24T02:26:45Z) - CCPL: Cross-modal Contrastive Protein Learning [47.095862120116976]
我々は、新しい教師なしタンパク質構造表現事前学習法、クロスモーダルコントラスト型タンパク質学習(CCPL)を導入する。
CCPLは堅牢なタンパク質言語モデルを活用し、教師なしのコントラストアライメントを用いて構造学習を強化する。
さまざまなベンチマークでモデルを評価し,フレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2023-03-19T08:19:10Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。