論文の概要: PUFFIN: Protein Unit Discovery with Functional Supervision
- arxiv url: http://arxiv.org/abs/2604.14796v1
- Date: Thu, 16 Apr 2026 09:10:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.817287
- Title: PUFFIN: Protein Unit Discovery with Functional Supervision
- Title(参考訳): PUFFIN: 機能的スーパービジョンによるタンパク質ユニット発見
- Authors: Gökçe Uludoğan, Buse Giledereli, Elif Ozkirimli, Arzucan Özgür,
- Abstract要約: 本稿では,タンパク質単位を発見するためのデータ駆動型フレームワークPUFFINを紹介する。
PUFFINはタンパク質を残基レベルの構造グラフとして表現し、構造認識プーリング機構を備えたグラフニューラルネットワークを適用している。
学習ユニットは構造的に整合性を示し,分子機能と組織的関連を示し,InterProアノテーションと有意な対応を示す。
- 参考スコア(独自算出の注目度): 2.0544239209511983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins carry out biological functions through the coordinated action of groups of residues organized into structural arrangements. These arrangements, which we refer to as protein units, exist at an intermediate scale, being larger than individual residues yet smaller than entire proteins. A deeper understanding of protein function can be achieved by identifying these units and their associations with function. However, existing approaches either focus on residue-level signals, rely on curated annotations, or segment protein structures without incorporating functional information, thereby limiting interpretable analysis of structure-function relationships. We introduce PUFFIN, a data-driven framework for discovering protein units by jointly learning structural partitioning and functional supervision. PUFFIN represents proteins as residue-level structure graphs and applies a graph neural network with a structure-aware pooling mechanism that partitions each protein into multi-residue units, with functional supervision that shapes the partition. We show that the learned units are structurally coherent, exhibit organized associations with molecular function, and show meaningful correspondence with curated InterPro annotations. Together, these results demonstrate that PUFFIN provides an interpretable framework for analyzing structure-function relationships using learned protein units and their statistical function associations. We made our source code available at https://github.com/boun-tabi-lifelu/puffin.
- Abstract(参考訳): タンパク質は構造的な配列に整理された残基のグループの協調作用を通じて生物学的機能を実行する。
これらの配列は、タンパク質単位と呼ばれ、中間的なスケールで存在し、個々の残基よりも大きく、タンパク質全体よりも小さい。
タンパク質の機能のより深い理解は、これらのユニットとその機能との関連を同定することによって達成できる。
しかし、既存のアプローチでは、残基レベルの信号に焦点をあてたり、キュレートされたアノテーションに頼ったり、機能的情報を含まないセグメントタンパク質構造に依存したりすることで、構造-機能関係の解釈可能な解析を制限している。
本稿では,構造分割と機能管理を共同で学習することで,タンパク質単位を発見するためのデータ駆動フレームワークPUFFINを紹介する。
PUFFINはタンパク質を残基レベルの構造グラフとして表現し、各タンパク質を複数の残基に分割する構造認識プーリング機構を備えたグラフニューラルネットワークを適用し、分割を形作る機能的監視を行う。
学習ユニットは構造的に整合性を示し,分子機能と組織的関連を示し,InterProアノテーションと有意な対応を示す。
これらの結果は、PUFFINが、学習したタンパク質ユニットとその統計的機能関連を用いて構造-機能関係を解析するための解釈可能なフレームワークを提供することを示した。
ソースコードはhttps://github.com/boun-tabi-lifelu/puffin.comで公開しました。
関連論文リスト
- Fast and Interpretable Protein Substructure Alignment via Optimal Transport [24.342562385561134]
本研究は,残基レベルのタンパク質サブ構造アライメントを効率的かつ解釈可能な最初のディープラーニングフレームワークであるPLASMAを提案する。
PLASMAは, 精度, 軽量, 解釈可能な残差レベルのアライメントを実現する。
本手法は,タンパク質構造解析ツールにおける重要なギャップに対処し,機能的アノテーション,進化的研究,構造に基づく薬物設計の新しい機会を提供する。
論文 参考訳(メタデータ) (2025-10-12T10:47:29Z) - BioBlobs: Differentiable Graph Partitioning for Protein Representation Learning [3.6641231031729173]
動的に構造を柔軟に大きめのサブ構造(「ブロブ」)に分割することで、タンパク質を表現するプラグアンドプレイモジュールであるBioBlobsを紹介した。
得られたブロブは共有および解釈可能なコードブックに量子化され、タンパク質の埋め込みを計算するのに使用される機能関連タンパク質のサブ構造を個別に語彙化する。
また,BioBlobsの表現により,GVP-GNNなどの広く使われているタンパク質エンコーダの性能が,PRLタスクで向上することを示す。
論文 参考訳(メタデータ) (2025-10-02T03:25:02Z) - ProteinRPN: Towards Accurate Protein Function Prediction with Graph-Based Region Proposals [4.525216077859531]
本稿では,タンパク質機能予測のためのタンパク質領域提案ネットワーク(ProteinRPN)を紹介する。
proteinRPNは、階層型ノードドロッププーリング層を通じて洗練される潜在的な機能領域(アンカー)を識別する。
予測された機能ノードの表現は、注意機構を使用して強化され、グラフマルチセット変換器に入力される。
論文 参考訳(メタデータ) (2024-09-01T04:40:04Z) - ProtFAD: Introducing function-aware domains as implicit modality towards protein function prediction [4.299777426056576]
本稿では,タンパク質の異なる機能を識別するために,機能認識ドメイン表現とドメイン結合型学習戦略を提案する。
提案手法は, 様々なベンチマークにおいて, 最先端の手法よりも大きく, 包括的に優れている。
論文 参考訳(メタデータ) (2024-05-24T02:26:45Z) - CCPL: Cross-modal Contrastive Protein Learning [47.095862120116976]
我々は、新しい教師なしタンパク質構造表現事前学習法、クロスモーダルコントラスト型タンパク質学習(CCPL)を導入する。
CCPLは堅牢なタンパク質言語モデルを活用し、教師なしのコントラストアライメントを用いて構造学習を強化する。
さまざまなベンチマークでモデルを評価し,フレームワークの優位性を実証した。
論文 参考訳(メタデータ) (2023-03-19T08:19:10Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。