論文の概要: Protein Representation Learning with Secondary-Structure and Energy-Filtered Hydrogen-Bond Graphs
- arxiv url: http://arxiv.org/abs/2606.19374v1
- Date: Fri, 12 Jun 2026 07:33:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.412749
- Title: Protein Representation Learning with Secondary-Structure and Energy-Filtered Hydrogen-Bond Graphs
- Title(参考訳): 二次構造とエネルギー充填型水素結合グラフを用いたタンパク質表現学習
- Authors: Mohamed Mouhajir, Limei Wang, El Houcine Bergou, Hajar El Hammouti, Lamiae Azizi, Dongqi Fu,
- Abstract要約: タンパク質表現学習のための二次構造対応グラフニューラルネットワークを提案する。
提案手法をタンパク質ベンチマークで評価する。
結果として得られるグラフ表現は、生物学的解釈可能性を高める。
- 参考スコア(独自算出の注目度): 15.470397852131677
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Graph-based representations are widely used in protein modeling, yet many existing approaches rely primarily on sequence adjacency or geometric proximity, which only partially reflect the principles governing protein folding. Proteins instead adopt complex three-dimensional conformations organized around secondary structure elements, such as $α$-helices and $β$-sheets, which encode recurring local motifs and stabilizing hydrogen-bond interactions. In this work, we introduce a secondary-structure-aware graph neural network for protein representation learning. Residue-level node representations are augmented with secondary structure assignments, and graph edges are constructed from hydrogen-bond interactions filtered by their energetic strength. This design enables the model to capture both local structural context and long-range couplings that are central to protein stability and function. We evaluate the proposed approach on commonly used protein benchmarks and observe consistent improvements over existing graph-based methods. In addition, the resulting graph representations offer enhanced biological interpretability, as the learned connectivity aligns with established structural motifs. These findings suggest that incorporating secondary structure and energy-filtered hydrogen-bond topology provides an effective inductive bias for protein representation learning. The code is released at https://github.com/mohamedmohamed2021/SSProNet
- Abstract(参考訳): グラフベースの表現はタンパク質のモデリングに広く用いられているが、既存の多くのアプローチは、タンパク質の折り畳みを規定する原則を部分的に反映した配列の隣接性や幾何学的近接性に依存している。
タンパク質は代わりに$α$ヘリスや$β$シートのような二次構造要素を中心に構成された複雑な3次元コンフォメーションを採用し、局所的なモチーフを繰り返し、水素結合相互作用を安定化させる。
本研究では,タンパク質表現学習のための二次構造対応グラフニューラルネットワークを提案する。
残留レベルのノード表現は二次構造割り当てで強化され、グラフエッジはそのエネルギー的強度でフィルタリングされた水素結合相互作用から構築される。
この設計により、タンパク質の安定性と機能の中心となる局所的な構造的コンテキストと長距離結合の両方を捉えることができる。
提案手法は, 一般的なタンパク質のベンチマークで評価され, 既存のグラフベースの手法よりも一貫した改善が見られた。
さらに、得られたグラフ表現は、学習された接続が確立された構造的モチーフと整合するので、生物学的解釈可能性を高める。
これらの結果は,二次構造とエネルギーフィルタリングされた水素結合型トポロジーを取り入れることで,タンパク質表現学習に有効な誘導バイアスをもたらすことを示唆している。
コードはhttps://github.com/mohamedmohamed2021/SSProNetで公開されている。
関連論文リスト
- Curvature-Informed Potential Energy Surface for Protein-Ligand Binding Affinity Prediction [30.613275405893265]
タンパク質-リガンド結合親和性予測のための曲率インフォームドポテンシャルエネルギー表面(CPES)グラフニューラルネットワークを提案する。
CPESは、物理インフォームドな曲率表現をモデルコンフォメーションの柔軟性に取り入れている。
CPESは予測性能を改善し、物理的解釈性を提供する。
論文 参考訳(メタデータ) (2026-06-12T07:53:26Z) - Scaling Atomistic Protein Binder Design with Generative Pretraining and Test-Time Compute [64.59043351161004]
両パラダイムを統一する新規な完全原子結合体生成法であるProteina-Complexaを提案する。
Proteina-Complexa は計算バインダー設計ベンチマークにおける新しい技術状態を設定する。
また, 界面水素結合最適化, フォールドクラス誘導結合体生成, 小分子ターゲットへの拡張, 酵素設計タスクについても述べる。
論文 参考訳(メタデータ) (2026-03-30T01:54:03Z) - Protein Secondary Structure Prediction Using 3D Graphs and Relation-Aware Message Passing Transformers [26.044929670768]
本研究では,タンパク質一次配列から二次構造を予測するという課題に取り組む。
タンパク質残基グラフを用いて、空間情報の強化を図り、様々な形態の逐次的または構造的接続を導入する。
複数の畳み込み層を積み重ねて、タンパク質の空間グラフから組み合わせた洞察を効率的に学習する。
論文 参考訳(メタデータ) (2025-11-17T18:39:13Z) - S$^2$Drug: Bridging Protein Sequence and 3D Structure in Contrastive Representation Learning for Virtual Screening [72.89086338778098]
タンパク質リガンドコントラスト表現学習のための2段階フレームワークを提案する。
最初の段階では、ESM2ベースのバックボーンを用いて、ChemBLでタンパク質配列を事前訓練する。
第2段階では、残基レベルゲーティングモジュールを介して配列と構造情報を融合することでPDBBindを微調整する。
この補助的なタスクは、モデルを誘導し、タンパク質配列内の結合残基を正確に局在させ、それらの3次元空間配列をキャプチャする。
論文 参考訳(メタデータ) (2025-11-10T11:57:47Z) - Bidirectional Hierarchical Protein Multi-Modal Representation Learning [4.682021474006426]
大規模タンパク質配列で事前訓練されたタンパク質言語モデル(pLM)は、配列ベースタスクにおいて大きな成功を収めた。
3次元構造情報を活用するために設計されたグラフニューラルネットワーク(GNN)は、タンパク質関連予測タスクにおいて有望な一般化を示している。
本稿では、よりリッチで包括的なタンパク質表現を捉えるために、双方向かつ階層的な(双階層的な)融合アプローチを提案する。
論文 参考訳(メタデータ) (2025-04-07T06:47:49Z) - State-specific protein-ligand complex structure prediction with a
multi-scale deep generative model [68.28309982199902]
タンパク質-リガンド複合体構造を直接予測できる計算手法であるNeuralPLexerを提案する。
我々の研究は、データ駆動型アプローチがタンパク質と小分子の構造的協調性を捉え、酵素や薬物分子などの設計を加速させる可能性を示唆している。
論文 参考訳(メタデータ) (2022-09-30T01:46:38Z) - Structure-aware Interactive Graph Neural Networks for the Prediction of
Protein-Ligand Binding Affinity [52.67037774136973]
薬物発見はタンパク質-リガンド結合親和性の予測にしばしば依存する。
近年の進歩は、タンパク質-リガンド複合体の表現を学習することで、グラフニューラルネットワーク(GNN)をより良い親和性予測に応用する大きな可能性を示している。
ポーラインスパイアグラフアテンション層(PGAL)とペア・インタラクティブ・プール(PiPool)の2つのコンポーネントから構成される構造対応型インタラクティブグラフニューラルネットワーク(SIGN)を提案する。
論文 参考訳(メタデータ) (2021-07-21T03:34:09Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。