論文の概要: PepTriX: A Framework for Explainable Peptide Analysis through Protein Language Models
- arxiv url: http://arxiv.org/abs/2511.10244v1
- Date: Fri, 14 Nov 2025 01:41:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.766781
- Title: PepTriX: A Framework for Explainable Peptide Analysis through Protein Language Models
- Title(参考訳): PepTriX:タンパク質言語モデルによる説明可能なペプチド分析フレームワーク
- Authors: Vincent Schilling, Akshat Dubey, Georges Hattab,
- Abstract要約: PepTriXは1次元(1D)配列の埋め込みと3次元(3D)構造特徴をグラフアテンションネットワークを介して統合する新しいフレームワークである。
予測的堅牢性と解釈可能なバリデーションの両方を提供し、パフォーマンス駆動ペプチドレベルモデル(PLM)とペプチド研究におけるドメインレベルの理解のギャップを埋める。
- 参考スコア(独自算出の注目度): 0.3823356975862005
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Peptide classification tasks, such as predicting toxicity and HIV inhibition, are fundamental to bioinformatics and drug discovery. Traditional approaches rely heavily on handcrafted encodings of one-dimensional (1D) peptide sequences, which can limit generalizability across tasks and datasets. Recently, protein language models (PLMs), such as ESM-2 and ESMFold, have demonstrated strong predictive performance. However, they face two critical challenges. First, fine-tuning is computationally costly. Second, their complex latent representations hinder interpretability for domain experts. Additionally, many frameworks have been developed for specific types of peptide classification, lacking generalization. These limitations restrict the ability to connect model predictions to biologically relevant motifs and structural properties. To address these limitations, we present PepTriX, a novel framework that integrates one dimensional (1D) sequence embeddings and three-dimensional (3D) structural features via a graph attention network enhanced with contrastive training and cross-modal co-attention. PepTriX automatically adapts to diverse datasets, producing task-specific peptide vectors while retaining biological plausibility. After evaluation by domain experts, we found that PepTriX performs remarkably well across multiple peptide classification tasks and provides interpretable insights into the structural and biophysical motifs that drive predictions. Thus, PepTriX offers both predictive robustness and interpretable validation, bridging the gap between performance-driven peptide-level models (PLMs) and domain-level understanding in peptide research.
- Abstract(参考訳): 毒性の予測やHIV阻害などのペプチド分類タスクは、バイオインフォマティクスや薬物発見の基礎となっている。
従来のアプローチは、1次元(1D)ペプチド配列の手作りの符号化に大きく依存しており、タスクやデータセット間の一般化性を制限することができる。
近年, ESM-2 や ESMFold などのタンパク質言語モデル (PLM) は高い予測性能を示した。
しかし、それらは2つの重要な課題に直面している。
まず、微調整は計算コストがかかる。
第二に、複雑な潜伏表現はドメインの専門家にとって解釈可能性を妨げる。
さらに、特定のタイプのペプチド分類のために多くのフレームワークが開発され、一般化が欠如している。
これらの制限は、モデル予測を生物学的に関連するモチーフや構造特性に結びつける能力を制限する。
これらの制約に対処するため、PepTriXは1次元(1D)配列の埋め込みと3次元(3D)構造特徴を統合する新しいフレームワークである。
PepTriXは様々なデータセットに自動的に適応し、生物学的な妥当性を維持しながらタスク特異的ペプチドベクターを生成する。
ドメインの専門家による評価の結果、PepTriXは複数のペプチドの分類タスクにおいて極めてよく機能し、予測を駆動する構造的および生物物理学的モチーフに対する解釈可能な洞察を提供することがわかった。
したがって、PepTriXは予測的堅牢性と解釈可能なバリデーションの両方を提供し、パフォーマンス駆動ペプチドレベルモデル(PLM)とペプチド研究におけるドメインレベルの理解のギャップを埋める。
関連論文リスト
- PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - A general language model for peptide identification [3.856457290796735]
PDeepPPは、事前訓練されたタンパク質言語モデルとハイブリッドトランスフォーマー-畳み込みアーキテクチャを統合する統合ディープラーニングフレームワークである。
大規模かつ正確なペプチド分析を可能にすることにより、PDeepPPは生物医学研究と疾患治療のための新しい治療標的の発見を支援している。
論文 参考訳(メタデータ) (2025-02-21T17:31:22Z) - DPLM-2: A Multimodal Diffusion Protein Language Model [75.98083311705182]
DPLM-2は, 離散拡散タンパク質言語モデル(DPLM)を拡張し, 配列と構造の両方に適合する多モーダルタンパク質基盤モデルである。
DPLM-2は、配列と構造、およびその限界と条件の結合分布を学習する。
実験によりDPLM-2は高度に互換性のあるアミノ酸配列とそれに対応する3D構造を同時に生成できることが示された。
論文 参考訳(メタデータ) (2024-10-17T17:20:24Z) - Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.812284760539713]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。
溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。
本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文 参考訳(メタデータ) (2024-07-02T20:13:47Z) - Full-Atom Peptide Design based on Multi-modal Flow Matching [32.58558711545861]
フル原子ペプチドの設計のためのフローマッチングフレームワークを基盤とした,最初のマルチモーダル深層生成モデルであるPepFlowについて述べる。
高次元トーラス上で,$mathrmSE(3)$多様体内の剛性バックボーンフレームと側鎖角を用いてペプチド構造を特徴付ける。
提案手法は,固定バックボーンシーケンス設計や部分サンプリングによるサイドチェーンパッキングなど,様々なタスクに順応的に取り組む。
論文 参考訳(メタデータ) (2024-06-02T12:59:54Z) - PepHarmony: A Multi-View Contrastive Learning Framework for Integrated
Sequence and Structure-Based Peptide Encoding [21.126660909515607]
本研究は、配列に基づくペプチド符号化タスクのための、新しいマルチビューコントラスト学習フレームワークであるPepHarmonyを紹介する。
タンパク質データバンク(PDB)とAlphaFoldデータベースから、幅広いペプチド配列と構造を含むデータセットを慎重に選択する。
実験データではペプハーモニーのペプチド配列と構造の間の複雑な関係を捉える能力が強調されている。
論文 参考訳(メタデータ) (2024-01-21T01:16:53Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。