論文の概要: KEMP-PIP: A Feature-Fusion Based Approach for Pro-inflammatory Peptide Prediction
- arxiv url: http://arxiv.org/abs/2602.20198v1
- Date: Sun, 22 Feb 2026 08:09:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.459116
- Title: KEMP-PIP: A Feature-Fusion Based Approach for Pro-inflammatory Peptide Prediction
- Title(参考訳): KEMP-PIP: 炎症性ペプチド予測のための特徴フュージョンに基づくアプローチ
- Authors: Soumik Deb Niloy, Md. Fahmid-Ul-Alam Juboraj, Swakkhar Shatabda,
- Abstract要約: KEMP-PIPは、深層タンパク質の埋め込みと手作りのディスクリプタを統合し、堅牢なPIP予測を行うハイブリッド機械学習フレームワークである。
提案手法は,事前訓練されたESMタンパク質言語モデルからのコンテキスト埋め込みと,マルチスケールのk-mer周波数,物理化学的記述子,およびmodlAMP配列の特徴を組み合わせたものである。
標準ベンチマークデータセットでは、KEMP-PIPは0.505のMCC、精度は0.752、AUCは0.762、ProIn-fuse、MultiFeatVotPIP、StackPIPを上回っている。
- 参考スコア(独自算出の注目度): 1.0131895986034314
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pro-inflammatory peptides (PIPs) play critical roles in immune signaling and inflammation but are difficult to identify experimentally due to costly and time-consuming assays. To address this challenge, we present KEMP-PIP, a hybrid machine learning framework that integrates deep protein embeddings with handcrafted descriptors for robust PIP prediction. Our approach combines contextual embeddings from pretrained ESM protein language models with multi-scale k-mer frequencies, physicochemical descriptors, and modlAMP sequence features. Feature pruning and class-weighted logistic regression manage high dimensionality and class imbalance, while ensemble averaging with an optimized decision threshold enhances the sensitivity--specificity balance. Through systematic ablation studies, we demonstrate that integrating complementary feature sets consistently improves predictive performance. On the standard benchmark dataset, KEMP-PIP achieves an MCC of 0.505, accuracy of 0.752, and AUC of 0.762, outperforming ProIn-fuse, MultiFeatVotPIP, and StackPIP. Relative to StackPIP, these results represent improvements of 9.5% in MCC and 4.8% in both accuracy and AUC. The KEMP-PIP web server is freely available at https://nilsparrow1920-kemp-pip.hf.space/ and the full implementation at https://github.com/S18-Niloy/KEMP-PIP.
- Abstract(参考訳): 抗炎症ペプチド(PIP)は免疫シグナルや炎症において重要な役割を担っているが、高価で時間を要するアッセイのために実験的に同定することは困難である。
この課題に対処するために、我々は、深層タンパク質の埋め込みと手作りの記述子を統合するハイブリッド機械学習フレームワークKEMP-PIPを紹介し、堅牢なPIP予測を行う。
提案手法は,事前訓練されたESMタンパク質言語モデルからのコンテキスト埋め込みと,マルチスケールのk-mer周波数,物理化学的記述子,およびmodlAMP配列の特徴を組み合わせたものである。
特徴プルーニングとクラス重み付きロジスティック回帰は高次元性とクラス不均衡を管理する一方、最適化された決定しきい値でのアンサンブル平均化は感度-特異性バランスを高める。
体系的アブレーション研究を通じて、補完的特徴集合の統合は予測性能を一貫して改善することを示した。
標準ベンチマークデータセットでは、KEMP-PIPは0.505のMCC、精度は0.752、AUCは0.762、ProIn-fuse、MultiFeatVotPIP、StackPIPを上回っている。
StackPIPと比較して、これらの結果はMCCが9.5%、AUCが4.8%改善したことを示している。
KEMP-PIP Webサーバはhttps://nilsparrow 1920-kemp-pip.hf.space/で、完全な実装はhttps://github.com/S18-Niloy/KEMP-PIPで利用可能である。
関連論文リスト
- Score-Based Turbo Message Passing for Plug-and-Play Compressive Imaging [45.77515171733844]
圧縮画像回復のためのスコアベース最小平均二乗誤差(MMSE)デノイザを統合するアルゴリズムを考案する。
得られたアルゴリズムはスコアベースのターボメッセージパッシング(STMP)と呼ばれ、メッセージパッシングの高速収束とスコアベースの生成前のパワーを組み合わせたものである。
論文 参考訳(メタデータ) (2025-12-16T14:24:12Z) - DeepBlip: Estimating Conditional Average Treatment Effects Over Time [48.20988325299593]
構造ネスト平均モデル(SNMM)のための最初のニューラルネットワークフレームワークであるDeepBlipを提案する。
提案手法は, 時間変化による不偏推定を正確に調整し, ナイマン・直交損失関数はニュアンスモデルの不特定性に対して頑健性を保証する。
論文 参考訳(メタデータ) (2025-11-18T14:49:03Z) - ResCap-DBP: A Lightweight Residual-Capsule Network for Accurate DNA-Binding Protein Prediction Using Global ProteinBERT Embeddings [9.626183317998143]
本稿では,残差学習に基づくエンコーダと1次元カプセルネットワークを組み合わせた新しいディープラーニングフレームワークResCap-DBPを提案する。
ProteinBERTの埋め込みは、大きなデータセット上の他の表現を大幅に上回る。
我々のモデルは、常に現在の最先端の手法より優れています。
論文 参考訳(メタデータ) (2025-07-27T21:54:32Z) - PRING: Rethinking Protein-Protein Interaction Prediction from Pairs to Graphs [88.98041407783502]
PRINGは、タンパク質とタンパク質の相互作用予測をグラフレベルで評価する最初のベンチマークである。
PRINGは、21,484タンパク質と186,818の相互作用からなる高品質な多種PPIネットワークデータセットをキュレートする。
論文 参考訳(メタデータ) (2025-07-07T15:21:05Z) - Beyond Simple Concatenation: Fairly Assessing PLM Architectures for Multi-Chain Protein-Protein Interactions Prediction [0.2509487459755192]
タンパク質とタンパク質の相互作用 (PPIs) は、多くの細胞プロセスの基礎である。
PLMはタンパク質の構造と機能を予測するのに顕著な成功を収めた。
シークエンスベースのPPI結合親和性予測への応用は、いまだに未検討である。
論文 参考訳(メタデータ) (2025-05-26T14:23:08Z) - SCMPPI: Supervised Contrastive Multimodal Framework for Predicting Protein-Protein Interactions [0.0]
本稿では,タンパク質-タンパク質相互作用予測のための新しい教師付きコントラスト型マルチモーダルフレームワークSCMPPIを提案する。
8つのベンチマークデータセットの実験では、最先端の精度(98.13%)とAUC(99.69%)と優れたクロス種一般化が示されている。
CD9ネットワーク、Wnt経路解析、がん特異的ネットワークで成功した応用は、さらに疾患標的発見の可能性を強調している。
論文 参考訳(メタデータ) (2025-04-03T15:34:02Z) - A general language model for peptide identification [3.856457290796735]
PDeepPPは、事前訓練されたタンパク質言語モデルとハイブリッドトランスフォーマー-畳み込みアーキテクチャを統合する統合ディープラーニングフレームワークである。
大規模かつ正確なペプチド分析を可能にすることにより、PDeepPPは生物医学研究と疾患治療のための新しい治療標的の発見を支援している。
論文 参考訳(メタデータ) (2025-02-21T17:31:22Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - PACOH: Bayes-Optimal Meta-Learning with PAC-Guarantees [77.67258935234403]
PAC-Bayesianフレームワークを用いた理論的解析を行い、メタ学習のための新しい一般化境界を導出する。
我々は、性能保証と原則付きメタレベル正規化を備えたPAC最適メタ学習アルゴリズムのクラスを開発する。
論文 参考訳(メタデータ) (2020-02-13T15:01:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。