論文の概要: SGAC: A Graph Neural Network Framework for Imbalanced and Structure-Aware AMP Classification
- arxiv url: http://arxiv.org/abs/2412.16276v1
- Date: Fri, 20 Dec 2024 17:17:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:56:09.951775
- Title: SGAC: A Graph Neural Network Framework for Imbalanced and Structure-Aware AMP Classification
- Title(参考訳): SGAC:不均衡と構造を考慮したAMP分類のためのグラフニューラルネットワークフレームワーク
- Authors: Yingxu Wang, Victor Liang, Nan Yin, Siwei Liu, Eran Segal,
- Abstract要約: メダゲノミクスシークエンシングデータから抽出された多数のペプチドから抗微生物ペプチド(AMP)を分類することは、抗生物質耐性の問題に対処するための重要なアプローチである。
現在のAMP分類法は、主に配列に基づくデータに依存し、ペプチドの空間構造を無視し、AMPの正確な分類を制限している。
- 参考スコア(独自算出の注目度): 7.044114650607729
- License:
- Abstract: Classifying antimicrobial peptides(AMPs) from the vast array of peptides mined from metagenomic sequencing data is a significant approach to addressing the issue of antibiotic resistance. However, current AMP classification methods, primarily relying on sequence-based data, neglect the spatial structure of peptides, thereby limiting the accurate classification of AMPs. Additionally, the number of known AMPs is significantly lower than that of non-AMPs, leading to imbalanced datasets that reduce predictive accuracy for AMPs. To alleviate these two limitations, we first employ Omegafold to predict the three-dimensional spatial structures of AMPs and non-AMPs, constructing peptide graphs based on the amino acids' C$_\alpha$ positions. Building upon this, we propose a novel classification model named Spatial GNN-based AMP Classifier (SGAC). Our SGAC model employs a graph encoder based on Graph Neural Networks (GNNs) to process peptide graphs, generating high-dimensional representations that capture essential features from the three-dimensional spatial structure of amino acids. Then, to address the inherent imbalanced datasets, SGAC first incorporates Weight-enhanced Contrastive Learning, which clusters similar peptides while ensuring separation between dissimilar ones, using weighted contributions to emphasize AMP-specific features. Furthermore, SGAC employs Weight-enhanced Pseudo-label Distillation to dynamically generate high-confidence pseudo labels for ambiguous peptides, further refining predictions and promoting balanced learning between AMPs and non-AMPs. Experiments on publicly available AMP and non-AMP datasets demonstrate that SGAC significantly outperforms traditional sequence-based methods and achieves state-of-the-art performance among graph-based models, validating its effectiveness in AMP classification.
- Abstract(参考訳): メダゲノミクスシークエンシングデータから抽出された多数のペプチドから抗微生物ペプチド(AMP)を分類することは、抗生物質耐性の問題に対処するための重要なアプローチである。
しかし、現在のAMP分類法は主に配列に基づくデータに依存しており、ペプチドの空間構造を無視し、AMPの正確な分類を制限している。
さらに、既知のAMPの数は非AMPよりも大幅に少なく、AMPの予測精度を低下させる不均衡なデータセットをもたらす。
これらの2つの制限を緩和するために、まずOmegafoldを用いてAMPと非AMPの3次元空間構造を予測し、アミノ酸のC$_\alpha$位置に基づいたペプチドグラフを構築する。
そこで我々はSGAC(Spatial GNN-based AMP Classificationifier)という新しい分類モデルを提案する。
我々のSGACモデルは、グラフニューラルネットワーク(GNN)に基づくグラフエンコーダを用いてペプチドグラフを処理し、アミノ酸の3次元空間構造から重要な特徴を捉える高次元表現を生成する。
次に、SGACは、本質的に不均衡なデータセットに対処するために、最初にWeight-enhanced Contrastive Learningを組み込んだ。
さらに、SGACは重み付けされた擬似ラベル蒸留を用いて、不明瞭なペプチドの高信頼な擬似ラベルを動的に生成し、さらに予測を洗練し、AMPと非AMPのバランスの取れた学習を促進する。
公開可能なAMPデータセットと非AMPデータセットの実験では、SGACは従来のシーケンスベースの手法よりも大幅に優れ、グラフベースのモデル間で最先端のパフォーマンスを達成し、AMP分類の有効性を検証している。
関連論文リスト
- Unrolled denoising networks provably learn optimal Bayesian inference [54.79172096306631]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。
圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文 参考訳(メタデータ) (2024-09-19T17:56:16Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - HMAMP: Hypervolume-Driven Multi-Objective Antimicrobial Peptides Design [11.891046340221735]
本稿では, 抗微生物ペプチド (AMP) 設計における複数の特性を考慮したパラダイムシフトを提案する。
AMP概念のハイパーボリュームに根ざした強化学習と降下アルゴリズムの相乗化により、HMAMPは探索空間を効果的に拡張し、パターン崩壊の問題を緩和する。
10個の候補AMPに対するヘリカル構造と分子動力学シミュレーションの詳細な解析は、多目的AMP設計の領域におけるHMAMPの優位性を検証する。
論文 参考訳(メタデータ) (2024-05-01T07:17:59Z) - Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides [4.826446796830595]
本研究は、カノニカルアミノ酸からなる抗微生物ペプチド(AMP)の交流現象に対する定量的な定義およびベンチマークフレームワークAMPCliffを紹介する。
AMPCliffは、MICによってAMPの活性を定量化し、0.9を、少なくとも2倍のMIC変化を持つ一対の配列ペプチド間の正常化BLOSUM62類似度スコアの最小しきい値として定義する。
解析の結果,これらのモデルがAMP ACイベントを検出できることが明らかとなり,事前学習されたタンパク質言語モデルESM2が評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-04-15T12:40:12Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - A Non-Asymptotic Framework for Approximate Message Passing in Spiked
Models [24.786030482013437]
近似メッセージパッシング(AMP)は高次元統計問題を解くための効果的な反復パラダイムとして現れる。
それまでのAMP理論は、反復の数が$obig(fraclog nloglog nbig)$を超えると、AMP力学を予測できなかった。
本稿では,スパイク行列推定におけるAMP理解のための非漸近的枠組みを開発する。
論文 参考訳(メタデータ) (2022-08-05T17:59:06Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z) - HMD-AMP: Protein Language-Powered Hierarchical Multi-label Deep Forest
for Annotating Antimicrobial Peptides [5.61222966894307]
各種AMPデータベースからアミノ酸を収集, 洗浄することにより, 多様な多ラベルタンパク質配列データベースを構築した。
我々は、AMPを包括的にアノテートするために、エンドツーエンドの階層型多ラベル深い森林フレームワーク、HMD-AMPを開発した。
AMPを特定した後、AMPが効果的に11の利用可能なクラスから殺すことができるターゲットを予測します。
論文 参考訳(メタデータ) (2021-11-11T02:10:07Z) - PCA Initialization for Approximate Message Passing in Rotationally
Invariant Models [29.039655256171088]
主成分分析は自然推定器であり、その性能は高次元状態において急激な結果が得られた。
近年,PCAの精度を向上させる可能性のある代替推定器として,AMPアルゴリズムが提案されている。
そこで本研究では,AMPをPCAに初期化する2つの手法を組み合わせて,この推定器の性能を厳密に評価する手法を提案する。
論文 参考訳(メタデータ) (2021-06-04T09:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。