論文の概要: AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides
- arxiv url: http://arxiv.org/abs/2404.09738v2
- Date: Sun, 03 Nov 2024 11:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 21:26:16.170318
- Title: AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides
- Title(参考訳): AMPCliff:抗微生物ペプチドの活性崖の定量的定義とベンチマーク
- Authors: Kewei Li, Yuqian Wu, Yinheng Li, Yutong Guo, Yan Wang, Yiyang Liang, Yusi Fan, Lan Huang, Ruochi Zhang, Fengfeng Zhou,
- Abstract要約: 本研究は、カノニカルアミノ酸からなる抗微生物ペプチド(AMP)の交流現象に対する定量的な定義およびベンチマークフレームワークAMPCliffを紹介する。
AMPCliffは、MICによってAMPの活性を定量化し、0.9を、少なくとも2倍のMIC変化を持つ一対の配列ペプチド間の正常化BLOSUM62類似度スコアの最小しきい値として定義する。
解析の結果,これらのモデルがAMP ACイベントを検出できることが明らかとなり,事前学習されたタンパク質言語モデルESM2が評価において優れた性能を示した。
- 参考スコア(独自算出の注目度): 4.826446796830595
- License:
- Abstract: Since the mechanism of action of drug molecules in the human body is difficult to reproduce in the in vitro environment, it becomes difficult to reveal the causes of the activity cliff phenomenon of drug molecules. We found out the AC of small molecules has been extensively investigated but limited knowledge is accumulated about the AC phenomenon in peptides with canonical amino acids. Understanding the mechanism of AC in canonical amino acids might help understand the one in drug molecules. This study introduces a quantitative definition and benchmarking framework AMPCliff for the AC phenomenon in antimicrobial peptides (AMPs) composed by canonical amino acids. A comprehensive analysis of the existing AMP dataset reveals a significant prevalence of AC within AMPs. AMPCliff quantifies the activities of AMPs by the MIC, and defines 0.9 as the minimum threshold for the normalized BLOSUM62 similarity score between a pair of aligned peptides with at least two-fold MIC changes. This study establishes a benchmark dataset of paired AMPs in Staphylococcus aureus from the publicly available AMP dataset GRAMPA, and conducts a rigorous procedure to evaluate various AMP AC prediction models, including nine machine learning, four deep learning algorithms, four masked language models, and four generative language models. Our analysis reveals that these models are capable of detecting AMP AC events and the pre-trained protein language model ESM2 demonstrates superior performance across the evaluations. The predictive performance of AMP activity cliffs remains to be further improved, considering that ESM2 with 33 layers only achieves the Spearman correlation coefficient 0.4669 for the regression task of the MIC values on the benchmark dataset. Source code and additional resources are available at https://www.healthinformaticslab.org/supp/ or https://github.com/Kewei2023/AMPCliff-generation.
- Abstract(参考訳): ヒト体内における薬物分子の作用機構はin vitro環境下での再現が困難であるため、薬物分子の活性崖現象の原因を明らかにすることは困難である。
小分子の交流は広く研究されているが、カノニカルアミノ酸を有するペプチドの交流現象について限られた知識が蓄積されている。
標準アミノ酸中のACのメカニズムを理解することは、薬物分子中のACを理解するのに役立つかもしれない。
本研究は、カノニカルアミノ酸からなる抗微生物ペプチド(AMP)の交流現象に対する定量的な定義およびベンチマークフレームワークAMPCliffを紹介する。
既存のAMPデータセットの包括的解析により、AMP内のACの有意な頻度が明らかとなった。
AMPCliffは、MICによってAMPの活性を定量化し、0.9を、少なくとも2倍のMIC変化を持つ一対の配列ペプチド間の正常化BLOSUM62類似度スコアの最小しきい値として定義する。
本研究では, 一般に公開されている AMP データセット GRAMPA から Staphylococcus aureus のペア AMP のベンチマークデータセットを確立し, 9 つの機械学習, 4 つのディープラーニングアルゴリズム, 4 つのマスク付き言語モデル, 4 つの生成言語モデルを含む様々な AMP AC 予測モデルを評価するための厳密な手順を実行する。
解析の結果,これらのモデルではAMP AC イベントの検出が可能であり,事前学習されたタンパク質言語モデル ESM2 は評価において優れた性能を示した。
ベンチマークデータセット上のMIC値の回帰タスクに対して,33層のESM2がスピアマン相関係数0.4669しか達成できないことを考えると,AMP活動崖の予測性能は改善されていない。
ソースコードと追加リソースは、https://www.healthinformaticslab.org/supp/またはhttps://github.com/Kewei2023/AMPCliff-generationで入手できる。
関連論文リスト
- Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - HMAMP: Hypervolume-Driven Multi-Objective Antimicrobial Peptides Design [11.891046340221735]
本稿では, 抗微生物ペプチド (AMP) 設計における複数の特性を考慮したパラダイムシフトを提案する。
AMP概念のハイパーボリュームに根ざした強化学習と降下アルゴリズムの相乗化により、HMAMPは探索空間を効果的に拡張し、パターン崩壊の問題を緩和する。
10個の候補AMPに対するヘリカル構造と分子動力学シミュレーションの詳細な解析は、多目的AMP設計の領域におけるHMAMPの優位性を検証する。
論文 参考訳(メタデータ) (2024-05-01T07:17:59Z) - Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE [1.3597551064547502]
変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。
本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
論文 参考訳(メタデータ) (2023-08-24T20:22:22Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Accelerating Antimicrobial Peptide Discovery with Latent Structure [33.288514128470425]
我々は、AMP(LSSAMP)を設計するための潜在シーケンス構造モデルを提案する。
LSSAMPは二次構造を表現するために潜在空間における多スケールベクトル量子化を利用する。
実験の結果,LSSAMPにより産生されるペプチドは抗菌活性が高い可能性が示唆された。
論文 参考訳(メタデータ) (2022-11-28T06:43:32Z) - Graph-Based Active Machine Learning Method for Diverse and Novel
Antimicrobial Peptides Generation and Selection [57.131117785001194]
新しいAMP候補の大規模スクリーニングは高価で、時間もかかり、発展途上国では手頃な価格となっている。
本稿では,新しいAMPの設計に必要なウェットラブ実験の数を統計的に最小化する,アクティブ機械学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-18T14:30:48Z) - Robust Quantitative Susceptibility Mapping via Approximate Message
Passing with Parameter Estimation [14.22930572798757]
本稿では,パラメータ推定を組み込んだ定量的感受性マッピング(QSM)の確率的ベイズ的手法を提案する。
Sim2Snr1データセットでは、AMP-PEは最低のNRMSE、DFCM、最高のSSIMを達成した。
生体内データセットでは、AMP-PEは頑健であり、推定パラメータを用いて感受性マップの復元に成功した。
論文 参考訳(メタデータ) (2022-07-29T14:38:03Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - HMD-AMP: Protein Language-Powered Hierarchical Multi-label Deep Forest
for Annotating Antimicrobial Peptides [5.61222966894307]
各種AMPデータベースからアミノ酸を収集, 洗浄することにより, 多様な多ラベルタンパク質配列データベースを構築した。
我々は、AMPを包括的にアノテートするために、エンドツーエンドの階層型多ラベル深い森林フレームワーク、HMD-AMPを開発した。
AMPを特定した後、AMPが効果的に11の利用可能なクラスから殺すことができるターゲットを予測します。
論文 参考訳(メタデータ) (2021-11-11T02:10:07Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。