論文の概要: HMD-AMP: Protein Language-Powered Hierarchical Multi-label Deep Forest
for Annotating Antimicrobial Peptides
- arxiv url: http://arxiv.org/abs/2111.06023v1
- Date: Thu, 11 Nov 2021 02:10:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-13 00:22:13.778215
- Title: HMD-AMP: Protein Language-Powered Hierarchical Multi-label Deep Forest
for Annotating Antimicrobial Peptides
- Title(参考訳): HMD-AMP:抗微生物ペプチドのアノテートのためのタンパク質言語による階層型多層森林
- Authors: Qinze Yu, Zhihang Dong, Xingyu Fan, Licheng Zong and Yu Li
- Abstract要約: 各種AMPデータベースからアミノ酸を収集, 洗浄することにより, 多様な多ラベルタンパク質配列データベースを構築した。
我々は、AMPを包括的にアノテートするために、エンドツーエンドの階層型多ラベル深い森林フレームワーク、HMD-AMPを開発した。
AMPを特定した後、AMPが効果的に11の利用可能なクラスから殺すことができるターゲットを予測します。
- 参考スコア(独自算出の注目度): 5.61222966894307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the targets of an antimicrobial peptide is a fundamental step in
studying the innate immune response and combating antibiotic resistance, and
more broadly, precision medicine and public health. There have been extensive
studies on the statistical and computational approaches to identify (i) whether
a peptide is an antimicrobial peptide (AMP) or a non-AMP and (ii) which targets
are these sequences effective to (Gram-positive, Gram-negative, etc.). Despite
the existing deep learning methods on this problem, most of them are unable to
handle the small AMP classes (anti-insect, anti-parasite, etc.). And more
importantly, some AMPs can have multiple targets, which the previous methods
fail to consider. In this study, we build a diverse and comprehensive
multi-label protein sequence database by collecting and cleaning amino acids
from various AMP databases. To generate efficient representations and features
for the small classes dataset, we take advantage of a protein language model
trained on 250 million protein sequences. Based on that, we develop an
end-to-end hierarchical multi-label deep forest framework, HMD-AMP, to annotate
AMP comprehensively. After identifying an AMP, it further predicts what targets
the AMP can effectively kill from eleven available classes. Extensive
experiments suggest that our framework outperforms state-of-the-art models in
both the binary classification task and the multi-label classification task,
especially on the minor classes.The model is robust against reduced features
and small perturbations and produces promising results. We believe HMD-AMP
contributes to both the future wet-lab investigations of the innate structural
properties of different antimicrobial peptides and build promising empirical
underpinnings for precise medicine with antibiotics.
- Abstract(参考訳): 抗微生物ペプチドの標的を同定することは、自然免疫反応を研究し、抗生物質耐性と戦うための基本的なステップであり、より広くは精密な医療と公衆衛生である。
統計学的および計算学的アプローチの同定に関する広範な研究がなされている。
i)ペプチドが抗微生物ペプチド(AMP)であるか非AMPであるか
(二)どのターゲットがこれらの配列に有効であるか(グラム陽性、グラム陰性等)
この問題に関する既存のディープラーニングメソッドにもかかわらず、その多くは小さなAMPクラス(アンチ・インジェクト、アンチ・寄生虫など)を扱うことができません。
さらに重要なことは、いくつかのAMPは複数のターゲットを持つことができます。
本研究では, 各種AMPデータベースからアミノ酸を収集, 洗浄することにより, 多様な多ラベルタンパク質配列データベースを構築した。
小クラスデータセットの効率的な表現と特徴を生成するために、2億5000万個のタンパク質配列で訓練されたタンパク質言語モデルを利用する。
そこで我々は,AMPを包括的にアノテートするために,エンド・ツー・エンドの階層型多ラベル深い森林フレームワークであるHMD-AMPを開発した。
AMPを特定した後、AMPが効果的に11の利用可能なクラスから殺すことができるターゲットを予測します。
大規模な実験により,2進分類タスクと複数ラベル分類タスク,特にマイノリティクラスにおいて,我々のフレームワークは最先端のモデルよりも優れていることが示唆された。
HMD-AMPは、様々な抗菌ペプチドの自然構造に関するウェットラブ研究と、抗生物質による精密な医療のための有望な経験的基盤構築の両方に寄与すると考えている。
関連論文リスト
- HMAMP: Hypervolume-Driven Multi-Objective Antimicrobial Peptides Design [11.891046340221735]
本稿では, 抗微生物ペプチド (AMP) 設計における複数の特性を考慮したパラダイムシフトを提案する。
AMP概念のハイパーボリュームに根ざした強化学習と降下アルゴリズムの相乗化により、HMAMPは探索空間を効果的に拡張し、パターン崩壊の問題を緩和する。
10個の候補AMPに対するヘリカル構造と分子動力学シミュレーションの詳細な解析は、多目的AMP設計の領域におけるHMAMPの優位性を検証する。
論文 参考訳(メタデータ) (2024-05-01T07:17:59Z) - AMPCliff: quantitative definition and benchmarking of activity cliffs in antimicrobial peptides [4.826446796830595]
本研究は、カノニカルアミノ酸からなる抗微生物ペプチド(AMP)の交流現象に対する定量的な定義およびベンチマークフレームワークAMPCliffを紹介する。
AMPCliffは、MICによってAMPの活性を定量化し、0.9を、少なくとも2倍のMIC変化を持つ一対の配列ペプチド間の正常化BLOSUM62類似度スコアの最小しきい値として定義する。
解析の結果,これらのモデルがAMP ACイベントを検出できることが明らかとなり,事前学習されたタンパク質言語モデルESM2が評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-04-15T12:40:12Z) - MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction
Prediction via Microenvironment-Aware Protein Embedding [82.31506767274841]
タンパク質-プロテイン相互作用(PPI)は、様々な生物学的過程において基本的であり、生命活動において重要な役割を果たしている。
MPAE-PPIは、十分に大きな「語彙」を介して、マイクロ環境を化学的に意味のある離散コードに符号化する
MPAE-PPIは、数百万のPPIでPPI予測にスケールでき、有効性と計算効率のトレードオフが優れている。
論文 参考訳(メタデータ) (2024-02-22T09:04:41Z) - BeeTLe: A Framework for Linear B-Cell Epitope Prediction and
Classification [0.43512163406551996]
本稿では, 線形B細胞予測と抗体型特異的分類のための, 深層学習に基づく新しいフレームワークを提案する。
そこで本研究では, モデルが抗体の表現を学習するのを助けるために, 固有分解に基づくアミノ酸符号化法を提案する。
最大の公開データベースからキュレートしたデータに対する実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-09-05T09:18:29Z) - Accelerating Antimicrobial Peptide Discovery with Latent Structure [33.288514128470425]
我々は、AMP(LSSAMP)を設計するための潜在シーケンス構造モデルを提案する。
LSSAMPは二次構造を表現するために潜在空間における多スケールベクトル量子化を利用する。
実験の結果,LSSAMPにより産生されるペプチドは抗菌活性が高い可能性が示唆された。
論文 参考訳(メタデータ) (2022-11-28T06:43:32Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Graph-Based Active Machine Learning Method for Diverse and Novel
Antimicrobial Peptides Generation and Selection [57.131117785001194]
新しいAMP候補の大規模スクリーニングは高価で、時間もかかり、発展途上国では手頃な価格となっている。
本稿では,新しいAMPの設計に必要なウェットラブ実験の数を統計的に最小化する,アクティブ機械学習ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-18T14:30:48Z) - Biological Sequence Design with GFlowNets [75.1642973538266]
望ましい性質を持つデノボ生物配列の設計には、数ラウンドの分子のアイデアと高価なウェットラブ評価を伴う活性ループが伴うことが多い。
これにより、提案された候補の多様性は、構想段階において重要な考慮事項となる。
本稿では,不確実性推定と近年提案されているGFlowNetを多種多様な候補解の生成元として活用した能動的学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-02T15:53:38Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。