論文の概要: Prediction of Hemolysis Tendency of Peptides using a Reliable Evaluation
Method
- arxiv url: http://arxiv.org/abs/2012.06470v1
- Date: Fri, 11 Dec 2020 16:40:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 05:50:25.468821
- Title: Prediction of Hemolysis Tendency of Peptides using a Reliable Evaluation
Method
- Title(参考訳): 信頼性評価法によるペプチドの溶血傾向の予測
- Authors: Ali Raza, Hafiz Saud Arshad
- Abstract要約: あるペプチッドはペプチッドの低い代謝の安定性、高い毒性および高いhemolityをもたらすことができます。
従来のペプチドの毒性評価法は、時間と費用がかかる。
ペプチドの溶血傾向予測のための機械学習に基づく手法を提案する。
- 参考スコア(独自算出の注目度): 3.110575781525886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There are numerous peptides discovered through past decades, which exhibit
antimicrobial and anti-cancerous tendencies. Due to these reasons, peptides are
supposed to be sound therapeutic candidates. Some peptides can pose low
metabolic stability, high toxicity and high hemolity of peptides. This
highlights the importance for evaluating hemolytic tendencies and toxicity of
peptides, before using them for therapeutics. Traditional methods for
evaluation of toxicity of peptides can be time-consuming and costly. In this
study, we have extracted peptides data (Hemo-DB) from Database of Antimicrobial
Activity and Structure of Peptides (DBAASP) based on certain hemolity criteria
and we present a machine learning based method for prediction of hemolytic
tendencies of peptides (i.e. Hemolytic or Non-Hemolytic). Our model offers
significant improvement on hemolity prediction benchmarks. we also propose a
reliable clustering-based train-tests splitting method which ensures that no
peptide in train set is more than 40% similar to any peptide in test set. Using
this train-test split, we can get reliable estimated of expected model
performance on unseen data distribution or newly discovered peptides. Our model
tests 0.9986 AUC-ROC (Area Under Receiver Operating Curve) and 97.79% Accuracy
on test set of Hemo-DB using traditional random train-test splitting method.
Moreover, our model tests AUC-ROC of 0.997 and Accuracy of 97.58% while using
clustering-based train-test data split. Furthermore, we check our model on an
unseen data distribution (at Hemo-PI 3) and we recorded 0.8726 AUC-ROC and
79.5% accuracy. Using the proposed method, potential therapeutic peptides can
be screened, which may further in therapeutics and get reliable predictions for
unseen amino acids distribution of peptides and newly discovered peptides.
- Abstract(参考訳): 過去数十年間、多くのペプチドが発見され、抗菌性や抗癌性を示す。
これらの理由から、ペプチドは適切な治療候補であると考えられている。
一部のペプチドは代謝安定性が低く、毒性が高く、ペプチドのヘモリティが高い。
これは、治療に使用する前に、ペプチドの溶血傾向や毒性を評価することの重要性を強調している。
従来のペプチドの毒性評価法は、時間と費用がかかる。
本研究では,特定の血液量基準に基づく抗菌活性およびペプチド構造データベース(dbaasp)からペプチドデータ(hemo-db)を抽出し,ペプチドの溶血傾向予測のための機械学習手法(すなわち,ペプチドの溶血傾向予測法)を提案する。
溶血性または非溶血性)。
我々のモデルは、ヘモリティ予測ベンチマークを著しく改善する。
また,テストセット内のペプチドが試験セットのどのペプチドと40%以上類似していないことを保証する,信頼性の高いクラスタリングに基づくトレインテスト分割法を提案する。
このトレインテストスプリットを用いて、未知のデータ分布や新たに発見されたペプチドの予測モデル性能を推定できる。
本モデルでは,従来のランダムトレインテスト分割法を用いて,0.9986 auc-rocと97.79%のhemo-dbテストセットの精度をテストした。
さらに,クラスタリングベースの列車試験データ分割を用いて,0.997のAUC-ROCと97.58%の精度で実験を行った。
さらに,不明瞭なデータ分布(Hemo-PI3)のモデルを確認し,0.8726 AUC-ROCと79.5%の精度を記録した。
提案法では, ペプチドおよび新規に発見されたペプチドの未沈アミノ酸分布を予測し, さらなる治療効果が期待できる治療ペプチドのスクリーニングが可能となる。
関連論文リスト
- Multi-Peptide: Multimodality Leveraged Language-Graph Learning of Peptide Properties [5.812284760539713]
Multi-Peptideは、トランスフォーマーベースの言語モデルとグラフニューラルネットワーク(GNN)を組み合わせてペプチドの性質を予測する革新的なアプローチである。
溶血性データセットおよび非汚泥性データセットの評価は、多ペプチドの堅牢性を示し、溶血性予測における最先端86.185%の精度を達成する。
本研究は, 生体情報学におけるマルチモーダル学習の可能性を強調し, ペプチドを用いた研究・応用における正確かつ信頼性の高い予測方法を模索する。
論文 参考訳(メタデータ) (2024-07-02T20:13:47Z) - NovoBench: Benchmarking Deep Learning-based De Novo Peptide Sequencing Methods in Proteomics [58.03989832372747]
Emphde novoペプチドシークエンシングのための初となるNovoBenchベンチマークを報告する。
多様な質量スペクトルデータ、統合モデル、総合的な評価指標から構成される。
DeepNovo、PointNovo、Casanovo、InstaNovo、AdaNovo、$pi$-HelixNovoといった最近の手法が私たちのフレームワークに統合されています。
論文 参考訳(メタデータ) (2024-06-16T08:23:21Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - PepGB: Facilitating peptide drug discovery via graph neural networks [36.744839520938825]
ペプチド-タンパク質相互作用(PepPIs)を予測することにより、ペプチドの早期発見を容易にする深層学習フレームワークPepGBを提案する。
我々は、リード生成と最適化プロセスでよく見られる高度に不均衡なデータのモデリングのボトルネックに取り組むために、拡張バージョンの diPepGB を導出する。
論文 参考訳(メタデータ) (2024-01-26T06:13:09Z) - Prediction of MET Overexpression in Non-Small Cell Lung Adenocarcinomas
from Hematoxylin and Eosin Images [0.4306805601880342]
MET蛋白過剰発現は非小細胞肺癌(NSCLC)において標的となる
デジタルヘマトキシリンとエオシン(H&E)のスライスを用いてMET過剰発現を予測するプレスクリーニングアルゴリズムの開発は、最も恩恵を受ける人のためのテストを促進する。
論文 参考訳(メタデータ) (2023-10-11T17:32:24Z) - pLMFPPred: a novel approach for accurate prediction of functional
peptides integrating embedding from pre-trained protein language model and
imbalanced learning [7.5449239162950965]
pLPredは、機能性ペプチドを予測し、有毒ペプチドを同定するためのツールである。
検証された独立テストセットでは、pLPredは精度、曲線下エリア - 受信者動作特性、F1スコア値はそれぞれ0.974、0.99、0.974が達成された。
論文 参考訳(メタデータ) (2023-09-25T17:57:39Z) - An Efficient Consolidation of Word Embedding and Deep Learning
Techniques for Classifying Anticancer Peptides: FastText+BiLSTM [0.0]
抗がんペプチド(英語: Anticancer peptides、ACP)は、より高い選択性と安全性を有するペプチドである。
近年の科学的進歩はペプチドベースの治療法への関心を生んでいる。
ACPは、正常な細胞に悪影響を及ぼすことなく、目的の細胞を効率的に治療する利点を提供する。
論文 参考訳(メタデータ) (2023-09-21T13:25:11Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。