論文の概要: PCD2Vec: A Poisson Correction Distance-Based Approach for Viral Host
Classification
- arxiv url: http://arxiv.org/abs/2304.06731v1
- Date: Thu, 13 Apr 2023 03:02:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 15:49:35.975996
- Title: PCD2Vec: A Poisson Correction Distance-Based Approach for Viral Host
Classification
- Title(参考訳): PCD2Vec:ウイルス宿主分類のためのポアソン補正距離に基づくアプローチ
- Authors: Sarwan Ali, Taslim Murad, Murray Patterson
- Abstract要約: コロナウイルス(英: Coronavirus)は、コロナウイルス科に属する膜に侵入し、非分節の正鎖RNAウイルスである。
コロナウイルスゲノムにおいて、重要な構造領域はスパイク領域であり、宿主の細胞膜にウイルスを付着させる責任がある。
本研究では、異なるウイルス亜属および種からスパイクタンパク質配列を解析することにより、ウイルスの宿主特異性を予測する新しい方法を提案する。
- 参考スコア(独自算出の注目度): 0.966840768820136
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coronaviruses are membrane-enveloped, non-segmented positive-strand RNA
viruses belonging to the Coronaviridae family. Various animal species, mainly
mammalian and avian, are severely infected by various coronaviruses, causing
serious concerns like the recent pandemic (COVID-19). Therefore, building a
deeper understanding of these viruses is essential to devise prevention and
mitigation mechanisms. In the Coronavirus genome, an essential structural
region is the spike region, and it's responsible for attaching the virus to the
host cell membrane. Therefore, the usage of only the spike protein, instead of
the full genome, provides most of the essential information for performing
analyses such as host classification. In this paper, we propose a novel method
for predicting the host specificity of coronaviruses by analyzing spike protein
sequences from different viral subgenera and species. Our method involves using
the Poisson correction distance to generate a distance matrix, followed by
using a radial basis function (RBF) kernel and kernel principal component
analysis (PCA) to generate a low-dimensional embedding. Finally, we apply
classification algorithms to the low-dimensional embedding to generate the
resulting predictions of the host specificity of coronaviruses. We provide
theoretical proofs for the non-negativity, symmetry, and triangle inequality
properties of the Poisson correction distance metric, which are important
properties in a machine-learning setting. By encoding the spike protein
structure and sequences using this comprehensive approach, we aim to uncover
hidden patterns in the biological sequences to make accurate predictions about
host specificity. Finally, our classification results illustrate that our
method can achieve higher predictive accuracy and improve performance over
existing baselines.
- Abstract(参考訳): ウイルスは膜を包み込み、コロナウイルス科に属する正のストランドrnaウイルスである。
様々な動物種(主に哺乳類と鳥類)が、さまざまなウイルスに感染し、最近のパンデミック(COVID-19)のような深刻な懸念を引き起こしている。
したがって、これらのウイルスをより深く理解することは、予防と緩和のメカニズムを考案するのに不可欠である。
コロナウイルスゲノムにおいて、重要な構造領域はスパイク領域であり、宿主の細胞膜にウイルスを付着させる責任がある。
したがって、全ゲノムの代わりにスパイクタンパク質のみを使用することは、宿主分類のような分析を行うための重要な情報の大部分を提供する。
本稿では、異なるウイルス亜属および種からのスパイクタンパク質配列を解析し、ウイルスの宿主特異性を予測する新しい方法を提案する。
提案手法では,ポアソン補正距離を用いて距離行列を生成し,次いでラジアル基底関数(RBF)カーネルとカーネル主成分分析(PCA)を用いて低次元埋め込みを生成する。
最後に,ウイルスの宿主特異性の予測結果を生成するために,低次元埋め込みに分類アルゴリズムを適用した。
本研究では,ポアソン補正距離計量の非ネガティビティ性,対称性,三角不等式の性質を理論的に証明する。
この包括的アプローチを用いてスパイクタンパク質の構造と配列をコードすることにより、生物配列の隠れたパターンを解明し、宿主特異性を正確に予測することを目指している。
最後に,本手法によって予測精度が向上し,既存のベースラインよりも性能が向上することを示す。
関連論文リスト
- Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - ViralVectors: Compact and Scalable Alignment-free Virome Feature
Generation [0.7874708385247353]
SARS-CoV-2のシークエンシングデータの量は、どのウイルスよりも数桁大きい。
本稿では,効率的な下流解析が可能なビロメシークエンシングデータからコンパクトなベクトル生成であるEmphsignaturesを提案する。
論文 参考訳(メタデータ) (2023-04-06T06:46:17Z) - Evaluating COVID-19 Sequence Data Using Nearest-Neighbors Based Network
Model [0.0]
SARS-CoV-2(SARS-CoV-2)は、ヒトの新型コロナウイルス感染症の原因である。
異なる宿主に適応し、異なる系統に進化することができる。
主要なSARS-CoV-2系統はスパイクタンパク質で主に起こる突然変異によって特徴づけられることが知られている。
論文 参考訳(メタデータ) (2022-11-19T00:34:02Z) - Efficient Approximate Kernel Based Spike Sequence Classification [56.2938724367661]
SVMのような機械学習モデルは、シーケンスのペア間の距離/相似性の定義を必要とする。
厳密な手法により分類性能は向上するが、計算コストが高い。
本稿では,その予測性能を向上させるために,近似カーネルの性能を改善する一連の方法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:44:19Z) - Dive into Machine Learning Algorithms for Influenza Virus Host Prediction with Hemagglutinin Sequences [4.289396744209968]
インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
論文 参考訳(メタデータ) (2022-07-28T00:54:54Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Transfer Learning for Protein Structure Classification at Low Resolution [124.5573289131546]
タンパク質のクラスとアーキテクチャの正確な(geq$80%)予測を、低い(leq$3A)解像度で決定された構造から行うことができることを示す。
本稿では, 高速で低コストなタンパク質構造を低解像度で分類するための概念実証と, 機能予測への拡張の基礎を提供する。
論文 参考訳(メタデータ) (2020-08-11T15:01:32Z) - Statistical Linear Models in Virus Genomic Alignment-free Classification: Application to Hepatitis C Viruses [2.900522306460408]
本研究は, 遺伝子タイピングおよび部分的および完全ゲノムのサブタイプにおける線形分類器の力について検討した。
C型肝炎ウイルス(HCV)に応用される。
全体として、いくつかの分類器は実験変数の正確な組み合わせのセットを与えられた上でうまく機能する。
論文 参考訳(メタデータ) (2019-10-11T21:40:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。