論文の概要: Virus2Vec: Viral Sequence Classification Using Machine Learning
- arxiv url: http://arxiv.org/abs/2304.12328v1
- Date: Mon, 24 Apr 2023 08:17:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 23:14:56.422412
- Title: Virus2Vec: Viral Sequence Classification Using Machine Learning
- Title(参考訳): Virus2Vec: 機械学習を用いたウイルス配列分類
- Authors: Sarwan Ali, Babatunde Bello, Prakash Chourasia, Ria Thazhe Punathil,
Pin-Yu Chen, Imdad Ullah Khan, Murray Patterson
- Abstract要約: 本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
- 参考スコア(独自算出の注目度): 48.40285316053593
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the host-specificity of different families of viruses sheds
light on the origin of, e.g., SARS-CoV-2, rabies, and other such zoonotic
pathogens in humans. It enables epidemiologists, medical professionals, and
policymakers to curb existing epidemics and prevent future ones promptly. In
the family Coronaviridae (of which SARS-CoV-2 is a member), it is well-known
that the spike protein is the point of contact between the virus and the host
cell membrane. On the other hand, the two traditional mammalian orders,
Carnivora (carnivores) and Chiroptera (bats) are recognized to be responsible
for maintaining and spreading the Rabies Lyssavirus (RABV). We propose
Virus2Vec, a feature-vector representation for viral (nucleotide or amino acid)
sequences that enable vector-space-based machine learning models to identify
viral hosts. Virus2Vec generates numerical feature vectors for unaligned
sequences, allowing us to forego the computationally expensive sequence
alignment step from the pipeline. Virus2Vec leverages the power of both the
\emph{minimizer} and position weight matrix (PWM) to generate compact feature
vectors. Using several classifiers, we empirically evaluate Virus2Vec on
real-world spike sequences of Coronaviridae and rabies virus sequence data to
predict the host (identifying the reservoirs of infection). Our results
demonstrate that Virus2Vec outperforms the predictive accuracies of baseline
and state-of-the-art methods.
- Abstract(参考訳): 異なるウイルスファミリーの宿主特異性を理解することは、SARS-CoV-2、狂犬病、その他の動物病原体の起源に光を当てる。
疫学者、医療専門家、政策立案者が既存の流行を抑え、将来の流行を早急に防ぐことができる。
コロナウイルス科(sars-cov-2が属する)では、スパイクタンパク質がウイルスと宿主細胞膜との接触点であることが知られている。
一方、伝統的な哺乳動物であるcarnivora(肉食動物)とchiroptera(コウモリ)の2種は、狂犬病ライサウイルス(rabv)の維持と拡散の責任があると認識されている。
virus2vecは、ウイルス(ヌクレオチドまたはアミノ酸)配列のための特徴ベクトル表現であり、ベクタースペースベースの機械学習モデルがウイルスホストを識別できるようにする。
virus2vecはアンアライメントシーケンスのための数値的特徴ベクトルを生成し、パイプラインから計算コストの高いシーケンスアライメントステップを先取りできます。
Virus2Vec は \emph{minimizer} と位置重み行列 (PWM) の両方のパワーを利用してコンパクトな特徴ベクトルを生成する。
複数の分類器を用いて,本種と狂犬病ウイルスのスパイク配列に基づくウイルス2vecを実験的に評価し,宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
関連論文リスト
- Opponent Shaping for Antibody Development [49.26728828005039]
抗ウイルス療法は通常、ウイルスの現在の株のみを標的とするように設計されている。
治療によって誘導される選択的圧力はウイルスに作用し、変異株の出現を誘導し、初期治療が効果を低下させる。
我々は、ウイルスの進化的脱出の遺伝的シミュレーションを実装するために、抗体とウイルス抗原の結合の計算モデルを構築した。
論文 参考訳(メタデータ) (2024-09-16T14:56:27Z) - A Conditional Flow Variational Autoencoder for Controllable Synthesis of
Virtual Populations of Anatomy [76.20367415712867]
本稿では,正規化フローを用いた条件付き変分オートエンコーダ(cVAE)を提案する。
2360例の心左心室データを用いた条件流VAEの性能について検討した。
論文 参考訳(メタデータ) (2023-06-26T13:23:52Z) - PCD2Vec: A Poisson Correction Distance-Based Approach for Viral Host
Classification [0.966840768820136]
コロナウイルス(英: Coronavirus)は、コロナウイルス科に属する膜に侵入し、非分節の正鎖RNAウイルスである。
コロナウイルスゲノムにおいて、重要な構造領域はスパイク領域であり、宿主の細胞膜にウイルスを付着させる責任がある。
本研究では、異なるウイルス亜属および種からスパイクタンパク質配列を解析することにより、ウイルスの宿主特異性を予測する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-04-13T03:02:22Z) - Dense Feature Memory Augmented Transformers for COVID-19 Vaccination
Search Classification [60.49594822215981]
本稿では,新型コロナウイルスワクチン関連検索クエリの分類モデルを提案する。
本稿では,モデルが対応可能なメモリトークンとして,高密度特徴を考慮した新しい手法を提案する。
この新しいモデリング手法により,Vaccine Search Insights (VSI) タスクを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-12-16T13:57:41Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Accurate Virus Identification with Interpretable Raman Signatures by
Machine Learning [12.184128048998906]
本稿では,ヒトおよび鳥のRamanスペクトルを機械学習で解析する手法を提案する。
スペクトルデータ用に特別に設計された畳み込みニューラルネットワーク(CNN)分類器は、様々なウイルスタイプやサブタイプの識別タスクに対して非常に高い精度を達成する。
論文 参考訳(メタデータ) (2022-06-05T22:31:14Z) - PWM2Vec: An Efficient Embedding Approach for Viral Host Specification
from Coronavirus Spike Sequences [0.7340017786387767]
我々は、致命的なウイルスのキャリアや送信者になりうる異なる宿主について研究する。
ウイルスでは、表面(S)タンパク質(スパイクタンパク質)が宿主の特異性を決定する重要な部分である。
我々は、よく知られた位置重み行列(PWM)に基づく特徴埋め込みを提案し、ウイルスのスパイクタンパク質配列から特徴ベクトルを生成する。
論文 参考訳(メタデータ) (2022-01-06T23:25:54Z) - Effective and scalable clustering of SARS-CoV-2 sequences [0.41998444721319206]
SARS-CoV-2は進化過程に従って変異し続けている。
GISAIDなどの公開データベースで現在利用可能なSARS-CoV-2のシーケンス数は数百万である。
本稿では,現在のSARS-CoV-2変種をクラスタリングシーケンスに基づいて同定する手法を提案する。
論文 参考訳(メタデータ) (2021-08-18T13:32:43Z) - Towards Interpreting Zoonotic Potential of Betacoronavirus Sequences
With Attention [17.406451433347527]
注意喚起型長期記憶(LSTM)深部神経網分類器を高度に保存したウイルスタンパク質ターゲットに適用し,βコロナウイルスの動物性電位を予測する。
解析と構造レベルでの注意の可視化は、動物性ベータコロナウイルスのウイルス複製を司る重要なタンパク質とタンパク質の相互作用と動物性感染との関係を示唆している。
論文 参考訳(メタデータ) (2021-08-18T10:11:11Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。