論文の概要: A k-mer Based Approach for SARS-CoV-2 Variant Identification
- arxiv url: http://arxiv.org/abs/2108.03465v1
- Date: Sat, 7 Aug 2021 15:08:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 12:14:41.345322
- Title: A k-mer Based Approach for SARS-CoV-2 Variant Identification
- Title(参考訳): k-merによるSARS-CoV-2変数同定
- Authors: Sarwan Ali, Bikram Sahoo, Naimat Ullah, Alexander Zelikovskiy, Murray
Patterson, Imdadullah Khan
- Abstract要約: アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
- 参考スコア(独自算出の注目度): 55.78588835407174
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: With the rapid spread of the novel coronavirus (COVID-19) across the globe
and its continuous mutation, it is of pivotal importance to design a system to
identify different known (and unknown) variants of SARS-CoV-2. Identifying
particular variants helps to understand and model their spread patterns, design
effective mitigation strategies, and prevent future outbreaks. It also plays a
crucial role in studying the efficacy of known vaccines against each variant
and modeling the likelihood of breakthrough infections. It is well known that
the spike protein contains most of the information/variation pertaining to
coronavirus variants.
In this paper, we use spike sequences to classify different variants of the
coronavirus in humans. We show that preserving the order of the amino acids
helps the underlying classifiers to achieve better performance. We also show
that we can train our model to outperform the baseline algorithms using only a
small number of training samples ($1\%$ of the data). Finally, we show the
importance of the different amino acids which play a key role in identifying
variants and how they coincide with those reported by the USA's Centers for
Disease Control and Prevention (CDC).
- Abstract(参考訳): 新型コロナウイルス(COVID-19)が世界中に急速に広まり、継続的な突然変異が続く中、SARS-CoV-2の様々な変種(および未知)を識別するシステムを設計することが重要である。
特定の変種を特定することは、その拡散パターンを理解し、モデル化し、効果的な緩和戦略を設計し、将来のアウトブレイクを防ぐのに役立つ。
また、既知のワクチンのそれぞれの変異に対する有効性の研究や、ブレイクスルー感染の可能性をモデル化する上で重要な役割を担っている。
スパイクタンパク質は、新型コロナウイルスの変異に関連する情報や変数のほとんどを含んでいることが知られている。
本稿では,ヒトにおけるウイルスの異なる変異の分類にスパイク配列を用いる。
アミノ酸のオーダーを保存することが,下位の分類器の性能向上に寄与することを示す。
また、少数のトレーニングサンプル(データの1〜%$)のみを使用して、ベースラインアルゴリズムを上回るようにモデルをトレーニングできることも示しています。
最後に,変異体同定に重要な役割を果たす異なるアミノ酸の重要性と,米国疾病予防管理センター(cdc)の報告とどのように一致するかを示す。
関連論文リスト
- Towards Within-Class Variation in Alzheimer's Disease Detection from Spontaneous Speech [60.08015780474457]
アルツハイマー病(AD)の検出は、機械学習の分類モデルを使用する有望な研究領域として浮上している。
我々は、AD検出において、クラス内変異が重要な課題であると考え、ADを持つ個人は認知障害のスペクトルを示す。
本稿では,ソフトターゲット蒸留 (SoTD) とインスタンスレベルの再分散 (InRe) の2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-22T02:06:05Z) - Agent-Based Model: Simulating a Virus Expansion Based on the Acceptance
of Containment Measures [65.62256987706128]
比較疫学モデルは、疾患の状態に基づいて個人を分類する。
我々は、適応されたSEIRDモデルと市民のための意思決定モデルを組み合わせたABMアーキテクチャを提案する。
スペイン・ア・コルナにおけるSARS-CoV-2感染症の進行状況について検討した。
論文 参考訳(メタデータ) (2023-07-28T08:01:05Z) - Efficient Classification of SARS-CoV-2 Spike Sequences Using Federated
Learning [4.497217246897902]
データ共有なしでSARS-CoV-2スパイクシーケンスを分散解析する。
我々は、新型コロナウイルスの変種識別タスクにおいて、全体的な精度を93%の精度で達成した。
我々は、この概念実証を利用して、プライバシ保護パンデミック対応戦略を実装する予定です。
論文 参考訳(メタデータ) (2023-02-17T04:41:39Z) - Dense Feature Memory Augmented Transformers for COVID-19 Vaccination
Search Classification [60.49594822215981]
本稿では,新型コロナウイルスワクチン関連検索クエリの分類モデルを提案する。
本稿では,モデルが対応可能なメモリトークンとして,高密度特徴を考慮した新しい手法を提案する。
この新しいモデリング手法により,Vaccine Search Insights (VSI) タスクを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-12-16T13:57:41Z) - Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19 [1.5346017713894948]
新型コロナウイルスの感染拡大は、ウイルスの突然変異率の高さから急速に進展した。
デルタやオミクロンのような一部のウイルスは、ウイルスの性質が変化し、感染や死亡率に繋がった。
教師なしの機械学習手法は、非ラベルデータの圧縮、キャラクタリゼーション、可視化を行うことができる。
論文 参考訳(メタデータ) (2022-08-01T13:02:28Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Using Deep Learning Sequence Models to Identify SARS-CoV-2 Divergence [1.9573380763700707]
SARS-CoV-2は上層呼吸器系RNAウイルスで、2021年5月時点で300万人以上が死亡し、全世界で1億5000万人以上が感染している。
本稿では、繰り返しおよび畳み込み単位を利用してスパイクタンパク質のアミノ酸配列を取り込み、対応するクレードを分類するニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2021-11-12T07:52:11Z) - Robust Representation and Efficient Feature Selection Allows for
Effective Clustering of SARS-CoV-2 Variants [0.0]
SARS-CoV-2ウイルスは異なる変種を含み、それぞれ異なる変異を持つ。
SARS-CoV-2ゲノムの変異の多くは、ゲノム配列のスパイク領域で不均等に起こる。
本研究では,異なる既知の変異体の挙動を研究するために,スパイクタンパク質配列をクラスタ化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T21:18:52Z) - Effective and scalable clustering of SARS-CoV-2 sequences [0.41998444721319206]
SARS-CoV-2は進化過程に従って変異し続けている。
GISAIDなどの公開データベースで現在利用可能なSARS-CoV-2のシーケンス数は数百万である。
本稿では,現在のSARS-CoV-2変種をクラスタリングシーケンスに基づいて同定する手法を提案する。
論文 参考訳(メタデータ) (2021-08-18T13:32:43Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。