論文の概要: Dive into Machine Learning Algorithms for Influenza Virus Host
Prediction with Hemagglutinin Sequences
- arxiv url: http://arxiv.org/abs/2207.13842v3
- Date: Sun, 4 Feb 2024 00:44:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 07:33:14.787666
- Title: Dive into Machine Learning Algorithms for Influenza Virus Host
Prediction with Hemagglutinin Sequences
- Title(参考訳): ヘマグルチニン配列を用いたインフルエンザウイルス宿主予測のための機械学習アルゴリズム
- Authors: Yanhua Xu and Dominik Wojtczak
- Abstract要約: インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
近年,機械学習アルゴリズムによるウイルス配列の高速かつ正確な予測への関心が高まっている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
- 参考スコア(独自算出の注目度): 5.067354030054702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Influenza viruses mutate rapidly and can pose a threat to public health,
especially to those in vulnerable groups. Throughout history, influenza A
viruses have caused pandemics between different species. It is important to
identify the origin of a virus in order to prevent the spread of an outbreak.
Recently, there has been increasing interest in using machine learning
algorithms to provide fast and accurate predictions for viral sequences. In
this study, real testing data sets and a variety of evaluation metrics were
used to evaluate machine learning algorithms at different taxonomic levels. As
hemagglutinin is the major protein in the immune response, only hemagglutinin
sequences were used and represented by position-specific scoring matrix and
word embedding. The results suggest that the 5-grams-transformer neural network
is the most effective algorithm for predicting viral sequence origins, with
approximately 99.54% AUCPR, 98.01% F1 score and 96.60% MCC at a higher
classification level, and approximately 94.74% AUCPR, 87.41% F1 score and
80.79% MCC at a lower classification level.
- Abstract(参考訳): インフルエンザウイルスは急速に変異し、公衆衛生、特に脆弱な集団に脅威をもたらす可能性がある。
歴史を通じて、インフルエンザa型ウイルスは異なる種間でパンデミックを引き起こしてきた。
感染拡大を防ぐためには、ウイルスの起源を特定することが重要である。
近年,ウイルス配列の迅速かつ正確な予測に機械学習アルゴリズムの利用が注目されている。
本研究では,さまざまな分類レベルで機械学習アルゴリズムを評価するために,実検定データセットと各種評価指標を用いた。
ヘマグルチニンは免疫応答の主要なタンパク質であるため、ヘマグルチニン配列のみが用いられ、位置特異的なスコアリングマトリックスと単語埋め込みによって表現された。
その結果、5グラム変換ニューラルネットワークはウイルス配列の予測に最も有効なアルゴリズムであり、99.54%のaucpr、98.01%のf1スコア、96.60%のmcc、94.74%のaucpr、87.41%のf1スコア、80.79%のmccを低い分類レベルで予測する。
関連論文リスト
- Virus2Vec: Viral Sequence Classification Using Machine Learning [48.40285316053593]
本稿では,バイラル・シークエンスのための特徴ベクトル表現であるVrus2Vecを提案する。
コロナウイルス科の実際のスパイク配列と狂犬病ウイルスのシークエンスデータに基づいてウイルス2Vecを実験的に評価し、宿主を予測した。
以上の結果から, Virus2Vecはベースラインおよび最先端手法の予測精度よりも優れていた。
論文 参考訳(メタデータ) (2023-04-24T08:17:16Z) - PCD2Vec: A Poisson Correction Distance-Based Approach for Viral Host
Classification [0.966840768820136]
コロナウイルス(英: Coronavirus)は、コロナウイルス科に属する膜に侵入し、非分節の正鎖RNAウイルスである。
コロナウイルスゲノムにおいて、重要な構造領域はスパイク領域であり、宿主の細胞膜にウイルスを付着させる責任がある。
本研究では、異なるウイルス亜属および種からスパイクタンパク質配列を解析することにより、ウイルスの宿主特異性を予測する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-04-13T03:02:22Z) - Monkeypox virus detection using pre-trained deep learning-based
approaches [1.713291434132985]
世界中の新型コロナウイルス感染症(COVID-19)の減少に伴い、サルポックスウイルスは徐々に出現している。
広く普及する前に早期に発見することが重要である。
本稿では,モンキーポックスウイルス検出のための13種類の事前学習深層学習モデルを比較することを目的とする。
論文 参考訳(メタデータ) (2022-09-06T23:17:34Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Accurate Virus Identification with Interpretable Raman Signatures by
Machine Learning [12.184128048998906]
本稿では,ヒトおよび鳥のRamanスペクトルを機械学習で解析する手法を提案する。
スペクトルデータ用に特別に設計された畳み込みニューラルネットワーク(CNN)分類器は、様々なウイルスタイプやサブタイプの識別タスクに対して非常に高い精度を達成する。
論文 参考訳(メタデータ) (2022-06-05T22:31:14Z) - Predicting Influenza A Viral Host Using PSSM and Word Embeddings [5.067354030054702]
我々は、位置特異的スコアリング行列(PSSM)から派生した特徴を持つ様々な機械学習モデルを用いて、ウイルスの起源ホストを推測する。
その結果,PSSMモデルの性能は95%程度に達し,F1は約96%であった。
論文 参考訳(メタデータ) (2022-01-04T14:05:49Z) - Classification of Influenza Hemagglutinin Protein Sequences using
Convolutional Neural Networks [8.397189036839956]
本稿では,インフルエンザA型ウイルスが特定の宿主,具体的にはヒト,鳥,豚の宿主に感染するかどうかを,HA遺伝子のタンパク質配列のみを用いて正確に予測することに焦点を当てる。
本稿では, タンパク質配列を疎水性指数を用いて数値信号に符号化し, その後, 畳み込みニューラルネットワークに基づく予測モデルを活用することを提案する。
その結果,ヒト,鳥,豚の宿主に感染するウイルスが検出された場合,HAタンパク質配列を高い精度で識別できることがわかった。
論文 参考訳(メタデータ) (2021-08-09T10:42:26Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z) - Viral Pneumonia Screening on Chest X-ray Images Using Confidence-Aware
Anomaly Detection [86.81773672627406]
短期間のウイルス性肺炎の集団は、SARS、MERS、最近のCOVID-19のような流行やパンデミックのハービンガーである可能性がある。
胸部X線によるウイルス性肺炎の迅速かつ正確な検出は,大規模スクリーニングや流行予防に有用である。
ウイルス性肺炎はしばしば多彩な原因を持ち、X線画像に顕著な視覚的外観を示す。
論文 参考訳(メタデータ) (2020-03-27T11:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。