論文の概要: SARS-Cov-2 RNA Sequence Classification Based on Territory Information
- arxiv url: http://arxiv.org/abs/2101.03323v1
- Date: Sat, 9 Jan 2021 09:12:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 07:20:25.166318
- Title: SARS-Cov-2 RNA Sequence Classification Based on Territory Information
- Title(参考訳): SARS-Cov-2領域情報に基づくRNA配列分類
- Authors: Jingwei Liu
- Abstract要約: SARS-Cov-2 RNA分類タスクは、GISAIDデータベースに基づいて構築される。
中国の3クラス分類では、Top-1の精度は82.45%に達する。
中国の2級分類では、トップ1の精度率は97.35%に達する。
- 参考スコア(独自算出の注目度): 4.460480217653875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CovID-19 genetics analysis is critical to determine virus type,virus variant
and evaluate vaccines. In this paper, SARS-Cov-2 RNA sequence analysis relative
to region or territory is investigated. A uniform framework of sequence SVM
model with various genetics length from short to long and mixed-bases is
developed by projecting SARS-Cov-2 RNA sequence to different dimensional space,
then scoring it according to the output probability of pre-trained SVM models
to explore the territory or origin information of SARS-Cov-2. Different sample
size ratio of training set and test set is also discussed in the data analysis.
Two SARS-Cov-2 RNA classification tasks are constructed based on GISAID
database, one is for mainland, Hongkong and Taiwan of China, and the other is a
6-class classification task (Africa, Asia, Europe, North American, South
American\& Central American, Ocean) of 7 continents. For 3-class classification
of China, the Top-1 accuracy rate can reach 82.45\% (train 60\%, test=40\%);
For 2-class classification of China, the Top-1 accuracy rate can reach 97.35\%
(train 80\%, test 20\%); For 6-class classification task of world, when the
ratio of training set and test set is 20\% : 80\% , the Top-1 accuracy rate can
achieve 30.30\%. And, some Top-N results are also given.
- Abstract(参考訳): CovID-19遺伝子解析はウイルスの種類、ウイルスの変異、ワクチンの評価に重要である。
本稿では,SARS-Cov-2 RNA配列の解析を行った。
SARS-Cov-2RNA配列を異なる次元空間に投影し,SARS-Cov-2の領域や起源情報を探索するために事前学習したSVMモデルの出力確率に応じて評価することにより,短・長・混合塩基間の遺伝的長の均一な配列SVMモデルを構築する。
データ分析では、トレーニングセットとテストセットの異なるサンプルサイズ比についても論じる。
2つのSARS-Cov-2RNA分類タスクは、GISAIDデータベースに基づいて構築されており、1つは本土、香港、台湾で、もう1つは7大陸の6クラス分類タスク(アフリカ、アジア、ヨーロッパ、北アメリカ、南アメリカ、中央アメリカ、海洋)である。
中国の3級分類では、Top-1精度率は82.45 %(列車60 %、試験=40 %)、中国の2級分類では97.35 %(列車80 %、試験20 %)、世界の6級分類では、トレーニングセットとテストセットの比率が20 %:80 %である場合、Top-1精度は30.30 %に達する。
また、Top-Nの結果もある。
関連論文リスト
- Assessing Concordance between RNA-Seq and NanoString Technologies in Ebola-Infected Nonhuman Primates Using Machine Learning [0.0]
エボラウイルス(EBOV)感染非ヒト霊長類の遺伝子発現解析におけるRNAシークエンシング(RNA-Seq)とNanoString技術の比較を行った。
ナノストリングデータに基づいてトレーニングされたSupervised Magnitude-Altitude Scoring (SMAS) 手法を用いた機械学習手法では,RT-qPCR陽性を陰性試料と区別する鍵マーカーとしてOAS1が同定された。
OAS1はまた、ロジスティック回帰を用いて感染していないサンプルの識別を100%精度で達成し、プラットフォーム間の堅牢性を実証した。
論文 参考訳(メタデータ) (2024-10-30T20:21:20Z) - Thyroidiomics: An Automated Pipeline for Segmentation and Classification of Thyroid Pathologies from Scintigraphy Images [0.23960026858846614]
本研究の目的は,甲状腺シンチグラフィー画像を用いた甲状腺疾患分類を向上する自動パイプラインを開発することである。
2,643人の甲状腺シンチグラフィー画像を収集し,DG(diffuse goiter),MNG(multinodal goiter),甲状腺炎(TH)に分類した。
パイプラインは、さまざまなクラスにわたるいくつかの分類指標で、医師のセグメンテーションに匹敵するパフォーマンスを示した。
論文 参考訳(メタデータ) (2024-07-14T21:29:28Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Deep learning forward and reverse primer design to detect SARS-CoV-2
emerging variants [1.92488183401128]
新型コロナウイルス感染者の急増はSARS-CoV-2変異の出現と関連している。
我々は,SARS-CoV-2の変種を検出するために,前と逆のプライマーセットを設計する半自動手法を開発した。
論文 参考訳(メタデータ) (2022-09-25T20:09:22Z) - Strict baselines for Covid-19 forecasting and ML perspective for USA and
Russia [105.54048699217668]
Covid-19は、2年間にわたって蓄積されたデータセットを収集し、予測分析に使用できるようにする。
本研究は、米国とロシアの2カ国の地域データに基づいて、Covid-19の拡散のダイナミクスを予測するための様々な種類の方法に関する一貫した研究結果である。
論文 参考訳(メタデータ) (2022-07-15T18:21:36Z) - Deep learning-based COVID-19 pneumonia classification using chest CT
images: model generalizability [54.86482395312936]
深層学習(DL)分類モデルは、異なる国の3DCTデータセット上で、COVID-19陽性患者を特定するために訓練された。
我々は、データセットと72%の列車、8%の検証、20%のテストデータを組み合わせたDLベースの9つの同一分類モデルを訓練した。
複数のデータセットでトレーニングされ、トレーニングに使用されるデータセットの1つからテストセットで評価されたモデルは、よりよいパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-18T21:14:52Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - SARS-CoV-2 virus RNA sequence classification and geographical analysis
with convolutional neural networks approach [0.0]
2019年12月に世界中に広まり、現在も活動しているコビッドウイルスは、今日世界で2万5000人以上の死者を出した。
本研究では,SARS-CoV-2ウイルスに属するRNA配列を2つの基本画像処理アルゴリズムで遺伝子モチーフに変換する。
CNNモデルはアジア、ヨーロッパ、アメリカ、オセアニアに分類されたRNA配列で平均98%の面積曲線(AUC)値を達成した。
論文 参考訳(メタデータ) (2020-07-09T20:43:22Z) - COVID-Net S: Towards computer-aided severity assessment via training and
validation of deep neural networks for geographic extent and opacity extent
scoring of chest X-rays for SARS-CoV-2 lung disease severity [58.23203766439791]
胸部X線(CXR)はSARS-CoV-2重症度を評価するためにしばしば用いられる。
本研究では,深層学習システムを用いて,SARS-CoV-2肺疾患重症度に対するCXRのコンピュータ支援による評価の有効性を評価する。
論文 参考訳(メタデータ) (2020-05-26T16:33:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。