論文の概要: Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19
- arxiv url: http://arxiv.org/abs/2208.01439v1
- Date: Mon, 1 Aug 2022 13:02:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:03:09.164851
- Title: Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19
- Title(参考訳): COVID-19における主要関心事の識別のための教師なし機械学習フレームワーク
- Authors: Mingyue Kang, Seshadri Vasan, Laurence O. W. Wilson, Rohitash Chandra
- Abstract要約: 本稿では、ゲノム配列に基づいて、主要なCOVID-19変異体との関連を識別・可視化する枠組みを提案する。
提案するフレームワークは,主要な変種を効果的に識別できるため,今後,新たな変種を識別するために使用できる。
- 参考スコア(独自算出の注目度): 0.3359875577705538
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the rapid evolution of the SARS-CoV-2 (COVID-19) virus, a number of
mutations emerged with variants such as Alpha, Gamma, Delta and Omicron which
created massive impact to the world economy. Unsupervised machine learning
methods have the ability to compresses, characterize and visualises unlabelled
data. In this paper, we present a framework that utilizes unsupervised machine
learning methods that includes combination of selected dimensional reduction
and clustering methods to discriminate and visualise the associations with the
major COVID-19 variants based on genome sequences. The framework utilises k-mer
analysis for processing the genome (RNA) sequences and compares different
dimensional reduction methods, that include principal component analysis (PCA),
and t-distributed stochastic neighbour embedding (t-SNE), and uniform manifold
approximation projection (UMAP). Furthermore, the framework employs
agglomerative hierarchical clustering methods and provides a visualisation
using a dendogram. We find that the proposed framework can effectively
distinguish the major variants and hence can be used for distinguishing
emerging variants in the future.
- Abstract(参考訳): SARS-CoV-2(COVID-19)ウイルスの急激な進化により、Alpha、Gamma、Delta、Omicronなどの変異が出現し、世界経済に大きな影響を与えた。
教師なしの機械学習手法は、不正なデータを圧縮、特徴付け、視覚化する能力を持つ。
本稿では,選択された次元縮小法とクラスタリング法を組み合わせた教師なし機械学習手法を用いて,ゲノム配列に基づく新型コロナウイルスの主要変異体との関連を識別・可視化する枠組みを提案する。
本フレームワークは、ゲノム(RNA)配列の処理にk-mer解析を利用し、主成分分析(PCA)、t分散確率的近接埋め込み(t-SNE)、均一多様体近似投影(UMAP)を含む異なる次元還元法を比較する。
さらに,凝集階層クラスタリング手法を採用し,デンドグラムを用いた可視化を提供する。
提案するフレームワークは,主要な変種を効果的に識別できるため,今後,新たな変種を識別するために使用できる。
関連論文リスト
- Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Multimodal Pathology Image Search Between H&E Slides and Multiplexed
Immunofluorescent Images [0.0]
本稿では,変分オートエンコーダ (VAE) 潜時空間上の動的時間ワープ (DTW) を用いたマルチモーダル画像検索手法を提案する。
VAEのトレーニングとDTWの適用を通じて、mIFとH&Eのスライドを調整および比較する。
本手法は, 形態学的H&EデータとmIFの免疫フェノタイピングを併用することにより, 鑑別診断と治療決定を改善する。
論文 参考訳(メタデータ) (2023-06-11T21:30:20Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Identifying Selections Operating on HIV-1 Reverse Transcriptase via
Uniform Manifold Approximation and Projection [0.0]
治療レギュレンを標識したStanford HIV Drug resistance Databaseから14,651のHIV1逆転写酵素(HIV RT)配列を解析した。
我々のゴールは、進化中のHIV RTの配列空間の異なるセクターを特定することである。
論文 参考訳(メタデータ) (2022-10-01T19:08:16Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Robust Representation and Efficient Feature Selection Allows for
Effective Clustering of SARS-CoV-2 Variants [0.0]
SARS-CoV-2ウイルスは異なる変種を含み、それぞれ異なる変異を持つ。
SARS-CoV-2ゲノムの変異の多くは、ゲノム配列のスパイク領域で不均等に起こる。
本研究では,異なる既知の変異体の挙動を研究するために,スパイクタンパク質配列をクラスタ化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T21:18:52Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。