論文の概要: Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19
- arxiv url: http://arxiv.org/abs/2208.01439v3
- Date: Thu, 25 May 2023 22:28:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-30 00:06:53.361422
- Title: Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19
- Title(参考訳): COVID-19における主要関心事の識別のための教師なし機械学習フレームワーク
- Authors: Rohitash Chandra, Chaarvi Bansal, Mingyue Kang, Tom Blau, Vinti
Agarwal, Pranjal Singh, Laurence O. W. Wilson, Seshadri Vasan
- Abstract要約: 新型コロナウイルスの感染拡大は、ウイルスの突然変異率の高さから急速に進展した。
デルタやオミクロンのような一部のウイルスは、ウイルスの性質が変化し、感染や死亡率に繋がった。
教師なしの機械学習手法は、非ラベルデータの圧縮、キャラクタリゼーション、可視化を行うことができる。
- 参考スコア(独自算出の注目度): 1.5346017713894948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the high mutation rate of the virus, the COVID-19 pandemic evolved
rapidly. Certain variants of the virus, such as Delta and Omicron, emerged with
altered viral properties leading to severe transmission and death rates. These
variants burdened the medical systems worldwide with a major impact to travel,
productivity, and the world economy. Unsupervised machine learning methods have
the ability to compress, characterize, and visualize unlabelled data. This
paper presents a framework that utilizes unsupervised machine learning methods
to discriminate and visualize the associations between major COVID-19 variants
based on their genome sequences. These methods comprise a combination of
selected dimensionality reduction and clustering techniques. The framework
processes the RNA sequences by performing a k-mer analysis on the data and
further visualises and compares the results using selected dimensionality
reduction methods that include principal component analysis (PCA),
t-distributed stochastic neighbour embedding (t-SNE), and uniform manifold
approximation projection (UMAP). Our framework also employs agglomerative
hierarchical clustering to visualize the mutational differences among major
variants of concern and country-wise mutational differences for selected
variants (Delta and Omicron) using dendrograms. We also provide country-wise
mutational differences for selected variants via dendrograms. We find that the
proposed framework can effectively distinguish between the major variants and
has the potential to identify emerging variants in the future.
- Abstract(参考訳): ウイルスの変異率が高いため、新型コロナウイルスのパンデミックは急速に進展した。
デルタやオミクロンなどの特定の変異株はウイルスの性質が変化し、深刻な感染と死亡率に繋がった。
これらの変種は世界中の医療システムを負担し、旅行、生産性、世界経済に大きな影響を与えた。
教師なし機械学習手法は、非ラベルデータの圧縮、キャラクタリゼーション、可視化を行うことができる。
本稿では、教師なし機械学習手法を用いて、ゲノム配列に基づいて、主要なCOVID-19変異体間の関連を識別、可視化する枠組みを提案する。
これらの手法は,選択された次元還元法とクラスタリング法を組み合わせたものである。
本フレームワークは、データをk-mer解析してRNA配列を処理し、さらに視覚化し、主成分分析(PCA)、t分散確率的隣接埋め込み(t-SNE)、均一多様体近似投影(UMAP)を含む選択された次元減少法を用いて結果と比較する。
また,本フレームワークでは,デンドログラムを用いて選択された変異種(デルタ,オミクロン)に対する主要変異種間の突然変異差と国別突然変異差を可視化するために凝集的階層クラスタリングを用いる。
また,デンドログラムを用いて選択した変異株に対する国別変異差も提示する。
提案手法は,主要な変種を効果的に区別し,将来に出現する変種を識別する可能性を秘めている。
関連論文リスト
- Integrating Large Language Models for Genetic Variant Classification [12.244115429231888]
大型言語モデル (LLM) は遺伝学においてトランスフォーメーションツールとして登場した。
本研究では,GPN-MSA,ESM1b,AlphaMissenseを含む最先端LLMの統合について検討した。
提案手法は,よく注釈付けされたProteinGymとClinVarのデータセットを用いて,これらの統合モデルを評価する。
論文 参考訳(メタデータ) (2024-11-07T13:45:56Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Multimodal Pathology Image Search Between H&E Slides and Multiplexed
Immunofluorescent Images [0.0]
本稿では,変分オートエンコーダ (VAE) 潜時空間上の動的時間ワープ (DTW) を用いたマルチモーダル画像検索手法を提案する。
VAEのトレーニングとDTWの適用を通じて、mIFとH&Eのスライドを調整および比較する。
本手法は, 形態学的H&EデータとmIFの免疫フェノタイピングを併用することにより, 鑑別診断と治療決定を改善する。
論文 参考訳(メタデータ) (2023-06-11T21:30:20Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Identifying Selections Operating on HIV-1 Reverse Transcriptase via
Uniform Manifold Approximation and Projection [0.0]
治療レギュレンを標識したStanford HIV Drug resistance Databaseから14,651のHIV1逆転写酵素(HIV RT)配列を解析した。
我々のゴールは、進化中のHIV RTの配列空間の異なるセクターを特定することである。
論文 参考訳(メタデータ) (2022-10-01T19:08:16Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Robust Representation and Efficient Feature Selection Allows for
Effective Clustering of SARS-CoV-2 Variants [0.0]
SARS-CoV-2ウイルスは異なる変種を含み、それぞれ異なる変異を持つ。
SARS-CoV-2ゲノムの変異の多くは、ゲノム配列のスパイク領域で不均等に起こる。
本研究では,異なる既知の変異体の挙動を研究するために,スパイクタンパク質配列をクラスタ化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T21:18:52Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。