論文の概要: Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2
- arxiv url: http://arxiv.org/abs/2410.22452v1
- Date: Tue, 29 Oct 2024 18:35:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-31 14:26:26.138758
- Title: Explainable convolutional neural network model provides an alternative genome-wide association perspective on mutations in SARS-CoV-2
- Title(参考訳): 説明可能な畳み込みニューラルネットワークモデルによるSARS-CoV-2変異のゲノムワイド関連性の検討
- Authors: Parisa Hatami, Richard Annan, Luis Urias Miranda, Jane Gorman, Mengjun Xie, Letu Qingge, Hong Qin,
- Abstract要約: 我々は,SARS-CoV-2のWHOラベルに関連する変異について,説明可能な畳み込みニューラルネットワーク(CNN)と従来のゲノムワイドアソシエーション研究(GWAS)を比較した。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
- 参考スコア(独自算出の注目度): 12.507142100136464
- License:
- Abstract: Identifying mutations of SARS-CoV-2 strains associated with their phenotypic changes is critical for pandemic prediction and prevention. We compared an explainable convolutional neural network (CNN) and the traditional genome-wide association study (GWAS) on the mutations associated with WHO labels of SARS-CoV-2, a proxy for virulence phenotypes. We trained a CNN classification model that can predict genomic sequences into Variants of Concern (VOCs), and then applied Shapley Additive explanations (SHAP) model to identify mutations that are important for the correct predictions. For comparison, we performed traditional GWAS to identify mutations associated with VOCs. Comparison of the two approaches shows that the explainable neural network approach can more effectively reveal known nucleotide substitutions associated with VOCs, such as those in the spike gene regions. Our results suggest that explainable neural networks for genomic sequences offer a promising alternative to the traditional genome wide analysis approaches.
- Abstract(参考訳): SARS-CoV-2株の変異はパンデミックの予測と予防に重要である。
病原性表現型の指標であるSARS-CoV-2のWHOラベルに関連する変異について、説明可能な畳み込みニューラルネットワーク(CNN)と従来のゲノムワイド関連研究(GWAS)を比較した。
CNN分類モデルを訓練し,遺伝子配列をVOC(Variants of Concern)に予測し,シェープな付加的説明(Shapley Additive explanations, SHAP)モデルを用いて正しい予測に重要な突然変異を同定した。
比較のために従来のGWASを用いてVOCに関連する変異を同定した。
2つのアプローチの比較により、説明可能なニューラルネットワークアプローチにより、スパイク遺伝子領域のようなVOCに関連する既知のヌクレオチド置換がより効果的に明らかになることが示された。
以上の結果から,ゲノム配列に対する説明可能なニューラルネットワークは,従来のゲノムワイド解析手法の代替となる可能性が示唆された。
関連論文リスト
- CSGDN: Contrastive Signed Graph Diffusion Network for Predicting Crop Gene-phenotype Associations [6.5678927417916455]
我々は、より少ないトレーニングサンプルでロバストなノード表現を学習し、より高いリンク予測精度を実現するために、コントラスト符号付きグラフ拡散ネットワーク(CSGDN)を提案する。
Gossypium hirsutum, Brassica napus, Triticum turgidumの3つの作物データセット上でCSGDNの有効性を検証する実験を行った。
論文 参考訳(メタデータ) (2024-10-10T01:01:10Z) - Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - Unsupervised machine learning framework for discriminating major
variants of concern during COVID-19 [1.5346017713894948]
新型コロナウイルスの感染拡大は、ウイルスの突然変異率の高さから急速に進展した。
デルタやオミクロンのような一部のウイルスは、ウイルスの性質が変化し、感染や死亡率に繋がった。
教師なしの機械学習手法は、非ラベルデータの圧縮、キャラクタリゼーション、可視化を行うことができる。
論文 参考訳(メタデータ) (2022-08-01T13:02:28Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - PhyloTransformer: A Discriminative Model for Mutation Prediction Based
on a Multi-head Self-attention Mechanism [10.468453827172477]
重症急性呼吸器症候群ウイルス2(SARS-CoV-2)は10/19/21で219万人が感染し、死亡率は3.6%となっている。
そこで我々は,トランスフォーマーを用いた識別モデルであるPhylo Transformerを開発した。
論文 参考訳(メタデータ) (2021-11-03T01:30:57Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。