論文の概要: Primer C-VAE: An interpretable deep learning primer design method to detect emerging virus variants
- arxiv url: http://arxiv.org/abs/2503.01459v1
- Date: Mon, 03 Mar 2025 12:17:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:14:14.891792
- Title: Primer C-VAE: An interpretable deep learning primer design method to detect emerging virus variants
- Title(参考訳): Primer C-VAE: 新型ウイルスを検出するための解釈可能な深層学習プライマー設計法
- Authors: Hanyu Wang, Emmanuel K. Tsinda, Anthony J. Dunn, Francis Chikweto, Alain B. Zemkoho,
- Abstract要約: 畳み込みニューラルネットワークを用いた変分自動エンコーダフレームワークに基づくモデルであるPrimer C-VAEを開発した。
SARS-CoV-2を用いて98%の精度で変異を分類し,変異特異的プライマーを作成した。
このモデルはまた、E. coli や Shigella flexneri のようなより長い遺伝子配列を持つ生物のための効果的なプライマーも生成した。
- 参考スコア(独自算出の注目度): 0.5821597945324924
- License:
- Abstract: Motivation: PCR is more economical and quicker than Next Generation Sequencing for detecting target organisms, with primer design being a critical step. In epidemiology with rapidly mutating viruses, designing effective primers is challenging. Traditional methods require substantial manual intervention and struggle to ensure effective primer design across different strains. For organisms with large, similar genomes like Escherichia coli and Shigella flexneri, differentiating between species is also difficult but crucial. Results: We developed Primer C-VAE, a model based on a Variational Auto-Encoder framework with Convolutional Neural Networks to identify variants and generate specific primers. Using SARS-CoV-2, our model classified variants (alpha, beta, gamma, delta, omicron) with 98% accuracy and generated variant-specific primers. These primers appeared with >95% frequency in target variants and <5% in others, showing good performance in in-silico PCR tests. For Alpha, Delta, and Omicron, our primer pairs produced fragments <200 bp, suitable for qPCR detection. The model also generated effective primers for organisms with longer gene sequences like E. coli and S. flexneri. Conclusion: Primer C-VAE is an interpretable deep learning approach for developing specific primer pairs for target organisms. This flexible, semi-automated and reliable tool works regardless of sequence completeness and length, allowing for qPCR applications and can be applied to organisms with large and highly similar genomes.
- Abstract(参考訳): モチベーション:PCRは、標的生物を検出するための次世代シークエンシングよりも経済的かつ迅速であり、プライマー設計は重要なステップである。
急速に変異するウイルスの疫学では、効果的なプライマーを設計することは困難である。
従来の手法では、様々な系統にまたがる効果的なプライマー設計を確保するために、かなりの手作業の介入と苦労が必要である。
Escherichia coli や Shigella flexneri のような巨大で類似したゲノムを持つ生物では、種の違いも難しいが決定的に重要である。
結果: 畳み込みニューラルネットワークを用いた変分自動エンコーダフレームワークに基づくモデルであるPrimer C-VAEを開発し, 変分を同定し, 特定プライマーを生成する。
SARS-CoV-2を用いて, 変異型(アルファ, ベータ, ガンマ, デルタ, omicron)を98%の精度で分類し, 変異特異的プライマーを作成した。
これらのプライマーは、標的変異株で95%、他の変異株で5%の頻度で出現し、in-silico PCR試験では良好な性能を示した。
α,Delta,Omicronでは,qPCR検出に適したフラグメント<200 bpであった。
このモデルはまた、大腸菌やS. flexneriのようなより長い遺伝子配列を持つ生物のための効果的なプライマーも生成した。
結論: プライマーC-VAEは、標的生物のための特定のプライマーペアを開発するための解釈可能な深層学習手法である。
この柔軟で半自動的で信頼性の高いツールは、配列の完全性と長さに関わらず機能し、qPCRの応用を可能にし、大きくて非常に類似したゲノムを持つ生物に適用することができる。
関連論文リスト
- On the Convergence of DP-SGD with Adaptive Clipping [56.24689348875711]
勾配クリッピングによるグラディエントDescentは、微分プライベート最適化を実現するための強力な技術である。
本稿では,量子クリッピング(QC-SGD)を用いたSGDの総合収束解析について述べる。
本稿では,QC-SGDが一定閾値クリッピングSGDに類似したバイアス問題にどのように悩まされているかを示す。
論文 参考訳(メタデータ) (2024-12-27T20:29:47Z) - PathoLM: Identifying pathogenicity from the DNA sequence through the Genome Foundation Model [9.285895422810704]
PathoLMは、細菌およびウイルス配列の病原性の同定に最適化された最先端の病原体言語モデルである。
ESKAPEE病原体を含む約30種のウイルスと細菌からなる包括的データセットを開発した。
比較評価では、PathoLMはDciPathoのような既存のモデルよりも劇的に優れており、堅牢なゼロショットと少数ショット機能を示している。
論文 参考訳(メタデータ) (2024-06-19T00:53:48Z) - Learning to Predict Mutation Effects of Protein-Protein Interactions by Microenvironment-aware Hierarchical Prompt Learning [78.38442423223832]
我々は、新しいコードブック事前学習タスク、すなわちマスク付きマイクロ環境モデリングを開発する。
突然変異効果予測において、最先端の事前学習法よりも優れた性能と訓練効率を示す。
論文 参考訳(メタデータ) (2024-05-16T03:53:21Z) - DNABERT-2: Efficient Foundation Model and Benchmark For Multi-Species Genome [10.051595222470304]
我々は、k-merトークン化によって導入された計算とサンプルの非効率性が、大規模なゲノム基盤モデルの開発における主要な障害であると主張している。
我々は、k-merトークン化をByte Pair$に置き換えることを提案するゲノムトークン化に関する概念的および実証的な洞察を提供する。
DNABERT-2は、効率的なトークン化を施し、入力長制約を克服するために複数の戦略を用いるゲノム基盤モデルである。
論文 参考訳(メタデータ) (2023-06-26T18:43:46Z) - PCD2Vec: A Poisson Correction Distance-Based Approach for Viral Host
Classification [0.966840768820136]
コロナウイルス(英: Coronavirus)は、コロナウイルス科に属する膜に侵入し、非分節の正鎖RNAウイルスである。
コロナウイルスゲノムにおいて、重要な構造領域はスパイク領域であり、宿主の細胞膜にウイルスを付着させる責任がある。
本研究では、異なるウイルス亜属および種からスパイクタンパク質配列を解析することにより、ウイルスの宿主特異性を予測する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-04-13T03:02:22Z) - Deep learning forward and reverse primer design to detect SARS-CoV-2
emerging variants [1.92488183401128]
新型コロナウイルス感染者の急増はSARS-CoV-2変異の出現と関連している。
我々は,SARS-CoV-2の変種を検出するために,前と逆のプライマーセットを設計する半自動手法を開発した。
論文 参考訳(メタデータ) (2022-09-25T20:09:22Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - A k-mer Based Approach for SARS-CoV-2 Variant Identification [55.78588835407174]
アミノ酸の順序を保つことで,分類器の精度が向上することを示す。
また,アメリカ疾病予防管理センター(CDC)が報告した,変異の同定に重要な役割を担っているアミノ酸の重要性も示した。
論文 参考訳(メタデータ) (2021-08-07T15:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。