論文の概要: Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning
- arxiv url: http://arxiv.org/abs/2212.00015v1
- Date: Wed, 30 Nov 2022 00:13:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 17:26:35.519237
- Title: Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning
- Title(参考訳): ディープラーニングを用いた次世代DNAシークエンシングからのスケーラブルな病原体検出
- Authors: Sai Narayanan and Sathyanarayanan N. Aakur and Priyadharsini
Ramamurthy and Arunkumar Bagavathi and Vishalini Ramnath and Akhilesh
Ramachandran
- Abstract要約: 本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
- 参考スコア(独自算出の注目度): 3.8175773487333857
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Next-generation sequencing technologies have enhanced the scope of
Internet-of-Things (IoT) to include genomics for personalized medicine through
the increased availability of an abundance of genome data collected from
heterogeneous sources at a reduced cost. Given the sheer magnitude of the
collected data and the significant challenges offered by the presence of highly
similar genomic structure across species, there is a need for robust, scalable
analysis platforms to extract actionable knowledge such as the presence of
potentially zoonotic pathogens. The emergence of zoonotic diseases from novel
pathogens, such as the influenza virus in 1918 and SARS-CoV-2 in 2019 that can
jump species barriers and lead to pandemic underscores the need for scalable
metagenome analysis. In this work, we propose MG2Vec, a deep learning-based
solution that uses the transformer network as its backbone, to learn robust
features from raw metagenome sequences for downstream biomedical tasks such as
targeted and generalized pathogen detection. Extensive experiments on four
increasingly challenging, yet realistic diagnostic settings, show that the
proposed approach can help detect pathogens from uncurated, real-world clinical
samples with minimal human supervision in the form of labels. Further, we
demonstrate that the learned representations can generalize to completely
unrelated pathogens across diseases and species for large-scale metagenome
analysis. We provide a comprehensive evaluation of a novel representation
learning framework for metagenome-based disease diagnostics with deep learning
and provide a way forward for extracting and using robust vector
representations from low-cost next generation sequencing to develop
generalizable diagnostic tools.
- Abstract(参考訳): 次世代シークエンシング技術は、異種ソースから収集されたゲノムデータの豊富さを削減して、パーソナライズドメディカルな医療のためのゲノム学を含むように、IoT(Internet-of-Things)の範囲を拡大した。
収集されたデータの規模と種間で非常に類似したゲノム構造が存在することによる重要な課題を考えると、動物病原体の存在のような実行可能な知識を抽出する堅牢でスケーラブルな分析プラットフォームが必要である。
1918年のインフルエンザウイルス(英語版)や2019年のSARS-CoV-2(英語版)のような新規の病原体からの動物性疾患の出現は、種の障壁を跳躍し、パンデミックを引き起こす可能性がある。
本研究では,トランスフォーマーネットワークをバックボーンとして使用するディープラーニングベースのソリューションMG2Vecを提案し,ターゲットや汎用病原体検出などの下流バイオメディカルタスクのための生メタジェノム配列からロバストな特徴を学習する。
より困難で現実的な4つの診断設定に関する大規模な実験は、提案手法が、ラベルの形で人間の監督を最小限に抑えながら、未治療の現実世界の臨床サンプルから病原体を検出するのに役立つことを示している。
さらに, 大規模メタジェノム解析のために, 学習された表現が病原体や種間で全く無関係な病原体に一般化できることを実証した。
深層学習を用いたメタゲノメベースの疾患診断のための新しい表現学習フレームワークの包括的評価と、低コストな次世代シークエンシングからロバストなベクトル表現を抽出・利用し、汎用的な診断ツールを開発するための方法を提供する。
関連論文リスト
- Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - PathoLM: Identifying pathogenicity from the DNA sequence through the Genome Foundation Model [9.285895422810704]
PathoLMは、細菌およびウイルス配列の病原性の同定に最適化された最先端の病原体言語モデルである。
ESKAPEE病原体を含む約30種のウイルスと細菌からなる包括的データセットを開発した。
比較評価では、PathoLMはDciPathoのような既存のモデルよりも劇的に優れており、堅牢なゼロショットと少数ショット機能を示している。
論文 参考訳(メタデータ) (2024-06-19T00:53:48Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - COVID-Net Biochem: An Explainability-driven Framework to Building
Machine Learning Models for Predicting Survival and Kidney Injury of COVID-19
Patients from Clinical and Biochemistry Data [66.43957431843324]
我々は、機械学習モデルを構築するための汎用的で説明可能なフレームワークであるCOVID-Net Biochemを紹介する。
この枠組みを用いて、新型コロナウイルス患者の生存率と、入院中に急性腎不全を発症する可能性を予測する。
論文 参考訳(メタデータ) (2022-04-24T07:38:37Z) - Metagenome2Vec: Building Contextualized Representations for Scalable
Metagenome Analysis [4.807955518532493]
メタジェノメ2Vec - メタジェノメデータに固有のグローバルな構造特性をキャプチャするコンテキスト化表現を提案する。
得られた表現は,100個未満のラベル付き配列を持つ臨床検体から6個(6個)の病原体を検出するのに有効である。
論文 参考訳(メタデータ) (2021-11-09T23:21:10Z) - MG-NET: Leveraging Pseudo-Imaging for Multi-Modal Metagenome Analysis [5.04905391284093]
本稿では,自己教師型表現学習フレームワークMG-Netを提案する。
MG-Netはラベルのないデータからロバストな表現を学習できることを示す。
実験により、学習した特徴が現在のベースラインメタジェノム表現より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-21T05:53:01Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Genome Sequence Classification for Animal Diagnostics with Graph
Representations and Deep Neural Networks [4.339839287869652]
ウシ呼吸器疾患複合体(英: Bovine Respiratory Disease Complex, BRDC)は、ウシに細菌やウイルスを含む複数の病因を持つ複雑な呼吸器疾患である。
現在の動物疾患診断は、細菌培養、血清分析、PCR(PCR)検査などの従来の検査に基づいている。
ネットワークベースの機械学習アプローチは、最大89.7%の精度で病原体シグネチャを検出することができる。
論文 参考訳(メタデータ) (2020-07-24T22:30:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。