論文の概要: Metagenome2Vec: Building Contextualized Representations for Scalable
Metagenome Analysis
- arxiv url: http://arxiv.org/abs/2111.08001v1
- Date: Tue, 9 Nov 2021 23:21:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-21 14:49:38.042176
- Title: Metagenome2Vec: Building Contextualized Representations for Scalable
Metagenome Analysis
- Title(参考訳): Metagenome2Vec: スケーラブルメタゲノム解析のためのコンテキスト表現の構築
- Authors: Sathyanarayanan N. Aakur, Vineela Indla, Vennela Indla, Sai Narayanan,
Arunkumar Bagavathi, Vishalini Laguduva Ramnath, Akhilesh Ramachandran
- Abstract要約: メタジェノメ2Vec - メタジェノメデータに固有のグローバルな構造特性をキャプチャするコンテキスト化表現を提案する。
得られた表現は,100個未満のラベル付き配列を持つ臨床検体から6個(6個)の病原体を検出するのに有効である。
- 参考スコア(独自算出の注目度): 4.807955518532493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in next-generation metagenome sequencing have the potential to
revolutionize the point-of-care diagnosis of novel pathogen infections, which
could help prevent potential widespread transmission of diseases. Given the
high volume of metagenome sequences, there is a need for scalable frameworks to
analyze and segment metagenome sequences from clinical samples, which can be
highly imbalanced. There is an increased need for learning robust
representations from metagenome reads since pathogens within a family can have
highly similar genome structures (some more than 90%) and hence enable the
segmentation and identification of novel pathogen sequences with limited
labeled data. In this work, we propose Metagenome2Vec - a contextualized
representation that captures the global structural properties inherent in
metagenome data and local contextualized properties through self-supervised
representation learning. We show that the learned representations can help
detect six (6) related pathogens from clinical samples with less than 100
labeled sequences. Extensive experiments on simulated and clinical metagenome
data show that the proposed representation encodes compositional properties
that can generalize beyond annotations to segment novel pathogens in an
unsupervised setting.
- Abstract(参考訳): 次世代メタゲノムシークエンシングの進歩は、新しい病原体感染症のポイント・オブ・ケアの診断に革命をもたらす可能性がある。
メタゲノム配列の量が多いことから,臨床試料からメタゲノム配列を解析・分別するためのスケーラブルなフレームワークが必要である。
なぜなら、家族内の病原体は、非常に類似したゲノム構造(90%以上)を持つことができ、制限されたラベル付きデータを持つ新しい病原体配列のセグメンテーションと同定を可能にするためである。
本稿では,メタゲノームデータと局所的なコンテクスト化特性を自己教師付き表現学習によって捉える,文脈化表現であるmetagenome2vecを提案する。
その結果,100以上のラベル配列を有する臨床検体から6 (6) 関連病原体の検出に有用であることが判明した。
シミュレーションおよび臨床メタジェノムデータに関する広範囲な実験により、提案された表現は、新規病原体を非監督的な環境でセグメント化するためのアノテーションを超えて一般化可能な構成特性をコードすることを示した。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - T-Phenotype: Discovering Phenotypes of Predictive Temporal Patterns in
Disease Progression [82.85825388788567]
我々は、ラベル付き時系列データから予測時相パターンの表現型を発見するために、新しい時間的クラスタリング手法T-Phenotypeを開発した。
T-フェノタイプは, 評価ベースラインのすべてに対して, 最良の表現型発見性能を示す。
論文 参考訳(メタデータ) (2023-02-24T13:30:35Z) - Scalable Pathogen Detection from Next Generation DNA Sequencing with
Deep Learning [3.8175773487333857]
本稿ではトランスフォーマーネットワークをバックボーンとして利用するディープラーニングベースのソリューションMG2Vecを提案する。
提案手法は,未治療の実際の臨床サンプルから病原体を検出するのに有効であることを示す。
本稿では,メタジェノムをベースとした深層学習による疾患診断のための新しい表現学習フレームワークの包括的評価を行う。
論文 参考訳(メタデータ) (2022-11-30T00:13:59Z) - MG-NET: Leveraging Pseudo-Imaging for Multi-Modal Metagenome Analysis [5.04905391284093]
本稿では,自己教師型表現学習フレームワークMG-Netを提案する。
MG-Netはラベルのないデータからロバストな表現を学習できることを示す。
実験により、学習した特徴が現在のベースラインメタジェノム表現より優れていることが示された。
論文 参考訳(メタデータ) (2021-07-21T05:53:01Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Statistical Linear Models in Virus Genomic Alignment-free Classification: Application to Hepatitis C Viruses [2.900522306460408]
本研究は, 遺伝子タイピングおよび部分的および完全ゲノムのサブタイプにおける線形分類器の力について検討した。
C型肝炎ウイルス(HCV)に応用される。
全体として、いくつかの分類器は実験変数の正確な組み合わせのセットを与えられた上でうまく機能する。
論文 参考訳(メタデータ) (2019-10-11T21:40:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。