論文の概要: Graph Neural Networks for Microbial Genome Recovery
- arxiv url: http://arxiv.org/abs/2204.12270v1
- Date: Tue, 26 Apr 2022 12:49:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 15:14:29.592880
- Title: Graph Neural Networks for Microbial Genome Recovery
- Title(参考訳): 微生物ゲノム回復のためのグラフニューラルネットワーク
- Authors: Andre Lamurias, Alessandro Tibo, Katja Hose, Mads Albertsen and Thomas
Dyhre Nielsen
- Abstract要約: 本稿では,グラフニューラルネットワーク(GNN)を用いて,メダゲノミクスビニングのためのコンティグ表現を学習する際のアセンブリグラフを活用することを提案する。
提案手法であるVaeG-Binは,個々のコンティグの潜在表現を学習するための変分オートエンコーダと,アセンブリグラフ内のコンティグの近傍構造を考慮したGNNを組み合わせる。
- 参考スコア(独自算出の注目度): 64.91162205624848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microbes have a profound impact on our health and environment, but our
understanding of the diversity and function of microbial communities is
severely limited. Through DNA sequencing of microbial communities
(metagenomics), DNA fragments (reads) of the individual microbes can be
obtained, which through assembly graphs can be combined into long contiguous
DNA sequences (contigs). Given the complexity of microbial communities, single
contig microbial genomes are rarely obtained. Instead, contigs are eventually
clustered into bins, with each bin ideally making up a full genome. This
process is referred to as metagenomic binning.
Current state-of-the-art techniques for metagenomic binning rely only on the
local features for the individual contigs. These techniques therefore fail to
exploit the similarities between contigs as encoded by the assembly graph, in
which the contigs are organized. In this paper, we propose to use Graph Neural
Networks (GNNs) to leverage the assembly graph when learning contig
representations for metagenomic binning. Our method, VaeG-Bin, combines
variational autoencoders for learning latent representations of the individual
contigs, with GNNs for refining these representations by taking into account
the neighborhood structure of the contigs in the assembly graph. We explore
several types of GNNs and demonstrate that VaeG-Bin recovers more high-quality
genomes than other state-of-the-art binners on both simulated and real-world
datasets.
- Abstract(参考訳): 微生物は我々の健康と環境に大きな影響を与えるが、微生物群集の多様性と機能に対する理解は極めて限られている。
微生物群集(メタゲノミクス)のDNAシークエンシングにより、個々の微生物のDNA断片(読み取り)を得ることができ、組立グラフを通じて長い連続したDNA配列(contigs)に結合することができる。
微生物群集の複雑さを考えると、単一の凹凸微生物ゲノムはほとんど得られない。
コンティグは最終的にビンにまとめられ、それぞれのビンは理想的には完全なゲノムを構成する。
この過程をメタジノミクス・ビンニング(Metagenomic binning)と呼ぶ。
メッサージノミクス・バイニングの最先端技術は、個々のコンチグの局所的な特徴にのみ依存している。
したがって、これらのテクニックは、コンティグが組織化されるアセンブリグラフによって符号化されるコンティグ間の類似性を利用することができない。
本稿では,グラフニューラルネットワーク(GNN)を用いて,メダゲノミクスの双対表現を学習する際のアセンブリグラフを活用することを提案する。
提案手法であるVaeG-Binは,個々のコンティグの潜在表現を学習するための変分オートエンコーダと,アセンブリグラフ内のコンティグの近傍構造を考慮に入れてこれらの表現を精製するGNNを組み合わせる。
いくつかの種類のGNNを探索し、VaeG-Binがシミュレーションと実世界の両方のデータセット上で、他の最先端のバイナリよりも高品質なゲノムを回収することを示した。
関連論文リスト
- Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文 参考訳(メタデータ) (2024-05-09T09:34:51Z) - GraSSRep: Graph-Based Self-Supervised Learning for Repeat Detection in
Metagenomic Assembly [24.55141372357102]
反復DNA (repeats) は、正確で効率的なゲノム組立てと配列アライメントに重大な課題をもたらす。
GraSSRepは、DNA配列を反復的および非反復的なカテゴリに分類する自己教師型学習フレームワークである。
GraSSRepはシークエンシング機能と事前定義された学習グラフ機能を組み合わせることで、繰り返し検出における最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-02-14T18:26:58Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - Simple and Efficient Heterogeneous Graph Neural Network [55.56564522532328]
不均一グラフニューラルネットワーク(HGNN)は、不均一グラフの豊富な構造的および意味的な情報をノード表現に埋め込む強力な能力を持つ。
既存のHGNNは、同種グラフ上のグラフニューラルネットワーク(GNN)から多くのメカニズム、特に注意機構と多層構造を継承する。
本稿では,これらのメカニズムを詳細に検討し,簡便かつ効率的なヘテロジニアスグラフニューラルネットワーク(SeHGNN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T10:01:46Z) - Learning to Untangle Genome Assembly with Graph Convolutional Networks [17.227634756670835]
我々は,グラフ畳み込みネットワークをトレーニングし,それらを経由する正しい経路を見つけることによって,アセンブリグラフを解決するための新しい学習フレームワークを導入する。
実験の結果、単一の染色体からのみ生成された模擬グラフに基づいて訓練されたモデルが、他の全ての染色体を著しく解決できることがわかった。
論文 参考訳(メタデータ) (2022-06-01T04:14:25Z) - RepBin: Constraint-based Graph Representation Learning for Metagenomic
Binning [12.561034842067889]
本稿では,ノードがサブシーケンスであり,エッジがホモフィリー情報を表すグラフを用いた新しい定式化を提案する。
我々は,ホモフィリな関係とヘテロフィリな制約の両方を保持するグラフ表現学習のための新しいアルゴリズムを開発した。
我々の手法はRepBinと呼ばれ、様々な競合する手法より優れている。
論文 参考訳(メタデータ) (2021-12-22T07:01:01Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - A step towards neural genome assembly [0.0]
我々はMPNNモデルを最大集約器で訓練し、グラフ単純化のためのいくつかのアルゴリズムを実行する。
アルゴリズムがうまく学習され、トレーニングで使用されるグラフの最大20倍の大きさのグラフにスケールできることを示す。
論文 参考訳(メタデータ) (2020-11-10T10:12:19Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。