論文の概要: Bacteriophage classification for assembled contigs using Graph
Convolutional Network
- arxiv url: http://arxiv.org/abs/2102.03746v1
- Date: Sun, 7 Feb 2021 08:58:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:21:17.114565
- Title: Bacteriophage classification for assembled contigs using Graph
Convolutional Network
- Title(参考訳): グラフ畳み込みネットワークを用いた集合格子のバクテリオファージ分類
- Authors: Jiayu Shang and Jingzhe Jiang and Yanni Sun
- Abstract要約: 細菌ファージ(別名食虫)は微生物の生物学において重要な役割を担っている。
高い多様性、豊富な量、限られた食餌は、分類学的分析に大きな課題をもたらす。
我々は、ファージの分類分類を行うために、PhaGCNという新しい半教師付き学習モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Motivation: Bacteriophages (aka phages), which mainly infect bacteria, play
key roles in the biology of microbes. As the most abundant biological entities
on the planet, the number of discovered phages is only the tip of the iceberg.
Recently, many new phages have been revealed using high throughput sequencing,
particularly metagenomic sequencing. Compared to the fast accumulation of
phage-like sequences, there is a serious lag in taxonomic classification of
phages. High diversity, abundance, and limited known phages pose great
challenges for taxonomic analysis. In particular, alignment-based tools have
difficulty in classifying fast accumulating contigs assembled from metagenomic
data. Results: In this work, we present a novel semi-supervised learning model,
named PhaGCN, to conduct taxonomic classification for phage contigs. In this
learning model, we construct a knowledge graph by combining the DNA sequence
features learned by convolutional neural network (CNN) and protein sequence
similarity gained from gene-sharing network. Then we apply graph convolutional
network (GCN) to utilize both the labeled and unlabeled samples in training to
enhance the learning ability. We tested PhaGCN on both simulated and real
sequencing data. The results clearly show that our method competes favorably
against available phage classification tools.
- Abstract(参考訳): モチベーション:バクテリオファージ(別名ファージ)は主に細菌に感染し、微生物の生物学において重要な役割を果たす。
地球上で最も豊富な生物として、発見されているファージの数は氷山の一角に過ぎない。
近年,高スループットシークエンシング,特にメッサージノミクスシークエンシングによって新しいファージが多数明らかにされている。
ファージ様配列の高速な蓄積と比較すると、ファージの分類学的分類には深刻な遅れがある。
高い多様性、豊富さ、限られた既知のファージは分類学解析に大きな課題をもたらす。
特にアライメントベースのツールは、メタゲノミクスデータから組み立てられた高速に蓄積されたコンティグの分類が困難である。
結果:本研究では,ファージの分類分類を行うため,PhaGCNという新たな半教師付き学習モデルを提案する。
この学習モデルでは、畳み込みニューラルネットワーク(CNN)で得られたDNA配列の特徴と遺伝子共有ネットワークから得られたタンパク質配列類似性を組み合わせて知識グラフを構築する。
次に、グラフ畳み込みネットワーク(GCN)を用いて、ラベル付きサンプルとラベルなしサンプルの両方をトレーニングで活用し、学習能力を向上する。
シミュレーションおよび実シークエンシングデータを用いてPhaGCNを試験した。
その結果,本手法は利用可能なファージ分類ツールと良好に競合することが明らかとなった。
関連論文リスト
- The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.83124435649358]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。
最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文 参考訳(メタデータ) (2024-07-12T18:04:32Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - TEPI: Taxonomy-aware Embedding and Pseudo-Imaging for Scarcely-labeled
Zero-shot Genome Classification [0.0]
種の遺伝コードまたはゲノムは、貴重な進化的、生物学的、系統学的情報をコードする。
従来のバイオインフォマティクスツールは顕著な進歩を遂げているが、スケーラビリティに欠け、計算コストも高い。
TEPI, 分類認識型埋め込み, Pseudo-Imaging を用いたゼロショット学習によりこの問題に対処することを提案する。
論文 参考訳(メタデータ) (2024-01-24T04:16:28Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Graph Coloring via Neural Networks for Haplotype Assembly and Viral
Quasispecies Reconstruction [8.828330486848753]
我々はグラフ表現学習と最適化を組み合わせたNeurHapと呼ばれる新しい手法を開発した。
我々の実験は、競合するアプローチと比較して、実データや合成データセットにおけるNeurHapの性能を著しく向上させる。
論文 参考訳(メタデータ) (2022-10-21T12:53:09Z) - Graph Neural Networks for Microbial Genome Recovery [64.91162205624848]
本稿では,グラフニューラルネットワーク(GNN)を用いて,メダゲノミクスビニングのためのコンティグ表現を学習する際のアセンブリグラフを活用することを提案する。
提案手法であるVaeG-Binは,個々のコンティグの潜在表現を学習するための変分オートエンコーダと,アセンブリグラフ内のコンティグの近傍構造を考慮したGNNを組み合わせる。
論文 参考訳(メタデータ) (2022-04-26T12:49:51Z) - Detecting the hosts of bacteriophages using GCN-based semi-supervised
learning [0.0]
細菌ファージは自然および宿主関連生態系において重要な制御的役割を担っている。
宿主を知ることは、抗生物質としての使用に関する重要な知識を提供する。
本稿では,新規なファージのホスト予測を行うための半教師付き学習モデルであるHostGを提案する。
論文 参考訳(メタデータ) (2021-05-28T03:29:31Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。