論文の概要: RepBin: Constraint-based Graph Representation Learning for Metagenomic
Binning
- arxiv url: http://arxiv.org/abs/2112.11696v1
- Date: Wed, 22 Dec 2021 07:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 16:26:29.097857
- Title: RepBin: Constraint-based Graph Representation Learning for Metagenomic
Binning
- Title(参考訳): RepBin:メタゲノミックバインディングのための制約に基づくグラフ表現学習
- Authors: Hansheng Xue, Vijini Mallawaarachchi, Yujia Zhang, Vaibhav Rajan, Yu
Lin
- Abstract要約: 本稿では,ノードがサブシーケンスであり,エッジがホモフィリー情報を表すグラフを用いた新しい定式化を提案する。
我々は,ホモフィリな関係とヘテロフィリな制約の両方を保持するグラフ表現学習のための新しいアルゴリズムを開発した。
我々の手法はRepBinと呼ばれ、様々な競合する手法より優れている。
- 参考スコア(独自算出の注目度): 12.561034842067889
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mixed communities of organisms are found in many environments (from the human
gut to marine ecosystems) and can have profound impact on human health and the
environment. Metagenomics studies the genomic material of such communities
through high-throughput sequencing that yields DNA subsequences for subsequent
analysis. A fundamental problem in the standard workflow, called binning, is to
discover clusters, of genomic subsequences, associated with the unknown
constituent organisms. Inherent noise in the subsequences, various biological
constraints that need to be imposed on them and the skewed cluster size
distribution exacerbate the difficulty of this unsupervised learning problem.
In this paper, we present a new formulation using a graph where the nodes are
subsequences and edges represent homophily information. In addition, we model
biological constraints providing heterophilous signal about nodes that cannot
be clustered together. We solve the binning problem by developing new
algorithms for (i) graph representation learning that preserves both homophily
relations and heterophily constraints (ii) constraint-based graph clustering
method that addresses the problems of skewed cluster size distribution.
Extensive experiments, on real and synthetic datasets, demonstrate that our
approach, called RepBin, outperforms a wide variety of competing methods. Our
constraint-based graph representation learning and clustering methods, that may
be useful in other domains as well, advance the state-of-the-art in both
metagenomics binning and graph representation learning.
- Abstract(参考訳): 混在する生物群集は多くの環境(人間の腸から海洋生態系まで)で見られ、人間の健康と環境に大きな影響を及ぼす可能性がある。
メタゲノミクス(Metagenomics)は、DNA配列を生成する高スループットシークエンシングを通じて、これらのコミュニティのゲノム物質を研究する。
ビンニングと呼ばれる標準ワークフローの根本的な問題は、未知の構成生物に関連するゲノムサブシーケンスのクラスターを発見することである。
サブシーケンスのノイズ、それらに課すべき様々な生物学的制約、および歪んだクラスタサイズ分布は、この教師なし学習問題の難しさを悪化させる。
本稿では,ノードがサブシーケンスであり,エッジがホモフィリー情報を表すグラフを用いた新しい定式化を提案する。
さらに,クラスタ化できないノードに関する異種信号を提供する生物学的制約をモデル化する。
新しいアルゴリズムを開発して バイナリー問題を解決し
(i)ホモフィリー関係とヘテロフィリー制約の両方を保存するグラフ表現学習
(ii)歪むクラスタサイズ分布の問題に対処する制約に基づくグラフクラスタリング法。
実データと合成データに関する広範な実験は、repbinと呼ばれる我々のアプローチが、さまざまな競合する方法を上回ることを示している。
制約に基づくグラフ表現学習とクラスタリング手法は,他の領域でも有用であり,メダゲノミクスとグラフ表現学習の両分野における最先端を推し進める。
関連論文リスト
- The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.83124435649358]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。
最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文 参考訳(メタデータ) (2024-07-12T18:04:32Z) - HeNCler: Node Clustering in Heterophilous Graphs through Learned Asymmetric Similarity [55.27586970082595]
HeNClerは、Heterophilous Node Clusteringの新しいアプローチである。
HeNClerは異種グラフコンテキストにおけるノードクラスタリングタスクの性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-05-27T11:04:05Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - HiGPT: Heterogeneous Graph Language Model [27.390123898556805]
不均一グラフ学習は、異種グラフ内のエンティティ間の複雑な関係や多様な意味を捉えることを目的としている。
異種グラフ学習のための既存のフレームワークは、多種多様な異種グラフデータセットをまたいだ一般化に制限がある。
異種グラフ命令チューニングパラダイムを用いた一般的なグラフモデルであるHiGPTを提案する。
論文 参考訳(メタデータ) (2024-02-25T08:07:22Z) - Product Manifold Representations for Learning on Biological Pathways [13.0916239254532]
非ユークリッド混合曲率空間における埋め込み経路グラフの効果について検討する。
学習ノード埋め込みを用いて教師付きモデルを訓練し、経路グラフにおけるタンパク質とタンパク質の相互作用の欠如を予測する。
混合曲率埋め込みにより, 分散エッジ予測性能が大幅に低下し, また, 分散エッジ予測性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-01-27T18:46:19Z) - A GAN Approach for Node Embedding in Heterogeneous Graphs Using Subgraph Sampling [33.50085646298074]
本稿では,グラフニューラルネットワーク (GNN) とGAN (Generative Adrial Network) を組み合わせた新しいフレームワークを提案する。
このフレームワークには高度なエッジ生成と選択モジュールが含まれており、合成ノードとエッジを同時に生成することができる。
論文 参考訳(メタデータ) (2023-12-11T16:52:20Z) - Latent Random Steps as Relaxations of Max-Cut, Min-Cut, and More [30.919536115917726]
クラスタリングと単純化を統一する非負行列分解に基づく確率モデルを提案する。
ハードクラスタリングをソフトクラスタリングに緩和することにより、ハードクラスタリングの潜在的な問題をトラクタブルクラスタに緩和する。
論文 参考訳(メタデータ) (2023-08-12T02:47:57Z) - Geometry Contrastive Learning on Heterogeneous Graphs [50.58523799455101]
本稿では,幾何学コントラスト学習(Geometry Contrastive Learning, GCL)と呼ばれる,新しい自己指導型学習手法を提案する。
GCLはユークリッドと双曲的な視点からヘテロジニアスグラフを同時に見ることができ、リッチな意味論と複雑な構造をモデル化する能力の強い融合を目指している。
4つのベンチマークデータセットの大規模な実験は、提案手法が強いベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-25T03:54:53Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Multilayer Clustered Graph Learning [66.94201299553336]
我々は、観測された層を代表グラフに適切に集約するために、データ忠実度用語として対照的な損失を用いる。
実験により,本手法がクラスタクラスタw.r.tに繋がることが示された。
クラスタリング問題を解くためのクラスタリングアルゴリズムを学習する。
論文 参考訳(メタデータ) (2020-10-29T09:58:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。