論文の概要: PhyloVAE: Unsupervised Learning of Phylogenetic Trees via Variational Autoencoders
- arxiv url: http://arxiv.org/abs/2502.04730v1
- Date: Fri, 07 Feb 2025 07:58:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 14:57:35.361158
- Title: PhyloVAE: Unsupervised Learning of Phylogenetic Trees via Variational Autoencoders
- Title(参考訳): PhyloVAE:変分オートエンコーダによる系統樹の教師なし学習
- Authors: Tianyu Xie, Harry Richman, Jiansi Gao, Frederick A. Matsen IV, Cheng Zhang,
- Abstract要約: PhyloVAEは、木トポロジーの表現学習と生成モデリングのために設計された教師なし学習フレームワークである。
我々は,高速で並列化されたトポロジ生成を容易にする潜伏変数生成モデルを開発した。
実験では、PhyloVAEの堅牢な表現学習能力と系統樹のトポロジーの高速生成が示されている。
- 参考スコア(独自算出の注目度): 5.505257238864315
- License:
- Abstract: Learning informative representations of phylogenetic tree structures is essential for analyzing evolutionary relationships. Classical distance-based methods have been widely used to project phylogenetic trees into Euclidean space, but they are often sensitive to the choice of distance metric and may lack sufficient resolution. In this paper, we introduce phylogenetic variational autoencoders (PhyloVAEs), an unsupervised learning framework designed for representation learning and generative modeling of tree topologies. Leveraging an efficient encoding mechanism inspired by autoregressive tree topology generation, we develop a deep latent-variable generative model that facilitates fast, parallelized topology generation. PhyloVAE combines this generative model with a collaborative inference model based on learnable topological features, allowing for high-resolution representations of phylogenetic tree samples. Extensive experiments demonstrate PhyloVAE's robust representation learning capabilities and fast generation of phylogenetic tree topologies.
- Abstract(参考訳): 系統樹構造の情報的表現の学習は、進化的関係の分析に不可欠である。
古典的な距離に基づく手法は、系統樹をユークリッド空間に投影するために広く用いられてきたが、しばしば距離メートル法の選択に敏感であり、十分な解像度を欠いている。
本稿では,木トポロジーの表現学習と生成モデリングを目的とした教師なし学習フレームワークPhyloVAE(PhyloVAEs)を紹介する。
自己回帰木トポロジー生成にインスパイアされた効率的な符号化機構を活用し,高速かつ並列化されたトポロジー生成を容易にする潜伏変数生成モデルを開発した。
PhyloVAEは、この生成モデルと学習可能なトポロジカル特徴に基づく協調推論モデルを組み合わせることで、系統樹標本の高分解能表現を可能にする。
大規模な実験は、PhyloVAEの頑健な表現学習能力と系統樹のトポロジーの急速な生成を実証している。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本研究では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデルを提案する。
このモデルは分子生物学の中心的なドグマに固執し、タンパク質のコード配列を正確に生成する。
また、特にプロモーター配列の即応的な生成を通じて、シーケンス最適化において大きな可能性を示している。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.80441546742053]
系統樹は種間の進化的関係を解明する。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文 参考訳(メタデータ) (2024-12-25T08:33:05Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - Neural Echos: Depthwise Convolutional Filters Replicate Biological
Receptive Fields [56.69755544814834]
哺乳類網膜で観察される生体受容野を,深部核が効果的に複製していることを示す証拠を提示する。
生体受容の分野からインスピレーションを得る手法を提案する。
論文 参考訳(メタデータ) (2024-01-18T18:06:22Z) - ARTree: A Deep Autoregressive Model for Phylogenetic Inference [6.935130578959931]
グラフニューラルネットワーク(GNN)に基づく系統推定のための深層自己回帰モデルを提案する。
本研究では,本手法の有効性と効率を,実データツリーのトポロジー密度推定と変分系統推定問題のベンチマークで実証する。
論文 参考訳(メタデータ) (2023-10-14T10:26:03Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - GeoPhy: Differentiable Phylogenetic Inference via Geometric Gradients of
Tree Topologies [0.3263412255491401]
連続幾何学空間における位相分布のユニークな表現を利用する、系統推論の新規で完全に微分可能な定式化を導入する。
実際のベンチマークデータセットを用いた実験では、GeoPhyは全トポロジーを考慮した他の近似ベイズ法よりも著しく優れていた。
論文 参考訳(メタデータ) (2023-07-07T15:45:05Z) - Learnable Topological Features for Phylogenetic Inference via Graph
Neural Networks [7.310488568715925]
学習可能なトポロジカル特徴に基づく系統的推論のための新しい構造表現法を提案する。
ディリクレエネルギーを最小化する生のノード特徴を現代のグラフ表現学習技術と組み合わせることで、学習可能なトポロジカル特徴は系統樹の効率的な構造情報を提供することができる。
論文 参考訳(メタデータ) (2023-02-17T12:26:03Z) - Exploiting Syntactic Structure for Better Language Modeling: A Syntactic
Distance Approach [78.77265671634454]
我々はマルチタスクの目的、すなわち、モデルが単語を同時に予測し、また「シンタクティック距離」と呼ばれる形態で真実解析木を解析する。
Penn Treebank と Chinese Treebank のデータセットによる実験結果から,地上の真理解析木を追加の訓練信号として提供すると,そのモデルはより低いパープレキシティを実現し,より良い品質で木を誘導できることが示された。
論文 参考訳(メタデータ) (2020-05-12T15:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。