論文の概要: PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation
- arxiv url: http://arxiv.org/abs/2412.18827v1
- Date: Wed, 25 Dec 2024 08:33:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:25:21.509455
- Title: PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation
- Title(参考訳): PhyloGen:グラフ構造生成による言語モデルによる系統推定
- Authors: ChenRui Duan, Zelin Zang, Siyuan Li, Yongjie Xu, Stan Z. Li,
- Abstract要約: 系統樹は種間の進化的関係を解明する。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
- 参考スコア(独自算出の注目度): 50.80441546742053
- License:
- Abstract: Phylogenetic trees elucidate evolutionary relationships among species, but phylogenetic inference remains challenging due to the complexity of combining continuous (branch lengths) and discrete parameters (tree topology). Traditional Markov Chain Monte Carlo methods face slow convergence and computational burdens. Existing Variational Inference methods, which require pre-generated topologies and typically treat tree structures and branch lengths independently, may overlook critical sequence features, limiting their accuracy and flexibility. We propose PhyloGen, a novel method leveraging a pre-trained genomic language model to generate and optimize phylogenetic trees without dependence on evolutionary models or aligned sequence constraints. PhyloGen views phylogenetic inference as a conditionally constrained tree structure generation problem, jointly optimizing tree topology and branch lengths through three core modules: (i) Feature Extraction, (ii) PhyloTree Construction, and (iii) PhyloTree Structure Modeling. Meanwhile, we introduce a Scoring Function to guide the model towards a more stable gradient descent. We demonstrate the effectiveness and robustness of PhyloGen on eight real-world benchmark datasets. Visualization results confirm PhyloGen provides deeper insights into phylogenetic relationships.
- Abstract(参考訳): 系統樹は種間の進化的関係を解明するが、連続した(枝の長さ)と離散的なパラメータ(木のトポロジー)を組み合わせる複雑さのため、系統的推論は依然として困難である。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
既存の変分推論手法は、事前に生成されたトポロジを必要とし、通常木構造と枝の長さを独立に扱うが、重要なシーケンスの特徴を見落とし、精度と柔軟性を制限できる。
進化モデルや配列制約に依存しない系統樹の生成と最適化に事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
PhyloGenは、系統推定を条件付き制約木構造生成問題とみなし、3つのコアモジュールを通して木のトポロジーと枝長を共同最適化する。
(i)特徴抽出
(二 フィロトレー建設、及び
三 フィロトレー構造モデリング
一方、より安定な勾配降下に向けてモデルを導くための Scoring Function を導入する。
実世界の8つのベンチマークデータセット上でPhyloGenの有効性とロバスト性を示す。
PhyloGenは系統関係に関する深い洞察を提供する。
関連論文リスト
- Leonardo vindicated: Pythagorean trees for minimal reconstruction of the natural branching structures [2.620755151566635]
ピタゴラスの木は、自然の木の枝分かれ構造を現実的に模倣するフラクタルデザインである。
本研究では, 基部の形状, 枝角, 緩やかなスケールの異なる, ピタゴラス型フラクタル樹について検討した。
我々は, ピタゴラスの深いフラクタル木を成長させ, 視覚的に観察するための, 柔軟にパラメータ化され, 高速なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-12T18:54:55Z) - Tree-based variational inference for Poisson log-normal models [47.82745603191512]
階層木は、しばしば近接基準に基づいてエンティティを組織するために使用される。
現在のカウントデータモデルは、この構造化情報を利用していない。
本稿では,PLNモデルの拡張としてPLN-Treeモデルを導入し,階層的カウントデータをモデル化する。
論文 参考訳(メタデータ) (2024-06-25T08:24:35Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - ARTree: A Deep Autoregressive Model for Phylogenetic Inference [6.935130578959931]
グラフニューラルネットワーク(GNN)に基づく系統推定のための深層自己回帰モデルを提案する。
本研究では,本手法の有効性と効率を,実データツリーのトポロジー密度推定と変分系統推定問題のベンチマークで実証する。
論文 参考訳(メタデータ) (2023-10-14T10:26:03Z) - PhyloGFN: Phylogenetic inference with generative flow networks [57.104166650526416]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - GeoPhy: Differentiable Phylogenetic Inference via Geometric Gradients of
Tree Topologies [0.3263412255491401]
連続幾何学空間における位相分布のユニークな表現を利用する、系統推論の新規で完全に微分可能な定式化を導入する。
実際のベンチマークデータセットを用いた実験では、GeoPhyは全トポロジーを考慮した他の近似ベイズ法よりも著しく優れていた。
論文 参考訳(メタデータ) (2023-07-07T15:45:05Z) - Learnable Topological Features for Phylogenetic Inference via Graph
Neural Networks [7.310488568715925]
学習可能なトポロジカル特徴に基づく系統的推論のための新しい構造表現法を提案する。
ディリクレエネルギーを最小化する生のノード特徴を現代のグラフ表現学習技術と組み合わせることで、学習可能なトポロジカル特徴は系統樹の効率的な構造情報を提供することができる。
論文 参考訳(メタデータ) (2023-02-17T12:26:03Z) - Epigenetic evolution of deep convolutional models [81.21462458089142]
我々は、より深い畳み込みモデルを進化させるために、これまで提案されていた神経進化の枠組みを構築した。
異なる形状と大きさのカーネルを同一層内に共存させる畳み込み層配置を提案する。
提案したレイアウトにより、畳み込み層内の個々のカーネルのサイズと形状を、対応する新しい突然変異演算子で進化させることができる。
論文 参考訳(メタデータ) (2021-04-12T12:45:16Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。