論文の概要: A Comparison of Polynomial-Based Tree Clustering Methods
- arxiv url: http://arxiv.org/abs/2601.14285v1
- Date: Tue, 13 Jan 2026 19:53:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.068459
- Title: A Comparison of Polynomial-Based Tree Clustering Methods
- Title(参考訳): ポリノミアル木クラスタリング法の比較
- Authors: Pengyu Liu, Mariel Vázquez, Nataša Jonoska,
- Abstract要約: 樹構造は、系統学、発生生物学、核酸構造など、生命科学の多くの分野に現れる。
近年のシークエンシング技術の発展は、木構造で表現できる多くの生物学的データを生み出している。
木構造は、木構造を距離としてエンコードする計算効率が高く、解釈可能で包括的な方法を提供する。
- 参考スコア(独自算出の注目度): 0.799840210529735
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Tree structures appear in many fields of the life sciences, including phylogenetics, developmental biology and nucleic acid structures. Trees can be used to represent RNA secondary structures, which directly relate to the function of non-coding RNAs. Recent developments in sequencing technology and artificial intelligence have yielded numerous biological data that can be represented with tree structures. This requires novel methods for tree structure data analytics. Tree polynomials provide a computationally efficient, interpretable and comprehensive way to encode tree structures as matrices, which are compatible with most data analytics tools. Machine learning methods based on the Canberra distance between tree polynomials have been introduced to analyze phylogenies and nucleic acid structures. In this paper, we compare the performance of different distances in tree clustering methods based on a tree distinguishing polynomial. We also implement two basic autoencoder models for clustering trees using the polynomial. We find that the distance based methods with entry-level normalized distances have the highest clustering accuracy among the compared methods.
- Abstract(参考訳): 樹構造は、系統学、発生生物学、核酸構造など、生命科学の多くの分野に現れる。
木はRNA二次構造を表現するために使用することができ、非コードRNAの機能に直接関係している。
シークエンシング技術と人工知能の最近の進歩は、木構造で表現できる多くの生物学的データを生み出している。
これは、ツリー構造データ分析のための新しい方法を必要とする。
ツリー多項式は、ほとんどのデータ分析ツールと互換性のある行列としてツリー構造をエンコードする計算効率が高く、解釈可能で包括的な方法を提供する。
樹木多項式間のカンベラ距離に基づく機械学習手法を導入し, 植物学および核酸構造の解析を行った。
本稿では,木識別多項式に基づく木クラスタリング手法における異なる距離の性能の比較を行う。
また、この多項式を用いて木をクラスタリングするための2つの基本オートエンコーダモデルを実装した。
その結果, エントリーレベルの正規化距離を持つ距離ベース手法は, 比較手法の中で最も高いクラスタリング精度を有することがわかった。
関連論文リスト
- Hierarchical Quantized Diffusion Based Tree Generation Method for Hierarchical Representation and Lineage Analysis [49.00783841494125]
HDTreeは階層的潜在空間内の木関係を、統一的な階層的コードブックと量子化拡散プロセスを用いてキャプチャする。
HDTreeの有効性は、汎用データセットと単一セルデータセットの比較によって示される。
これらの貢献は階層的な系統解析のための新しいツールを提供し、より正確で効率的な細胞分化経路のモデリングを可能にする。
論文 参考訳(メタデータ) (2025-06-29T15:19:13Z) - PhyloGen: Language Model-Enhanced Phylogenetic Inference via Graph Structure Generation [50.80441546742053]
系統樹は種間の進化的関係を解明する。
伝統的なマルコフ連鎖モンテカルロ法は、緩やかな収束と計算上の負担に直面している。
我々は、事前学習されたゲノム言語モデルを活用する新しい方法であるPhyloGenを提案する。
論文 参考訳(メタデータ) (2024-12-25T08:33:05Z) - Learning accurate and interpretable tree-based models [27.203303726977616]
我々は、同じドメインからデータに繰り返しアクセスする木に基づく学習アルゴリズムを設計するためのアプローチを開発する。
本稿では,よく使われるエントロピーとジニ不純物に基づく基準を補間するトップダウンアルゴリズムにおいて,ノード分割基準の新しいパラメータ化クラスを提案する。
我々は、ランダムな森林や傾斜した木など、一般的な木に基づくアンサンブルのチューニングに結果を拡張した。
論文 参考訳(メタデータ) (2024-05-24T20:10:10Z) - Learning a Decision Tree Algorithm with Transformers [75.96920867382859]
メタ学習によってトレーニングされたトランスフォーマーベースのモデルであるMetaTreeを導入し、強力な決定木を直接生成する。
我々は、多くのデータセットに欲求決定木とグローバルに最適化された決定木の両方を適合させ、MetaTreeを訓練して、強力な一般化性能を実現する木のみを生成する。
論文 参考訳(メタデータ) (2024-02-06T07:40:53Z) - Phylo2Vec: a vector representation for binary trees [0.49478969093606673]
系統樹を模したPhylo2Vecについて紹介する。
系統樹を操作および表現するための統一的なアプローチとして機能する。
概念実証として、Phylo2Vecを用いて5つの実世界のデータセットの最大推定を行う。
論文 参考訳(メタデータ) (2023-04-25T09:54:35Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。