論文の概要: Spectral neighbor joining for reconstruction of latent tree models
- arxiv url: http://arxiv.org/abs/2002.12547v3
- Date: Wed, 23 Sep 2020 02:15:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 01:28:11.794865
- Title: Spectral neighbor joining for reconstruction of latent tree models
- Title(参考訳): 潜在木モデル再構成のためのスペクトル近傍接合
- Authors: Ariel Jaffe, Noah Amsel, Yariv Aizenbud, Boaz Nadler, Joseph T. Chang,
Yuval Kluger
- Abstract要約: 我々は,潜在木図形モデルの構造を復元する新しい手法であるSpectral Neighbor Joiningを開発した。
我々はSNJが一貫したものであることを証明し、推定された類似性行列から木回復を正すのに十分な条件を導出する。
SNJは,他の再建法と比較して,多数の葉や長い縁を持つ樹木を正確に復元するために,サンプルを少なくする。
- 参考スコア(独自算出の注目度): 5.229354894035374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A common assumption in multiple scientific applications is that the
distribution of observed data can be modeled by a latent tree graphical model.
An important example is phylogenetics, where the tree models the evolutionary
lineages of a set of observed organisms. Given a set of independent
realizations of the random variables at the leaves of the tree, a key challenge
is to infer the underlying tree topology. In this work we develop Spectral
Neighbor Joining (SNJ), a novel method to recover the structure of latent tree
graphical models. Given a matrix that contains a measure of similarity between
all pairs of observed variables, SNJ computes a spectral measure of cohesion
between groups of observed variables. We prove that SNJ is consistent, and
derive a sufficient condition for correct tree recovery from an estimated
similarity matrix. Combining this condition with a concentration of measure
result on the similarity matrix, we bound the number of samples required to
recover the tree with high probability. We illustrate via extensive simulations
that in comparison to several other reconstruction methods, SNJ requires fewer
samples to accurately recover trees with a large number of leaves or long
edges.
- Abstract(参考訳): 複数の科学的応用における一般的な仮定は、観測データの分布は潜在木グラフモデルによってモデル化できるということである。
重要な例は系統学であり、木は観察された生物の集合の進化系統をモデル化する。
木の葉の確率変数の独立な実現が与えられたとき、根底にある木トポロジーを推測することが重要な課題である。
本研究では,潜在木グラフモデルの構造を復元する新しい手法であるスペクトル隣接結合(snj)を開発した。
観測変数のすべての対の類似度を含む行列が与えられたとき、SNJは観測変数の群間の凝集度のスペクトル測度を計算する。
我々はSNJが一貫したものであることを証明し、推定された類似性行列から正しい木回復のための十分な条件を導出する。
この条件と類似度行列上の測定結果の集中を組み合わせることで,木を回収するために必要なサンプル数を高い確率で制限した。
SNJは,他の再建法と比較して,多数の葉や長い縁を持つ樹木を正確に復元するために,サンプルを少なくする。
関連論文リスト
- PhyloGFN: Phylogenetic inference with generative flow networks [59.56365488043478]
本稿では,系統学における2つの中核的問題に対処するための生成フローネットワーク(GFlowNets)の枠組みを紹介する。
GFlowNetsは複雑な構造をサンプリングするのに適しているため、木トポロジー上の多重モード後部分布を探索し、サンプリングするのに自然な選択である。
我々は, 実際のベンチマークデータセット上で, 様々な, 高品質な進化仮説を生成できることを実証した。
論文 参考訳(メタデータ) (2023-10-12T23:46:08Z) - Tree Variational Autoencoders [5.992683455757179]
本稿では,潜在変数上の柔軟木に基づく後続分布を学習する階層的階層クラスタリングモデルを提案する。
TreeVAEは、本質的な特徴に従ってサンプルを階層的に分割し、データ内の隠れた構造に光を遮る。
論文 参考訳(メタデータ) (2023-06-15T09:25:04Z) - Sharded Bayesian Additive Regression Trees [1.4213973379473654]
データの分割を決定するためにランダム化補助変数とシャーディングツリーを導入する。
積空間上の部分モデルに対する最適シャーディングを最適に設計できることを観察することにより、交差木構造を導入し、木構造のみを用いてシャーディングとモデリングの両方を完全に指定する。
論文 参考訳(メタデータ) (2023-06-01T05:41:31Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Robust Model Selection of Non Tree-Structured Gaussian Graphical Models [15.657881698666188]
本稿では,変数(あるいはその部分集合)が独立雑音によって破損した場合に,ガウス図形モデルに基づく構造を学習する問題を考察する。
我々は、(避けられない)木の同値類までの構造を識別するアルゴリズムを考案した。
木構造グラフと同様に、あいまいさは同値類に限られていることを示す。
論文 参考訳(メタデータ) (2022-11-10T16:50:50Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - Robustifying Algorithms of Learning Latent Trees with Vector Variables [92.18777020401484]
Recursive Grouping (RG) と Chow-Liu Recursive Grouping (CLRG) のサンプル複雑性について述べる。
RG,CLRG,Neighbor Joining (NJ) およびSpectral NJ (SNJ) をトラッピングした内積を用いて強化する。
我々は、潜在木の構造学習において、最初の既知のインスタンス依存の不合理性の結果を導出する。
論文 参考訳(メタデータ) (2021-06-02T01:37:52Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - SGA: A Robust Algorithm for Partial Recovery of Tree-Structured
Graphical Models with Noisy Samples [75.32013242448151]
ノードからの観測が独立しているが非識別的に分散ノイズによって破損した場合、Ising Treeモデルの学習を検討する。
Katiyarら。
(2020) は, 正確な木構造は復元できないが, 部分木構造を復元できることを示した。
統計的に堅牢な部分木回復アルゴリズムであるSymmetrized Geometric Averaging(SGA)を提案する。
論文 参考訳(メタデータ) (2021-01-22T01:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。