論文の概要: The Tree-SNE Tree Exists
- arxiv url: http://arxiv.org/abs/2510.15014v1
- Date: Thu, 16 Oct 2025 16:10:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.322565
- Title: The Tree-SNE Tree Exists
- Title(参考訳): The Tree-SNE Tree Exist
- Authors: Jack Kendrick,
- Abstract要約: t-SNE や UMAP のような非線形次元減少法はクラスタリングのスケール・プロブレムに直面する。
我々は、t-SNEの基盤となるスケーリング対称性を利用して、2次元を(2+1)次元の埋め込みに置き換えるロビンソン・アンド・ピアース・ホフマンの考えを再考する。
最適埋め込みは測度 0 の集合の外側のすべての初期条件のスケーリングパラメータ(木-SNE木が存在する)に連続的に依存することを証明する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The clustering and visualisation of high-dimensional data is a ubiquitous task in modern data science. Popular techniques include nonlinear dimensionality reduction methods like t-SNE or UMAP. These methods face the `scale-problem' of clustering: when dealing with the MNIST dataset, do we want to distinguish different digits or do we want to distinguish different ways of writing the digits? The answer is task dependent and depends on scale. We revisit an idea of Robinson & Pierce-Hoffman that exploits an underlying scaling symmetry in t-SNE to replace 2-dimensional with (2+1)-dimensional embeddings where the additional parameter accounts for scale. This gives rise to the t-SNE tree (short: tree-SNE). We prove that the optimal embedding depends continuously on the scaling parameter for all initial conditions outside a set of measure 0: the tree-SNE tree exists. This idea conceivably extends to other attraction-repulsion methods and is illustrated on several examples.
- Abstract(参考訳): 高次元データのクラスタリングと可視化は、現代のデータ科学においてユビキタスな課題である。
一般的な技術としては、t-SNE や UMAP のような非線形次元減少法がある。
これらのメソッドはクラスタリングの‘スケール・プロブレム’に直面する。MNISTデータセットを扱う場合、異なる桁を区別したいのか、異なる桁を記述する方法を区別したいのか?
答えはタスク依存であり、スケールに依存します。
我々は、t-SNEの基盤となるスケーリング対称性を利用して、2次元の(2+1)次元埋め込みに置き換えるロビンソン・アンド・ピアース・ホフマンの考えを再考する。
これにより t-SNE ツリー(ショート:tree-SNE)が生成される。
最適埋め込みは測度 0 の集合の外側のすべての初期条件のスケーリングパラメータ(木-SNE木が存在する)に連続的に依存することを証明する。
このアイデアは、他のアトラクション・反発法にまで拡張され、いくつかの例で説明されている。
関連論文リスト
- Machine Learning Approach and Extreme Value Theory to Correlated
Stochastic Time Series with Application to Tree Ring Data [0.0]
木輪の成長は, 建築や環境史の研究など, 様々な面で実装された。
本研究の目的は,ノッティンガムシャーで栽培されている9本の樹木の樹輪幅データを解析するために,MLアルゴリズムとエクストリーム値理論を用いることである。
論文 参考訳(メタデータ) (2023-01-27T01:44:43Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - Some theoretical results on discrete contour trees [3.1963310035729657]
我々は、スカラーグラフ上にアイソツリーと呼ばれる離散輪郭木を定義する。
アイソツリーモデルがすべての次元のデータに対して有効であることを示し、離散輪郭構造を定式化する公理系を開発する。
論文 参考訳(メタデータ) (2022-06-24T07:31:11Z) - Lassoed Tree Boosting [53.56229983630983]
有界断面変動のカドラー関数の大きな非パラメトリック空間において,早期に停止するn-1/4$ L2の収束速度を持つ勾配向上木アルゴリズムを証明した。
我々の収束証明は、ネストしたドンスカー類の経験的損失最小化子による早期停止に関する新しい一般定理に基づいている。
論文 参考訳(メタデータ) (2022-05-22T00:34:41Z) - HyperAid: Denoising in hyperbolic spaces for tree-fitting and
hierarchical clustering [36.738414547278154]
双曲空間におけるツリーメトリック・デノイング(HyperAid)に対する新しいアプローチを提案する。
Gromovの$delta$ hyperbolicity($delta$ hyperbolicity)の観点から評価すると、元のデータをツリーのようなデータに変換する。
我々はHyperAidを非負のエッジウェイトを強制するためのスキームに統合する。
論文 参考訳(メタデータ) (2022-05-19T17:33:16Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Visualizing hierarchies in scRNA-seq data using a density tree-biased
autoencoder [50.591267188664666]
本研究では,高次元scRNA-seqデータから意味のある木構造を同定する手法を提案する。
次に、低次元空間におけるデータのツリー構造を強調する木バイアスオートエンコーダDTAEを紹介する。
論文 参考訳(メタデータ) (2021-02-11T08:48:48Z) - Growing Deep Forests Efficiently with Soft Routing and Learned
Connectivity [79.83903179393164]
この論文は、いくつかの重要な側面で深い森林のアイデアをさらに拡張します。
我々は、ノードがハードバイナリ決定ではなく、確率的ルーティング決定、すなわちソフトルーティングを行う確率的ツリーを採用する。
MNISTデータセットの実験は、私たちの力のある深部森林が[1]、[3]よりも優れたまたは匹敵するパフォーマンスを達成できることを示しています。
論文 参考訳(メタデータ) (2020-12-29T18:05:05Z) - Sketch and Scale: Geo-distributed tSNE and UMAP [75.44887265789056]
地理的に分散したデータセット上で機械学習分析を実行することは、急速に発生する問題である。
私たちはSketch and Scale(SnS)という新しいフレームワークを紹介します。
これはCount Sketchデータ構造を利用して、エッジノード上のデータを圧縮し、マスターノード上の縮小サイズスケッチを集約し、サマリ上でバニラtSNEまたはUMAPを実行する。
我々は、この技術が完全に並列で、線形に時間にスケールし、メモリに対数的に分散し、通信し、世界中の複数のデータセンターにまたがる数百万、数十億のデータポイントでデータセットを解析できることを示す。
論文 参考訳(メタデータ) (2020-11-11T22:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。