論文の概要: FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling
- arxiv url: http://arxiv.org/abs/2605.11428v1
- Date: Tue, 12 May 2026 02:26:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.530099
- Title: FastUMAP: Scalable Dimensionality Reduction via Bipartite Landmark Sampling
- Title(参考訳): FastUMAP: 双方向ランドマークサンプリングによるスケーラブルな次元化
- Authors: Hongmin Li,
- Abstract要約: FastUMAPはスパースポイントランドマークファジィグラフを構築し、誘導されたランドマーク親和性からNystromスペクトルウォームスタートを計算し、UMAPスタイルの目的で全てのサンプル座標を洗練する。
9つのベンチマークデータセットが178から70,000のサンプルにまたがる場合、FastUMAPはデフォルト実装比較で報告された7つのデータセットで最低のランタイムを持つ。
FastUMAPは、精度優先のメソッドの代替としてではなく、反復的な探索的な埋め込みのための高速なオプションとして最もよく考えられている。
- 参考スコア(独自算出の注目度): 0.9805949492148788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exploratory analysis of high-dimensional data rarely stops at a single embedding. In practice, analysts rerun dimensionality reduction after changing preprocessing, subsets, or hyperparameters, and standard nonlinear methods can quickly become the bottleneck. We introduce FastUMAP (Bipartite Manifold Approximation and Projection), a landmark-based method designed for this repeated-use setting. FastUMAP builds a sparse point-landmark fuzzy graph, computes a Nystrom spectral warm start from the induced landmark affinity, and then refines all sample coordinates with a UMAP-style objective on the bipartite graph. The landmark ratio r = m/n provides a direct way to trade runtime against fidelity. On 9 benchmark datasets spanning 178 to 70,000 samples, FastUMAP has the lowest runtime on 7 datasets in our reported default-implementation comparison on one workstation. On MNIST and Fashion-MNIST (n=70000), it runs in about 4.6 seconds, compared with about 73--75 seconds for Barnes--Hut t-SNE, while reaching 91.4% mean kNN accuracy versus 94.6% for the strongest accuracy baseline. FastUMAP is therefore best viewed as a fast option for repeated exploratory embedding, rather than as a replacement for accuracy-first methods.
- Abstract(参考訳): 高次元データの探索的分析は、単一の埋め込みで止まることは滅多にない。
実際には、アナリストは前処理、サブセット、ハイパーパラメータを変更した後、次元の減少を再実行し、標準的な非線形手法はすぐにボトルネックとなる。
本稿では,FastUMAP (Bipartite Manifold Approximation and Projection)を提案する。
FastUMAPはスパースポイントランドマークファジィグラフを構築し、誘導されたランドマーク親和性からナイストロームのスペクトルウォームスタートを計算する。
ランドマーク比 r = m/n は、実行時と忠実度を交換する直接的な方法を与える。
9つのベンチマークデータセットが178から70,000のサンプルにまたがる場合、FastUMAPは1つのワークステーション上でのデフォルト実装比較で報告された7つのデータセットで最低のランタイムを持つ。
MNISTとFashion-MNIST(n=70000)では、バーンズ-Hut t-SNEの73-75秒と比べ約4.6秒で動作し、91.4%に達した。
したがって、FastUMAPは、精度優先のメソッドの代替としてではなく、反復的な探索的な埋め込みのための高速な選択肢であると見なされている。
関連論文リスト
- FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - FAST: Topology-Aware Frequency-Domain Distribution Matching for Coreset Selection [19.148841575715746]
コアセット選択はデータセットをコンパクトで代表的なサブセットに圧縮し、ディープニューラルネットワークをトレーニングする際のエネルギーと計算負担を軽減する。
DNNフリーな分散マッチングコアセット選択フレームワークであるFASTを提案する。
FASTは評価された全てのベンチマークで最先端のコアセット選択法を著しく上回り、平均精度は9.12%向上した。
論文 参考訳(メタデータ) (2025-11-22T09:24:57Z) - A Novel Approach for Estimating Largest Lyapunov Exponents in One-Dimensional Chaotic Time Series Using Machine Learning [0.0]
機械学習を用いて1次元カオス時系列から最大のリアプノフ指数(LLE)を推定するためのデータ駆動手法を提案する。
予測器はサンプル外マルチ水平予測を生成するように訓練され、LLEは地平線を横切る幾何平均予測誤差(GMAE)の指数的成長から推定される。
我々は,4つの標準1次元地図-ロジスティック,正弦,立方体,チェビシェフが達成するR2pos > 0.99のアプローチを,M = 450と短い列の基準LLE曲線に対して検証した。
論文 参考訳(メタデータ) (2025-07-07T10:53:02Z) - ProtoSeg: A Prototype-Based Point Cloud Instance Segmentation Method [6.632158868486343]
本稿では,3次元点雲上でインスタンスセグメンテーションを行うニューラルネットワークアーキテクチャを提案する。
本稿では, 並列に係数とプロトタイプを学習し, 組み合わせて実例予測を行う手法を提案する。
提案手法は,最先端技術よりも28%高速であるだけでなく,標準偏差が低いことを示す。
論文 参考訳(メタデータ) (2024-10-03T10:05:27Z) - SPARE: Symmetrized Point-to-Plane Distance for Robust Non-Rigid 3D Registration [77.13381026159111]
本研究では,SPAREを提案する。SPAREは,非剛性登録のための対称化点-平面間距離を用いた新しい定式化である。
提案手法は, 厳密でない登録問題の精度を大幅に向上し, 比較的高い解効率を維持する。
論文 参考訳(メタデータ) (2024-05-30T15:55:04Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Neighbourhood-Insensitive Point Cloud Normal Estimation Network [19.015903212748388]
本稿では,新たな自己注意に基づく正規推定ネットワークを提案する。
温度パラメータを学習することで、関連点にソフトフォーカスし、ソフトネスを調整することができる。
我々のモデルは、既存のすべての正規推定アルゴリズムを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-08-23T05:46:58Z) - Least Squares Regression with Markovian Data: Fundamental Limits and
Algorithms [69.45237691598774]
マルコフ連鎖からデータポイントが依存しサンプリングされる最小二乗線形回帰問題について検討する。
この問題を$tau_mathsfmix$という観点から、鋭い情報理論のミニマックス下限を確立する。
本稿では,経験的リプレイに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-16T04:26:50Z) - Holistically-Attracted Wireframe Parsing [123.58263152571952]
本稿では,入力画像中のベクトル化ワイヤフレームを1つのフォワードパスで検出する高速で類似的な解析手法を提案する。
提案手法は, (i) ラインセグメントとジャンクション提案生成, (ii) ラインセグメントとジャンクションマッチング, (iii) ラインセグメントとジャンクション検証の3つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2020-03-03T17:43:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。