論文の概要: Topolow: Force-Directed Euclidean Embedding of Dissimilarity Data with Robustness Against Non-Metricity and Sparsity
- arxiv url: http://arxiv.org/abs/2508.01733v2
- Date: Wed, 20 Aug 2025 06:24:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.139362
- Title: Topolow: Force-Directed Euclidean Embedding of Dissimilarity Data with Robustness Against Non-Metricity and Sparsity
- Title(参考訳): トポロー:非計量とスパーシリティに対するロバストなロバスト性を持つ異種データの強制指向ユークリッド埋め込み
- Authors: Omid Arhami, Pejman Rohani,
- Abstract要約: Topolowは、そのような埋め込み問題に対する物理学に着想を得た、勾配のない最適化フレームワークである。
トポローは入力の相似性を計量として必要とせず、非計量測度を有効ユークリッド空間に埋め込む堅牢な解となる。
本稿では, 抗原マッピングにおけるTopolowとして最初に導入されたアルゴリズムを定式化した(Arhami and Rohani, 2025)。
- 参考スコア(独自算出の注目度): 0.8287206589886881
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The problem of embedding a set of objects into a low-dimensional Euclidean space based on a matrix of pairwise dissimilarities is fundamental in data analysis, machine learning, and statistics. However, the assumptions of many standard analytical methods are violated when the input dissimilarities fail to satisfy metric or Euclidean axioms. We present the mathematical and statistical foundations of Topolow, a physics-inspired, gradient-free optimization framework for such embedding problems. Topolow is conceptually related to force-directed graph drawing algorithms but is fundamentally distinguished by its goal of quantitative metric reconstruction. It models objects as particles in a physical system, and its novel optimization scheme proceeds through sequential, stochastic pairwise interactions, which circumvents the need to compute a global gradient and provides robustness against convergence to local optima, especially for sparse data. Topolow maximizes the likelihood under a Laplace error model, robust to outliers and heterogeneous errors, and properly handles censored data. Crucially, Topolow does not require the input dissimilarities to be metric, making it a robust solution for embedding non-metric measurements into a valid Euclidean space, thereby enabling the use of standard analytical tools. We demonstrate the superior performance of Topolow compared to standard Multidimensional Scaling (MDS) methods in reconstructing the geometry of sparse and non-Euclidean data. This paper formalizes the algorithm, first introduced as Topolow in the context of antigenic mapping in (Arhami and Rohani, 2025) (open access), with emphasis on its metric embedding and mathematical properties for a broader audience. The general-purpose function Euclidify is available in the R package topolow.
- Abstract(参考訳): 低次元ユークリッド空間にオブジェクトの集合を埋め込む問題は、データ解析、機械学習、統計学において基本的な問題である。
しかし、多くの標準的な解析手法の仮定は、入力の相違が計量やユークリッド公理を満たさない場合に破られる。
本稿では, 物理に着想を得た, 勾配なし最適化フレームワークである Topolow の数学的および統計的基礎について述べる。
Topolow は、力によるグラフ描画アルゴリズムと概念的に関連があるが、定量化の目標によって根本的に区別されている。
物体を物理系の粒子としてモデル化し、その新しい最適化スキームは逐次的で確率的な対の相互作用を通じて進行し、グローバル勾配を計算する必要性を回避し、特にスパースデータに対する局所最適収束に対する堅牢性を提供する。
TopolowはLaplaceエラーモデルの下での可能性を最大化し、外れ値や不均一なエラーに対して堅牢で、検閲されたデータを適切に処理する。
重要なことに、トポローは入力の相似性を計量として必要とせず、非計量測度を有効なユークリッド空間に埋め込む堅牢な解となり、標準解析ツールの使用を可能にする。
スパースおよび非ユークリッドデータの幾何再構成における標準多次元スケーリング(MDS)法と比較して,Topolowの優れた性能を示す。
本稿では, 抗原マッピング(Arhami and Rohani, 2025)の文脈において, Topolow として最初に導入されたアルゴリズムを形式化し, より広い聴衆を対象としたメートル法埋め込みと数学的特性に着目した。
汎用関数 Euclidify は R パッケージのtopolow で利用可能である。
関連論文リスト
- Finsler Multi-Dimensional Scaling: Manifold Learning for Asymmetric Dimensionality Reduction and Embedding [41.601022263772535]
次元化の削減は、データ分析や可視化における中心的な応用とともに、重要なパターンを保ちながら、特徴的次元を減らし、複雑なデータを単純化することを目的としている。
基礎となるデータ構造を維持するため、多次元スケーリング(MDS)法は距離などの対等な相似性を保存することに重点を置いている。
論文 参考訳(メタデータ) (2025-03-23T10:03:22Z) - Dimension reduction via score ratio matching [0.9012198585960441]
スコアマッチングから派生したフレームワークを提案し、勾配を利用できない問題に勾配に基づく次元の減少を拡大する。
提案手法は,低次元構造を有する問題に対して,標準的なスコアマッチングよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-25T22:21:03Z) - Sample-Efficient Geometry Reconstruction from Euclidean Distances using Non-Convex Optimization [7.114174944371803]
ユークリッド距離情報点対を埋め込む適切な点を見つける問題は、コアタスクとサブマシン学習の問題の両方として生じる。
本稿では,最小限のサンプル数を考えると,この問題を解決することを目的とする。
論文 参考訳(メタデータ) (2024-10-22T13:02:12Z) - Probabilistic Iterative Hard Thresholding for Sparse Learning [2.5782973781085383]
l0 ノルム」はベクトルの 0 でない成分の数を数える。
勾配のノイズが計算上の必要から評価されなければならないようなビッグデータ設定では、文献は確実に収束する手法に精通している。
我々は、基礎となるプロセスの収束を証明し、機械学習問題における性能を実証する。
論文 参考訳(メタデータ) (2024-09-02T18:14:45Z) - Curvature-Independent Last-Iterate Convergence for Games on Riemannian
Manifolds [77.4346324549323]
本研究では, 多様体の曲率に依存しないステップサイズが, 曲率非依存かつ直線的最終点収束率を達成することを示す。
我々の知る限りでは、曲率非依存率や/または最終点収束の可能性はこれまでに検討されていない。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - An evaluation framework for dimensionality reduction through sectional
curvature [59.40521061783166]
本研究は,非教師付き次元減少性能指標を初めて導入することを目的としている。
その実現可能性をテストするために、この測定基準は最もよく使われる次元削減アルゴリズムの性能を評価するために用いられている。
新しいパラメータ化問題インスタンスジェネレータが関数ジェネレータの形式で構築されている。
論文 参考訳(メタデータ) (2023-03-17T11:59:33Z) - Learning Graphical Factor Models with Riemannian Optimization [70.13748170371889]
本稿では,低ランク構造制約下でのグラフ学習のためのフレキシブルなアルゴリズムフレームワークを提案する。
この問題は楕円分布のペナルティ化された最大推定値として表される。
楕円モデルによく適合する正定行列と定ランクの正半定行列のジオメトリを利用する。
論文 参考訳(メタデータ) (2022-10-21T13:19:45Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Jointly Modeling and Clustering Tensors in High Dimensions [6.072664839782975]
テンソルの合同ベンチマークとクラスタリングの問題を考察する。
本稿では,統計的精度の高い近傍に幾何的に収束する効率的な高速最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-15T21:06:16Z) - Understanding Implicit Regularization in Over-Parameterized Single Index
Model [55.41685740015095]
我々は高次元単一インデックスモデルのための正規化自由アルゴリズムを設計する。
暗黙正則化現象の理論的保証を提供する。
論文 参考訳(メタデータ) (2020-07-16T13:27:47Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。