論文の概要: Magnitude Distance: A Geometric Measure of Dataset Similarity
- arxiv url: http://arxiv.org/abs/2602.08859v1
- Date: Mon, 09 Feb 2026 16:23:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.355275
- Title: Magnitude Distance: A Geometric Measure of Dataset Similarity
- Title(参考訳): マグニチュード距離:データセットの類似性の幾何学的尺度
- Authors: Sahel Torkamani, Henry Gouk, Rik Sarkar,
- Abstract要約: 有限データセット上の新しい距離距離指標であるテクストマグニチュード距離を提案する。
我々は、そのスケールにまたがる制限挙動を含む、等級距離のいくつかの理論的性質を証明した。
スケールが適切に調整された場合, 寸法距離は高次元設定で判別可能であることを示す。
- 参考スコア(独自算出の注目度): 9.19444526847653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Quantifying the distance between datasets is a fundamental question in mathematics and machine learning. We propose \textit{magnitude distance}, a novel distance metric defined on finite datasets using the notion of the \emph{magnitude} of a metric space. The proposed distance incorporates a tunable scaling parameter, $t$, that controls the sensitivity to global structure (small $t$) and finer details (large $t$). We prove several theoretical properties of magnitude distance, including its limiting behavior across scales and conditions under which it satisfies key metric properties. In contrast to classical distances, we show that magnitude distance remains discriminative in high-dimensional settings when the scale is appropriately tuned. We further demonstrate how magnitude distance can be used as a training objective for push-forward generative models. Our experimental results support our theoretical analysis and demonstrate that magnitude distance provides meaningful signals, comparable to established distance-based generative approaches.
- Abstract(参考訳): データセット間の距離を定量化することは、数学と機械学習の基本的な問題である。
本稿では,有限データセット上に定義された距離距離計量である「textit{magnitude distance」について,計量空間の「emph{magnitude}」の概念を用いて提案する。
提案した距離には調整可能なスケーリングパラメータである$t$が組み込まれており、これはグローバル構造に対する感度(小$t$)と細部(大$t$)を制御する。
等級距離のいくつかの理論的性質を証明し、その性質が重要な計量特性を満たすスケールと条件にまたがる制限挙動を証明した。
古典的距離とは対照的に、スケールが適切に調整された場合、高次元設定では等級距離が判別可能であることを示す。
さらに, プッシュフォワード生成モデルのトレーニング目的として, 等級距離がどの程度用いられるかを示す。
我々の実験結果は,我々の理論解析を裏付けるものであり,その大きさ距離が,確立された距離ベース生成手法に匹敵する有意義な信号を提供することを示した。
関連論文リスト
- Comparing Labeled Markov Chains: A Cantor-Kantorovich Approach [53.66196601631798]
最近導入されたカントール・カントロビッチ距離(CK)について検討した。
特に、後者は有限水平全変動距離の割引和として表すことができる。
より正確には、CK距離の正確な計算は#P-hardである。
論文 参考訳(メタデータ) (2025-11-22T16:02:56Z) - Geometry-aware Distance Measure for Diverse Hierarchical Structures in Hyperbolic Spaces [48.948334221681684]
双曲空間における幾何対応距離測度を提案し、様々な階層構造に動的に適応する。
我々の手法は、固定距離測定を用いた学習方法よりも一貫して優れている。
可視化は、双曲空間におけるクラス境界の明確化とプロトタイプ分離の改善を示している。
論文 参考訳(メタデータ) (2025-06-23T11:43:39Z) - A Set-to-Set Distance Measure in Hyperbolic Space [50.134086375286074]
双曲空間における集合間の相似性を計算するための双曲的集合間距離測度を提案する。
位相的差を考慮すると、HS2SDは2つの双曲集合の間の関係をより微妙に理解する。
論文 参考訳(メタデータ) (2025-06-23T11:31:40Z) - Follow the Energy, Find the Path: Riemannian Metrics from Energy-Based Models [63.331590876872944]
本稿では,事前学習したエネルギーベースモデルから直接リーマン計量を導出する手法を提案する。
これらの測度は空間的に異なる距離を定義し、測地学の計算を可能にする。
EBM由来のメトリクスは、確立されたベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2025-05-23T12:18:08Z) - GeoMM: On Geodesic Perspective for Multi-modal Learning [55.41612200877861]
本稿では,マルチモーダル学習における測地線距離を新しい距離測定基準として導入する。
我々のアプローチは、現在のマルチモーダル学習に測地距離を適用するための包括的な戦略を取り入れている。
論文 参考訳(メタデータ) (2025-05-16T13:12:41Z) - Manifold learning in metric spaces [2.005299372367689]
Laplacianベースの手法は、$mathbbRN$に横たわるデータの次元的削減に人気がある。
グラフラプラシアンの点収束に対して、計量が十分条件を満たすとき、多様体学習の問題を計量空間に一般化する枠組みを提供する。
論文 参考訳(メタデータ) (2025-03-20T14:37:40Z) - Identifying latent distances with Finslerian geometry [6.0188611984807245]
生成モデルにより、データ空間と測地学は最も非現実的であり、操作が不可能である。
本研究では,引き戻し距離の期待値が明示的に最小となる別の測度を提案する。
高次元では、どちらの測度も$Oleft(frac1Dright)$の速度で収束することが証明される。
論文 参考訳(メタデータ) (2022-12-20T05:57:27Z) - Distance Metric Learning through Minimization of the Free Energy [0.825845106786193]
本稿では, 統計物理学の概念に基づく簡単なアプローチを提案し, 与えられた問題に対する最適距離計量を学習する。
物理学における多くの問題と同様に、我々はメトロポリス・モンテカルロに基づくアプローチを提案し、最良の距離計量を求める。
提案手法は局所最小値を含む様々な制約を扱える。
論文 参考訳(メタデータ) (2021-06-10T04:54:25Z) - Geometry of Similarity Comparisons [51.552779977889045]
空間形式の順序容量は、その次元と曲率の符号に関係していることを示す。
さらに重要なことは、類似性グラフ上で定義された順序拡散確率変数の統計的挙動が、その基礎となる空間形式を特定するのに利用できることである。
論文 参考訳(メタデータ) (2020-06-17T13:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。