論文の概要: Information-Theoretic Quality Metric of Low-Dimensional Embeddings
- arxiv url: http://arxiv.org/abs/2512.23981v2
- Date: Thu, 01 Jan 2026 02:04:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 13:15:27.686669
- Title: Information-Theoretic Quality Metric of Low-Dimensional Embeddings
- Title(参考訳): 低次元埋め込みにおける情報理論品質指標
- Authors: Sebastián Gutiérrez-Bernal, Hector Medel Cobaxin, Abiel Galindo González,
- Abstract要約: 情報理論の観点から低次元埋め込みの品質について検討する。
周辺行列の特異値スペクトルのシャノンエントロピーに基づく局所計量であるエントロピーランク保存尺度(ERPM)を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work we study the quality of low-dimensional embeddings from an explicitly information-theoretic perspective. We begin by noting that classical evaluation metrics such as stress, rank-based neighborhood criteria, or Local Procrustes quantify distortions in distances or in local geometries, but do not directly assess how much information is preserved when projecting high-dimensional data onto a lower-dimensional space. To address this limitation, we introduce the Entropy Rank Preservation Measure (ERPM), a local metric based on the Shannon entropy of the singular-value spectrum of neighborhood matrices and on the stable rank, which quantifies changes in uncertainty between the original representation and its reduced projection, providing neighborhood-level indicators and a global summary statistic. To validate the results of the metric, we compare its outcomes with the Mean Relative Rank Error (MRRE), which is distance-based, and with Local Procrustes, which is based on geometric properties, using a financial time series and a manifold commonly studied in the literature. We observe that distance-based criteria exhibit very low correlation with geometric and spectral measures, while ERPM and Local Procrustes show strong average correlation but display significant discrepancies in local regimes, leading to the conclusion that ERPM complements existing metrics by identifying neighborhoods with severe information loss, thereby enabling a more comprehensive assessment of embeddings, particularly in information-sensitive applications such as the construction of early-warning indicators.
- Abstract(参考訳): 本研究では,情報理論の観点から,低次元埋め込みの品質について検討する。
まず, 応力, ランクベース近傍基準, 局所プロクリストなどの古典的評価指標は, 距離や局所測地における歪みを定量化するが, 高次元データを低次元空間に投影する際の情報保存量の直接的評価は行わない。
この制限に対処するために,近隣行列の特異値スペクトルのシャノンエントロピーと安定ランクに基づく局所計量であるエントロピーランク保存尺度(ERPM)を導入する。
距離に基づく平均相対ランク誤差(MRRE)と,幾何学的特性に基づく局所プロクリストとの比較を,金融時系列と文献でよく研究される多様体を用いて行った。
距離ベースの基準は, 幾何的・スペクトル的基準と非常に低い相関を示すのに対し, ERPMとローカル・プロクリストは強い平均相関を示すが, 地方制度では顕著な相違がみられ, ERPMは情報損失の激しい地域を識別することで既存の指標を補完し, 特に早期警戒指標の構築のような情報に敏感なアプリケーションにおいて, 埋め込みのより包括的な評価を可能にするという結論に至った。
関連論文リスト
- TOPO-Bench: An Open-Source Topological Mapping Evaluation Framework with Quantifiable Perceptual Aliasing [10.736029638634504]
トポロジカル一貫性をトポロジカルマップの基本特性として定式化し、ローカライゼーション精度が効率的な代理計量を提供することを示す。
本研究では,環境間の公正な比較を可能にするために,データセットのあいまいさに関する最初の定量的尺度を提案する。
すべてのデータセット、ベースライン、評価ツールは完全にオープンソースであり、トポロジカルマッピングにおける一貫した再現可能な研究を促進する。
論文 参考訳(メタデータ) (2025-10-05T08:58:08Z) - A Novel Distance-Based Metric for Quality Assessment in Image Segmentation [0.7673339435080445]
本稿では,新しい距離ベース品質指標であるSurface Consistency Coefficient (SCC)を紹介する。
SCCは、その構造表面への近接に基づいて誤差の空間分布を定量化する。
本研究では,表面近傍の誤差と遠方での誤差を区別する上で,SCCの堅牢性と有効性を示す。
論文 参考訳(メタデータ) (2025-03-28T12:02:09Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Adversarial Estimation of Topological Dimension with Harmonic Score Maps [7.34158170612151]
スコアマップで学習した多様体の位相次元を復元することは可能であることを示す。
次に、逆攻撃を用いて学習した多様体の位相次元を測定する新しい方法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:29:54Z) - SALC: Skeleton-Assisted Learning-Based Clustering for Time-Varying
Indoor Localization [3.9373541926236757]
RSS指向の地図支援クラスタリング(ROMAC)とクラスタスケール位置推定(CsLE)を含むスケルトン支援学習型クラスタリングシステムを提案する。
シミュレーションおよび実験結果から,提案したSALCシステムは,位置推定精度を向上して,指紋データベースを効率的に再構築できることが示されている。
論文 参考訳(メタデータ) (2023-07-14T22:55:52Z) - Joint Metrics Matter: A Better Standard for Trajectory Forecasting [67.1375677218281]
マルチモーダル・トラジェクトリ・予測法 : シングルエージェント・メトリクス(マージナル・メトリクス)を用いた評価
余分な指標にのみ注目することは、グループとして明確に一緒に歩いている人々のために、軌跡の衝突や軌跡のばらつきといった、不自然な予測につながる可能性がある。
本稿では,JADE,JFDE,衝突速度といったマルチエージェントメトリクス(ジョイントメトリクス)に関して,最先端トラジェクトリ予測手法の総合評価を行った。
論文 参考訳(メタデータ) (2023-05-10T16:27:55Z) - Preserving local densities in low-dimensional embeddings [37.278617643507815]
tSNEやUMAPのような最先端の手法は、高次元データに隠された局所構造を明らかにするのに優れている。
しかし, これらの手法は, 密度の相対的差など, 局所的な特性の再構築に失敗することを示す。
局所密度をほぼ保存するdtSNEを提案する。
論文 参考訳(メタデータ) (2023-01-31T16:11:54Z) - Adaptive Local-Component-aware Graph Convolutional Network for One-shot
Skeleton-based Action Recognition [54.23513799338309]
骨格に基づく行動認識のための適応的局所成分認識グラフ畳み込みネットワークを提案する。
我々の手法はグローバルな埋め込みよりも強力な表現を提供し、我々のモデルが最先端に到達するのに役立ちます。
論文 参考訳(メタデータ) (2022-09-21T02:33:07Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。