論文の概要: How Scale Breaks "Normalized Stress" and KL Divergence: Rethinking Quality Metrics
- arxiv url: http://arxiv.org/abs/2510.08660v1
- Date: Thu, 09 Oct 2025 13:11:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.306668
- Title: How Scale Breaks "Normalized Stress" and KL Divergence: Rethinking Quality Metrics
- Title(参考訳): スケールが"非正規化ストレス"とKLの多様性を破る方法 - 品質基準の再考
- Authors: Kiran Smelser, Kaviru Gunaratne, Jacob Miller, Stephen Kobourov,
- Abstract要約: 研究者は、しばしば2次元散乱プロットの精度を測定するために品質指標を使用する。
最も一般的に使用されるメトリクスの1つ、正規化ストレスは、投影の均一なスケーリング(ストレッチ、縮小)に敏感である。
得られた値がどの程度変化し、これが寸法削減技術の評価にどのように影響するかを示す。
- 参考スコア(独自算出の注目度): 0.20999222360659606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Complex, high-dimensional data is ubiquitous across many scientific disciplines, including machine learning, biology, and the social sciences. One of the primary methods of visualizing these datasets is with two-dimensional scatter plots that visually capture some properties of the data. Because visually determining the accuracy of these plots is challenging, researchers often use quality metrics to measure the projection's accuracy and faithfulness to the original data. One of the most commonly employed metrics, normalized stress, is sensitive to uniform scaling (stretching, shrinking) of the projection, despite this act not meaningfully changing anything about the projection. Another quality metric, the Kullback--Leibler (KL) divergence used in the popular t-Distributed Stochastic Neighbor Embedding (t-SNE) technique, is also susceptible to this scale sensitivity. We investigate the effect of scaling on stress and KL divergence analytically and empirically by showing just how much the values change and how this affects dimension reduction technique evaluations. We introduce a simple technique to make both metrics scale-invariant and show that it accurately captures expected behavior on a small benchmark.
- Abstract(参考訳): 複雑な高次元データは、機械学習、生物学、社会科学など、多くの科学分野にまたがっている。
これらのデータセットを視覚化する主要な方法の1つは、データのいくつかの特性を視覚的にキャプチャする2次元散乱プロットである。
これらのプロットの精度を視覚的に決定することは難しいため、研究者はしばしば、プロジェクションの精度と元のデータへの忠実度を測定するために品質指標を使用する。
最もよく用いられる指標の1つ、正規化された応力は、投影について意味のある変化は起こらないが、射影の均一なスケーリング(ストレッチ、縮小)に敏感である。
もうひとつの品質指標は、t-Distributed Stochastic Neighbor Embedding (t-SNE) 技術で使われるKulback-Leibler (KL) のばらつきである。
本研究では, 応力およびKLのばらつきに及ぼすスケーリングの影響を, 測定値がどの程度変化するか, 寸法低減技術の評価にどのように影響するかを示すことによって, 解析的, 実験的に検討した。
両メトリクスをスケール不変にするための簡単な手法を導入し、小さなベンチマークで期待された振る舞いを正確に捉えていることを示す。
関連論文リスト
- A statistical theory of overfitting for imbalanced classification [0.6144680854063939]
我々は高次元不均衡分類の統計理論を開発する。
次元性はロジット分布にトランケーションやスキューイング効果を誘導することがわかった。
この現象は、少数民族が過度な適合によってより深刻な影響を受けている理由を説明する。
論文 参考訳(メタデータ) (2025-02-17T00:21:33Z) - The Star Geometry of Critic-Based Regularizer Learning [2.2530496464901106]
変分正規化は統計的推論タスクと逆問題の解法である。
近年の課題依存型レギュレータの学習は, 測定値と地上データとを統合して行われている。
このプロセスを通して学んだ正規化器の構造と、それが2つのデータ分布とどのように関係するかについては、ほとんど理論がない。
論文 参考訳(メタデータ) (2024-08-29T18:34:59Z) - "Normalized Stress" is Not Normalized: How to Interpret Stress Correctly [0.4915744683251151]
応力は、高次元データの次元縮小投影に対して最もよく用いられる品質指標と最適化基準の1つである。
最も一般的に用いられる指標の1つ、正規化された応力は、投影に関する意味的な変化がないにもかかわらず、射影の均一なスケーリングに敏感である。
正規化応力スケールを不変にするための簡単な手法を導入し、小さなベンチマークで予測された振る舞いを正確に捉えていることを示す。
論文 参考訳(メタデータ) (2024-08-14T13:42:47Z) - Geo-Localization Based on Dynamically Weighted Factor-Graph [74.75763142610717]
特徴に基づくジオローカライゼーションは、航空画像から抽出された特徴と車両のセンサーによって検出された特徴とを関連付けることに依存する。
これにより、ランドマークの種類は両方のソースから観測できなければならない。
車両軌道推定のための動的重み付き因子グラフモデルを提案する。
論文 参考訳(メタデータ) (2023-11-13T12:44:14Z) - Gradient-Based Feature Learning under Structured Data [57.76552698981579]
異方性設定では、一般的に使用される球面勾配力学は真の方向を回復できないことがある。
バッチ正規化を連想させる適切な重み正規化は、この問題を軽減することができることを示す。
特に、スパイクモデルの下では、勾配に基づくトレーニングのサンプルの複雑さは情報指数とは独立にできる。
論文 参考訳(メタデータ) (2023-09-07T16:55:50Z) - An evaluation framework for dimensionality reduction through sectional
curvature [59.40521061783166]
本研究は,非教師付き次元減少性能指標を初めて導入することを目的としている。
その実現可能性をテストするために、この測定基準は最もよく使われる次元削減アルゴリズムの性能を評価するために用いられている。
新しいパラメータ化問題インスタンスジェネレータが関数ジェネレータの形式で構築されている。
論文 参考訳(メタデータ) (2023-03-17T11:59:33Z) - Self-similarity Driven Scale-invariant Learning for Weakly Supervised
Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。
本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。
PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-02-25T04:48:11Z) - A Geometric Perspective towards Neural Calibration via Sensitivity
Decomposition [31.557715381838147]
視覚分類モデルがデータ分散シフトの際のキャリブレーションの低下に悩まされることはよく知られている。
本稿では,インスタンスに依存しない,インスタンスに依存しないコンポーネントに埋め込まれたサンプル特徴のノルムを分解する幾何学的感度分解(GSD)を提案する。
この分解に触発されて、我々は現在のソフトマックス線形モデルへの単純な拡張を解析的に導き、トレーニング中に2つのコンポーネントをアンタングルすることを学ぶ。
論文 参考訳(メタデータ) (2021-10-27T16:46:41Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。