論文の概要: Calibrated Similarity for Reliable Geometric Analysis of Embedding Spaces
- arxiv url: http://arxiv.org/abs/2601.16907v1
- Date: Fri, 23 Jan 2026 17:14:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.778322
- Title: Calibrated Similarity for Reliable Geometric Analysis of Embedding Spaces
- Title(参考訳): 埋め込み空間の信頼性幾何解析のための校正的類似性
- Authors: Nicolas Tacheny,
- Abstract要約: 位置相関と局所安定性を保ちながら、ほぼ完璧なキャリブレーションを実現する等調変換を構築する。
我々の貢献はコサインの類似性を置き換えるのではなく、モノトンキャリブレーションによって絶対値の解釈可能性を取り戻すことである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While raw cosine similarity in pretrained embedding spaces exhibits strong rank correlation with human judgments, anisotropy induces systematic miscalibration of absolute values: scores concentrate in a narrow high-similarity band regardless of actual semantic relatedness, limiting interpretability as a quantitative measure. Prior work addresses this by modifying the embedding space (whitening, contrastive fine tuning), but such transformations alter geometric structure and require recomputing all embeddings. Using isotonic regression trained on human similarity judgments, we construct a monotonic transformation that achieves near-perfect calibration while preserving rank correlation and local stability(98% across seven perturbation types). Our contribution is not to replace cosine similarity, but to restore interpretability of its absolute values through monotone calibration, without altering its ranking properties. We characterize isotonic calibration as an order-preserving reparameterization and prove that all order-based constructions (angular ordering, nearest neighbors, threshold graphs and quantile-based decisions) are invariant under this transformation.
- Abstract(参考訳): 事前学習された埋め込み空間における生のコサイン類似性は人間の判断と強いランク相関を示すが、異方性は絶対値の体系的な誤校正を誘導する:スコアは実際の意味的関連性に関係なく狭義の高相似帯域に集中し、定量的尺度として解釈可能性を制限する。
それまでの作業では、埋め込み空間(白く、対照的な微調整)を変更することでこの問題に対処していたが、そのような変換は幾何学的構造を変え、すべての埋め込みを再計算する必要がある。
ヒトの類似性判定に基づいて訓練された等方性回帰を用いて, 位置相関と局所安定性を保ちながら, ほぼ完全な校正を実現するモノトニック変換を構築した。
我々の貢献はコサインの類似性を置き換えることではなく、単調キャリブレーションによって絶対値の解釈可能性を取り戻すことである。
等方的キャリブレーションを順序保存的パラメータ化として特徴付け、この変換の下ですべての順序に基づく構成(角順序、近傍の隣人、しきい値グラフ、および量子的決定)が不変であることを示す。
関連論文リスト
- Riemannian Zeroth-Order Gradient Estimation with Structure-Preserving Metrics for Geodesically Incomplete Manifolds [57.179679246370114]
測地的に完備な測度を構築し、新しい測度の下での静止点が元の測度の下で定常であることを保証する。
構成された計量$g'$の下の$-固定点もまた、元の計量$g'$の下の$-定常点に対応する。
実用的なメッシュ最適化タスクの実験は、測地的完全性がない場合でも、我々のフレームワークが安定した収束を維持することを示した。
論文 参考訳(メタデータ) (2026-01-12T22:08:03Z) - Solving a Nonlinear Eigenvalue Equation in Quantum Information Theory: A Hybrid Approach to Entanglement Quantification [0.0]
エンタングルメントの幾何学的測度を評価するためのハイブリッド解析および数値的枠組みを提案する。
結合した非線形固有構造を等価乗算器の定常性を証明することによって明示する。
得られたハイブリッドソルバは、標準3キュービットベンチマークの正確な最適化を再現する。
論文 参考訳(メタデータ) (2025-11-14T13:36:47Z) - Benign Overfitting and the Geometry of the Ridge Regression Solution in Binary Classification [75.01389991485098]
リッジ回帰はクラスタ平均ベクトルのスケールによって定性的に異なる挙動を示す。
スケールが非常に大きいレジームでは、良心過剰を許容する条件は回帰タスクと同一であることが判明した。
論文 参考訳(メタデータ) (2025-03-11T01:45:42Z) - Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - On the Uniform Convergence of Subdifferentials in Stochastic Optimization and Learning [1.5229257192293195]
実験的リスクから集団リスクへのサブディファレンシャルマッピングの一様収束を非平滑,非評価,決定論的最適化を用いて検討した。
これらの保証は、堅牢な統計と関連する応用に起因する問題の幾何学に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2024-05-16T17:49:46Z) - Spectrum-Aware Debiasing: A Modern Inference Framework with Applications to Principal Components Regression [1.342834401139078]
本稿では,高次元回帰のための新しい手法であるSpectrumAware Debiasingを紹介する。
我々のアプローチは、構造的、重く、低ランクな構造に関する問題に適用できる。
シミュレーションおよび実データ実験により本手法を実証する。
論文 参考訳(メタデータ) (2023-09-14T15:58:30Z) - Last-Iterate Convergence of Adaptive Riemannian Gradient Descent for Equilibrium Computation [52.73824786627612]
本稿では,テクスト幾何学的強単調ゲームに対する新たな収束結果を確立する。
我々のキーとなる結果は、RGDがテクスト幾何学的手法で最終定位線形収束を実現することを示しています。
全体として、ユークリッド設定を超えるゲームに対して、幾何学的に非依存な最終点収束解析を初めて提示する。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。