論文の概要: Beyond Cosine Similarity
- arxiv url: http://arxiv.org/abs/2602.05266v1
- Date: Thu, 05 Feb 2026 03:46:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.746819
- Title: Beyond Cosine Similarity
- Title(参考訳): コサインの類似性を超えて
- Authors: Xinbo Ai,
- Abstract要約: ベクトル空間における意味的類似度を測定する標準的な計量であるコサイン類似度は、コーシー=シュワルツの不等式に数学的に基礎を置いている。
我々は、古典的なコーシー=シュワルツ境界よりも点積のより強い上界を導出することにより、この理論的な基盤を推し進める。
我々の研究は、複雑な埋め込み空間における意味解析の精度を高めるために、数学的に原理化され、経験的に優れた代替手段としてレトスを確立する。
- 参考スコア(独自算出の注目度): 5.076419064097734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cosine similarity, the standard metric for measuring semantic similarity in vector spaces, is mathematically grounded in the Cauchy-Schwarz inequality, which inherently limits it to capturing linear relationships--a constraint that fails to model the complex, nonlinear structures of real-world semantic spaces. We advance this theoretical underpinning by deriving a tighter upper bound for the dot product than the classical Cauchy-Schwarz bound. This new bound leads directly to recos, a similarity metric that normalizes the dot product by the sorted vector components. recos relaxes the condition for perfect similarity from strict linear dependence to ordinal concordance, thereby capturing a broader class of relationships. Extensive experiments across 11 embedding models--spanning static, contextualized, and universal types--demonstrate that recos consistently outperforms traditional cosine similarity, achieving higher correlation with human judgments on standard Semantic Textual Similarity (STS) benchmarks. Our work establishes recos as a mathematically principled and empirically superior alternative, offering enhanced accuracy for semantic analysis in complex embedding spaces.
- Abstract(参考訳): ベクトル空間における意味的類似性を測定する標準的な計量であるコサイン類似性(英語版)は、コーシー=シュワルツの不等式(英語版)(Cauchy-Schwarz inequality)に数学的に基礎を置いている。
我々は、古典的なコーシー=シュワルツ境界よりも点積のより強い上界を導出することにより、この理論的な基盤を推し進める。
この新たな境界は、ソートされたベクトル成分によってドット積を正規化する類似度計量であるrectosに直接導かれる。
レクトスは、厳密な線形依存から順序の一致への完全類似性の条件を緩和し、より広い関係のクラスを捕捉する。
標準セマンティックテキスト類似性(STS)ベンチマークにおいて、人間の判断と高い相関を達成し、従来のコサイン類似性を一貫して上回る、静的、文脈化、普遍的な型を拡大する11の埋め込みモデルにわたる大規模な実験。
我々の研究は、複雑な埋め込み空間における意味解析の精度を高めるために、数学的に原理化され、経験的に優れた代替手段としてレトスを確立する。
関連論文リスト
- Calibrated Similarity for Reliable Geometric Analysis of Embedding Spaces [0.0]
位置相関と局所安定性を保ちながら、ほぼ完璧なキャリブレーションを実現する等調変換を構築する。
我々の貢献はコサインの類似性を置き換えるのではなく、モノトンキャリブレーションによって絶対値の解釈可能性を取り戻すことである。
論文 参考訳(メタデータ) (2026-01-23T17:14:44Z) - Unifying Information-Theoretic and Pair-Counting Clustering Similarity [51.660331450043806]
クラスタリング類似度尺度は通常、ペアカウントと情報理論の2つの主要なファミリーに分けられる。
本稿では,2つの相補的な観点から,これらの家族を統一する分析枠組みを開発する。
論文 参考訳(メタデータ) (2025-11-04T21:13:32Z) - A unifying separability criterion based on extended correlation tensor [0.0]
絡み合いは古典的量子区切り線への探求を言い換えるので、基本的には不合理である。
相関テンソルに基づく分離性のための実践可能な基準を導入・定式化する。
論文 参考訳(メタデータ) (2024-06-25T02:36:28Z) - Revisiting Cosine Similarity via Normalized ICA-transformed Embeddings [2.8402080392117757]
コサイン類似度は、2つの埋め込みの類似度を測定するために広く用いられている。
本稿では,コサイン類似性の新たな解釈を,軸上の意味的類似性の和として提案する。
論文 参考訳(メタデータ) (2024-06-16T15:44:37Z) - Is Cosine-Similarity of Embeddings Really About Similarity? [46.75365717794515]
コサイン相似性(Cosine-similarity)は、2つのベクトル間の角度のコサイン、すなわちそれらの正規化の間のドット積である。
正規化線形モデルから導かれる埋め込みについて検討し、そこでは閉形式解が解析的洞察を促進する。
我々はコサイン相似性が任意の、したがって無意味な類似性をもたらすか分析的に導出する」。
論文 参考訳(メタデータ) (2024-03-08T16:48:20Z) - Beyond Instance Discrimination: Relation-aware Contrastive
Self-supervised Learning [75.46664770669949]
本稿では,関係認識型コントラスト型自己教師型学習(ReCo)をインスタンス関係に統合するために提案する。
当社のReCoは、常に顕著なパフォーマンス改善を実現しています。
論文 参考訳(メタデータ) (2022-11-02T03:25:28Z) - On the Importance of Gradient Norm in PAC-Bayesian Bounds [92.82627080794491]
対数ソボレフ不等式の縮約性を利用する新しい一般化法を提案する。
我々は、この新たな損失段階的ノルム項が異なるニューラルネットワークに与える影響を実証的に分析する。
論文 参考訳(メタデータ) (2022-10-12T12:49:20Z) - Evaluation of taxonomic and neural embedding methods for calculating
semantic similarity [0.0]
分類学的類似度尺度と分布的類似度尺度のメカニズムについて検討する。
分類学的類似度尺度は、意味的類似度を予測するための素因として、最短経路長に依存する可能性がある。
類似性予測における概念関係と神経埋め込みの相乗効果は、伝達学習における知識ベースを活用する新しい傾向を示す可能性がある。
論文 参考訳(メタデータ) (2022-09-30T02:54:21Z) - Duality-Induced Regularizer for Semantic Matching Knowledge Graph
Embeddings [70.390286614242]
本稿では, 類似のセマンティクスを持つエンティティの埋め込みを効果的に促進する新しい正規化器(duality-induced RegulArizer (DURA))を提案する。
実験により、DURAは、最先端のセマンティックマッチングモデルの性能を一貫して改善することを示した。
論文 参考訳(メタデータ) (2022-03-24T09:24:39Z) - Attentive Normalization for Conditional Image Generation [126.08247355367043]
我々は、従来のインスタンス正規化の拡張である注意的正規化(AN)により、長距離依存を特徴づける。
自己注意型GANと比較して、注意的正規化はすべての位置の相関を測る必要がない。
クラス条件の画像生成とセマンティックインパインティングの実験により,提案モジュールの有効性が検証された。
論文 参考訳(メタデータ) (2020-04-08T06:12:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。