Fugu-MT 論文翻訳(概要): Surpassing Cosine Similarity for Multidimensional Comparisons: Dimension Insensitive Euclidean Metric

論文の概要: Surpassing Cosine Similarity for Multidimensional Comparisons: Dimension Insensitive Euclidean Metric

arxiv url: http://arxiv.org/abs/2407.08623v4
Date: Mon, 10 Mar 2025 16:17:30 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-12 16:15:11.277239
Title: Surpassing Cosine Similarity for Multidimensional Comparisons: Dimension Insensitive Euclidean Metric
Title（参考訳）: 多次元比較のための余剰コサイン類似性:次元非感受性ユークリッド計量
Authors: Federico Tessari, Kunpeng Yao, Neville Hogan,
Abstract要約: 次元不感なユークリッド計量 (DIEM) を導入し, 寸法間の強靭性と一般化性を示す。 DIEMは、一貫した変動性を維持し、従来のメトリクスで観測されたバイアスを排除し、高次元比較のための信頼できるツールとなる。この新しい計量はコサイン類似性を置き換える可能性があり、神経運動制御から機械学習に至るまでの分野における多次元データをより正確で洞察に富んだ分析方法を提供する。
参考スコア（独自算出の注目度）: 4.415977307120617
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Advances in computational power and hardware efficiency have enabled tackling increasingly complex, high-dimensional problems. While artificial intelligence (AI) achieves remarkable results, the interpretability of high-dimensional solutions remains challenging. A critical issue is the comparison of multidimensional quantities, essential in techniques like Principal Component Analysis. Metrics such as cosine similarity are often used, for example in the development of natural language processing algorithms or recommender systems. However, the interpretability of such metrics diminishes as dimensions increase. This paper analyzes the effects of dimensionality, revealing significant limitations of cosine similarity, particularly its dependency on the dimension of vectors, leading to biased and poorly interpretable outcomes. To address this, we introduce a Dimension Insensitive Euclidean Metric (DIEM) which demonstrates superior robustness and generalizability across dimensions. DIEM maintains consistent variability and eliminates the biases observed in traditional metrics, making it a reliable tool for high-dimensional comparisons. An example of the advantages of DIEM over cosine similarity is reported for a large language model application. This novel metric has the potential to replace cosine similarity, providing a more accurate and insightful method to analyze multidimensional data in fields ranging from neuromotor control to machine learning.
Abstract（参考訳）: 計算能力とハードウェア効率の進歩により、ますます複雑で高次元の問題に対処できるようになった。人工知能(AI)は目覚ましい結果をもたらすが、高次元解の解釈可能性はまだ困難である。重要な問題は、主成分分析のような技術に不可欠な多次元量の比較である。コサイン類似性のようなメトリクスは、例えば自然言語処理アルゴリズムやレコメンダシステムの開発によく用いられる。しかし、これらのメトリクスの解釈可能性は次元が増加するにつれて低下する。本稿では,コサイン類似性の顕著な限界,特にベクトルの次元依存性を解析し,偏りと解釈が不十分な結果をもたらす。これを解決するために,次元不感なユークリッド計量(DIEM)を導入する。 DIEMは、一貫した変動性を維持し、従来のメトリクスで観測されたバイアスを排除し、高次元比較のための信頼できるツールとなる。コーサイン類似性に対するDIEMの利点の例として、大規模言語モデルアプリケーションについて報告する。この新しい計量はコサイン類似性を置き換える可能性があり、神経運動制御から機械学習に至るまでの分野における多次元データをより正確で洞察に富んだ分析方法を提供する。

関連論文リスト

Geometry-Informed Neural Operator Transformer [0.8906214436849201]
この研究はGeometry-Informed Neural Operator Transformer (GINOT)を導入し、任意のジオメトリの前方予測を可能にするために、トランスフォーマーアーキテクチャとニューラルオペレータフレームワークを統合する。 GINOTの性能は複数の挑戦的なデータセットで検証され、複雑で任意の2Dおよび3Dジオメトリに対して高い精度と強力な一般化能力を示す。
論文参考訳（メタデータ） (2025-04-28T03:39:27Z)
PCA-RAG: Principal Component Analysis for Efficient Retrieval-Augmented Generation [0.0]
高次元言語モデル埋め込みは、ストレージとレイテンシの観点からスケーラビリティの課題を提示することができる。本稿では,主成分分析(PCA)を用いた埋め込み次元の低減について検討する。そこで本研究では,PCAに基づく圧縮により,検索精度と資源効率のバランスがとれることを示す。
論文参考訳（メタデータ） (2025-04-11T09:38:12Z)
A Novel Approach for Intrinsic Dimension Estimation [0.0]
実生活データは、その性質から複雑で非線形な構造を持つ。低次元空間におけるデータセットのほぼ最適な表現を見つけることは、機械学習タスクの成功を改善するための適切なメカニズムを提供する。本研究では,高効率で頑健な内在次元推定手法を提案する。
論文参考訳（メタデータ） (2025-03-12T15:42:39Z)
Evaluating Representational Similarity Measures from the Lens of Functional Correspondence [1.7811840395202345]
神経科学と人工知能(AI)はどちらも、高次元のニューラルネットワークの解釈という課題に直面している。表象比較が広く使われているにもかかわらず、重要な疑問が残る: どの指標がこれらの比較に最も適しているのか?
論文参考訳（メタデータ） (2024-11-21T23:53:58Z)
Complexity Matters: Effective Dimensionality as a Measure for Adversarial Robustness [0.7366405857677227]
本研究では,モデルの有効次元性とロバスト性との関係について検討する。 YOLO や ResNet などの実環境でよく使用される商用規模のモデルで実験を行う。実効次元と対向ロバスト性の間のほぼ直線的逆関係を明らかにし、低次元ロバスト性モデルがより良いロバスト性を示すことを示した。
論文参考訳（メタデータ） (2024-10-24T09:01:34Z)
SIMformer: Single-Layer Vanilla Transformer Can Learn Free-Space Trajectory Similarity [11.354974227479355]
本稿では,単一層ベニラ変換器エンコーダのみを特徴抽出器として使用する,シンプルで正確かつ高速でスケーラブルなモデルを提案する。我々のモデルは、次元問題の呪いを著しく軽減し、有効性、効率性、スケーラビリティにおいて最先端の技術を上回ります。
論文参考訳（メタデータ） (2024-10-18T17:30:17Z)
Separable DeepONet: Breaking the Curse of Dimensionality in Physics-Informed Machine Learning [0.0]
ラベル付きデータセットがない場合、PDE残留損失を利用して物理系を学習する。この手法は、主に次元の呪いによる重要な計算課題に直面するが、計算コストは、より詳細な離散化とともに指数関数的に増加する。本稿では,これらの課題に対処し,高次元PDEのスケーラビリティを向上させるために,分離可能なDeepONetフレームワークを紹介する。
論文参考訳（メタデータ） (2024-07-21T16:33:56Z)
Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文参考訳（メタデータ） (2024-05-16T03:01:06Z)
Interpreting the Curse of Dimensionality from Distance Concentration and Manifold Effect [0.6906005491572401]
まず,高次元データの操作に関する5つの課題を要約する。次に、次元、距離集中、多様体効果の呪いの2つの主要な原因を掘り下げる。次元の呪いの原因を解釈することで、現在のモデルやアルゴリズムの限界をよりよく理解することができる。
論文参考訳（メタデータ） (2023-12-31T08:22:51Z)
A Geometrical Approach to Evaluate the Adversarial Robustness of Deep Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文参考訳（メタデータ） (2023-10-10T09:39:38Z)
Simultaneous Dimensionality Reduction: A Data Efficient Approach for Multimodal Representations Learning [0.0]
次元性還元(DR):独立次元性還元(IDR)と同時次元性還元(SDR)の2つの主要クラスを探索する。 IDRでは、各モダリティは独立に圧縮され、可能な限り各モダリティに多くのばらつきを保持するよう努力する。 SDRでは、モダリティを同時に圧縮して、削減された記述間の共変を最大化し、個々の変動がどれだけ保存されているかに注意を払わない。
論文参考訳（メタデータ） (2023-10-05T04:26:24Z)
An evaluation framework for dimensionality reduction through sectional curvature [59.40521061783166]
本研究は,非教師付き次元減少性能指標を初めて導入することを目的としている。その実現可能性をテストするために、この測定基準は最もよく使われる次元削減アルゴリズムの性能を評価するために用いられている。新しいパラメータ化問題インスタンスジェネレータが関数ジェネレータの形式で構築されている。
論文参考訳（メタデータ） (2023-03-17T11:59:33Z)
An Experimental Study of Dimension Reduction Methods on Machine Learning Algorithms with Applications to Psychometrics [77.34726150561087]
次元の減少は、変数の減少を伴わないのと同じ精度で減少、増大、あるいは達成できることを示す。我々の暫定的な結果は、次元の減少が分類タスクに使用する場合、より良い性能をもたらす傾向があることを見出した。
論文参考訳（メタデータ） (2022-10-19T22:07:13Z)
Exploring Dimensionality Reduction Techniques in Multilingual Transformers [64.78260098263489]
本稿では,多言語シームス変圧器の性能に及ぼす次元還元法の影響を包括的に考察する。これは、それぞれ91.58% pm 2.59%$と54.65% pm 32.20%$の次元を平均で減少させることが可能であることを示している。
論文参考訳（メタデータ） (2022-04-18T17:20:55Z)
Adaptive Hierarchical Similarity Metric Learning with Noisy Labels [138.41576366096137]
適応的階層的類似度メトリック学習法を提案する。ノイズに敏感な2つの情報、すなわち、クラスワイドのばらつきとサンプルワイドの一貫性を考える。提案手法は,現在の深層学習手法と比較して,最先端の性能を実現する。
論文参考訳（メタデータ） (2021-10-29T02:12:18Z)
Effective Data-aware Covariance Estimator from Compressed Data [63.16042585506435]
本研究では,データ対応重み付きサンプリングベース共分散行列推定器,すなわち DACE を提案し,非バイアス共分散行列推定を行う。我々は、DACEの優れた性能を示すために、合成データセットと実世界のデータセットの両方で広範な実験を行う。
論文参考訳（メタデータ） (2020-10-10T10:10:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。