論文の概要: Scalable and Interpretable Representation Alignment with Ordinal Similarity
- arxiv url: http://arxiv.org/abs/2606.16379v2
- Date: Tue, 16 Jun 2026 08:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.825078
- Title: Scalable and Interpretable Representation Alignment with Ordinal Similarity
- Title(参考訳): 規則的類似性を考慮したスケーラブルで解釈可能な表現アライメント
- Authors: Diogo Soares, Pankhil Gawade, Andrea Dittadi, Ewa Szczurek,
- Abstract要約: 我々は、Triplet (TSI) と Quadruplet (QSI) の類似度指標によってインスタンス化された順序相似性フレームワークを開発する。
この定式化は本質的に解釈可能であり、外れ値に対して頑健であり、計算効率が良いことを実証する。
- 参考スコア(独自算出の注目度): 4.6220510592774575
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Evaluating representation similarity is fundamental to representation learning. However, existing metrics suffer from significant limitations: they lack interpretability due to shifting baselines, lack robustness to outliers, and are computationally intractable for large datasets, forcing reliance on heuristic approximations. To address this, we develop an ordinal-similarity framework, instantiated by the Triplet (TSI) and Quadruplet (QSI) Similarity Indices, which measure alignment by quantifying the consistency of ordinal relationships. We theoretically demonstrate this formulation is inherently interpretable, robust to outliers, and computationally efficient. Finally, we establish a formal equivalence between TSI and local neighborhood alignment, measured by Mutual Nearest Neighbors. Empirically, we validate these properties and show that ordinal similarity offers a scalable approach to measuring alignment, enabling practitioners to better understand and design representations.
- Abstract(参考訳): 表現類似性を評価することは表現学習の基本である。
しかし、既存のメトリクスは、ベースラインのシフトによる解釈可能性の欠如、外れ値への堅牢さの欠如、大規模データセットの計算能力の低下、ヒューリスティックな近似への依存、といった大きな制限に悩まされている。
そこで我々は,Triplet (TSI) と Quadruplet (QSI) similarity Indices (QSI) によってインスタンス化され,順序関係の一貫性を定量化してアライメントを測定する,順序相似性フレームワークを開発した。
理論的には、この定式化は本質的に解釈可能であり、外れ値に対して頑健であり、計算的に効率的である。
最後に,TSI と局所的近傍アライメントの形式的等価性を確立する。
経験的に、これらの特性を検証し、順序の類似性はアライメントを測定するためのスケーラブルなアプローチを提供し、実践者が表現をよりよく理解し、設計できることを示す。
関連論文リスト
- Uncertainty-DTW for Sequences and Visual Tokens [43.798398689900075]
本研究では,不確実性を考慮した対応をモデル化し,アライメントパスに沿って構造化されたマッチングを行う確率的フレームワークである不確実性認識アライメントを導入する。
我々は、このフレームワークを時間列からトークン化された視覚表現に一般化し、視覚トークンの集合に対する構造化マッチングを可能にする。
これらの知見は、構造化データから学習するための一般的な、堅牢で解釈可能なフレームワークとして、不確実性を考慮したアライメントを確立する。
論文 参考訳(メタデータ) (2026-05-24T14:49:43Z) - The Generalized Turing Test: A Foundation for Comparing Intelligence [0.8929189891250133]
識別不能性を通じて任意のエージェントの能力を比較するための公式なフレームワークを導入する。
エージェント A と B に対し、チューリングコンパレータ A$geq$B を定義して、B が微分器として作用し、A との相互作用と B の他のインスタンスとを確実に区別できないと仮定する。
これにより、データセットとタスクに依存しない相対知性の概念が得られる。
論文 参考訳(メタデータ) (2026-05-11T17:00:18Z) - Barycentric alignment for instance-level comparison of neural representations [2.1920579994942164]
我々は、多くのモデルにまたがる普遍的な埋め込み空間を構築するために、ニュアンス対称性を引用するバリ中心アライメントフレームワークを導入する。
視覚および言語モデルファミリ間での表現収束とばらつきを予測できる体系的な入力特性を同定する。
また、同一のバリ中心アライメントフレームワークを純粋に非モーダル視覚と言語モデルに適用し、共有空間へのポストホックアライメントが画像テキストの類似度スコアを得ることを示す。
論文 参考訳(メタデータ) (2026-02-09T21:49:44Z) - Bridging Functional and Representational Similarity via Usable Information [3.9189279162842854]
テクスチャブルな情報のレンズを通して表現間の類似性を定量化する統一的な枠組みを提案する。
まず,機能的類似性に対処し,縫合性能と条件付き相互情報との正式なリンクを確立する。
第2に、表現的類似性について、特定の制約の下で使用可能な情報の推定器として、再構成に基づくメトリクスと標準ツールが機能することを証明する。
論文 参考訳(メタデータ) (2026-01-29T11:30:55Z) - Unifying Information-Theoretic and Pair-Counting Clustering Similarity [51.660331450043806]
クラスタリング類似度尺度は通常、ペアカウントと情報理論の2つの主要なファミリーに分けられる。
本稿では,2つの相補的な観点から,これらの家族を統一する分析枠組みを開発する。
論文 参考訳(メタデータ) (2025-11-04T21:13:32Z) - ASSESS: A Semantic and Structural Evaluation Framework for Statement Similarity [9.337443482551356]
ASSESS (Semantic and Structure Evaluation Framework for Statement similarity) を導入し、セマンティックおよび構造情報を総合的に統合し、連続的な類似度スコアを提供する。
厳密な検証のために,ミニF2F と ProofNet から派生した 524 のエキスパート注釈付き形式文ペアの新しいベンチマーク EPLA を提案する。
EPLAの実験では、TransTEDの類似性は既存の手法よりも優れており、最先端の精度と最高カッパ係数が達成されている。
論文 参考訳(メタデータ) (2025-09-26T12:02:58Z) - The Foundations of Tokenization: Statistical and Computational Concerns [51.370165245628975]
トークン化は、NLPパイプラインにおける重要なステップである。
NLPにおける標準表現法としての重要性は認識されているが、トークン化の理論的基盤はまだ完全には理解されていない。
本稿では,トークン化モデルの表現と解析のための統一的な形式的枠組みを提案することによって,この理論的ギャップに対処することに貢献している。
論文 参考訳(メタデータ) (2024-07-16T11:12:28Z) - Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Duality-Induced Regularizer for Semantic Matching Knowledge Graph
Embeddings [70.390286614242]
本稿では, 類似のセマンティクスを持つエンティティの埋め込みを効果的に促進する新しい正規化器(duality-induced RegulArizer (DURA))を提案する。
実験により、DURAは、最先端のセマンティックマッチングモデルの性能を一貫して改善することを示した。
論文 参考訳(メタデータ) (2022-03-24T09:24:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。