論文の概要: Towards an Explainable Comparison and Alignment of Feature Embeddings
- arxiv url: http://arxiv.org/abs/2506.06231v1
- Date: Fri, 06 Jun 2025 16:50:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.557268
- Title: Towards an Explainable Comparison and Alignment of Feature Embeddings
- Title(参考訳): 特徴埋め込みの具体的比較とアライメントに向けて
- Authors: Mohammad Jalali, Bahar Dibaei Nia, Farzan Farnia,
- Abstract要約: 本研究では,組込みの比較を行うSPECフレームワークを提案し,参照データセットのクラスタリングにおける差を識別する。
本稿では、このカーネルベースのアプローチをスケーラブルに実装し、サンプルサイズとともに線形に成長する計算複雑性について述べる。
画像ネットやMS-COCOのような大規模データセット上での埋め込みの比較と整列を行うSPECの適用例を示す数値的な結果を提供する。
- 参考スコア(独自算出の注目度): 8.056359341994941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While several feature embedding models have been developed in the literature, comparisons of these embeddings have largely focused on their numerical performance in classification-related downstream applications. However, an interpretable comparison of different embeddings requires identifying and analyzing mismatches between sample groups clustered within the embedding spaces. In this work, we propose the \emph{Spectral Pairwise Embedding Comparison (SPEC)} framework to compare embeddings and identify their differences in clustering a reference dataset. Our approach examines the kernel matrices derived from two embeddings and leverages the eigendecomposition of the difference kernel matrix to detect sample clusters that are captured differently by the two embeddings. We present a scalable implementation of this kernel-based approach, with computational complexity that grows linearly with the sample size. Furthermore, we introduce an optimization problem using this framework to align two embeddings, ensuring that clusters identified in one embedding are also captured in the other model. We provide numerical results demonstrating the SPEC's application to compare and align embeddings on large-scale datasets such as ImageNet and MS-COCO. The code is available at [https://github.com/mjalali/embedding-comparison](github.com/mjalali/embedding-comparison).
- Abstract(参考訳): 文献においていくつかの特徴埋め込みモデルが開発されているが、これらの埋め込みの比較は、分類関連下流アプリケーションにおける数値性能に主に焦点を当てている。
しかし、異なる埋め込みの解釈可能な比較では、埋め込み空間内でクラスタ化されたサンプル群間のミスマッチを特定し解析する必要がある。
本研究では,組込みの比較を行い,参照データセットのクラスタリングにおける差分を識別するための,emph{Spectral Pairwise Embedding Comparison (SPEC) フレームワークを提案する。
提案手法では, 2つの埋め込みから得られたカーネル行列を解析し, 差分カーネル行列の固有分解を利用して, 2つの埋め込みによって異なる捕集されたサンプルクラスタを検出する。
本稿では、このカーネルベースのアプローチをスケーラブルに実装し、サンプルサイズとともに線形に成長する計算複雑性について述べる。
さらに,このフレームワークを用いて2つの埋め込みをアライメントし,一方の埋め込みで特定されたクラスタが他方のモデルでキャプチャされることを保証する最適化問題を提案する。
画像ネットやMS-COCOのような大規模データセット上での埋め込みの比較と整列を行うSPECの適用例を示す数値的な結果を提供する。
コードは[https://github.com/mjalali/embedding-comparison](github.com/mjalali/embedding-comparison]で入手できる。
関連論文リスト
- Measuring similarity between embedding spaces using induced neighborhood graphs [10.056989400384772]
本稿では,ペアの項目表現の類似性を評価するための指標を提案する。
この結果から,類似度とゼロショット分類タスクの精度が類似度と相関していることが示唆された。
論文 参考訳(メタデータ) (2024-11-13T15:22:33Z) - Self Supervised Correlation-based Permutations for Multi-View Clustering [7.093692674858257]
汎用データ型のためのエンドツーエンドのディープラーニングに基づくマルチビュークラスタリングフレームワークを提案する。
提案手法は,新しい置換に基づく正準相関目標を用いた有意義な融合表現を生成する。
論文 参考訳(メタデータ) (2024-02-26T08:08:30Z) - CLAMS: A Cluster Ambiguity Measure for Estimating Perceptual Variability
in Visual Clustering [23.625877882403227]
本稿では,クラスタアンビグニティ(Cluster Ambiguity)と呼ばれる視覚的クラスタリングを行う際の知覚的変動について検討する。
我々は,モノクローム散乱体におけるクラスタのあいまいさを自動的に予測する,データ駆動型視覚品質尺度であるCLAMSを紹介する。
論文 参考訳(メタデータ) (2023-08-01T04:46:35Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial
Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。
提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文 参考訳(メタデータ) (2022-03-01T02:32:25Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Near-Optimal Comparison Based Clustering [7.930242839366938]
提案手法は, ほぼ最適な比較数を用いて, 植え付けクラスタリングを復元できることを示す。
理論的知見を実証的に検証し,実データ上での手法の良好な振る舞いを実証する。
論文 参考訳(メタデータ) (2020-10-08T12:03:13Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Conjoined Dirichlet Process [63.89763375457853]
我々はディリクレ過程に基づく新しい非パラメトリック確率的ビクラスタリング法を開発し、列と列の双方に強い共起を持つビクラスタを同定する。
本手法はテキストマイニングと遺伝子発現解析の2つの異なる応用に適用し,既存の手法に比べて多くの設定でビクラスタ抽出を改善することを示す。
論文 参考訳(メタデータ) (2020-02-08T19:41:23Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。