論文の概要: Representation Selection via Cross-Model Agreement using Canonical Correlation Analysis
- arxiv url: http://arxiv.org/abs/2604.00921v1
- Date: Wed, 01 Apr 2026 14:01:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.02329
- Title: Representation Selection via Cross-Model Agreement using Canonical Correlation Analysis
- Title(参考訳): 正準相関解析を用いたクロスモデル合意による表現選択
- Authors: Dylan B. Lewis, Jens Gregor, Hector Santos-Villalobos,
- Abstract要約: 本稿では,ポストホックな正準相関解析演算子を用いて,画像表現の効率を向上させるための簡易な訓練不要手法を提案する。
2つの事前学習された画像エンコーダが生成する表現間の共有構造を利用して、表現選択の原理的な形式として機能する線形射影を求める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern vision pipelines increasingly rely on pretrained image encoders whose representations are reused across tasks and models, yet these representations are often overcomplete and model-specific. We propose a simple, training-free method to improve the efficiency of image representations via a post-hoc canonical correlation analysis (CCA) operator. By leveraging the shared structure between representations produced by two pre-trained image encoders, our method finds linear projections that serve as a principled form of representation selection and dimensionality reduction, retaining shared semantic content while discarding redundant dimensions. Unlike standard dimensionality reduction techniques such as PCA, which operate on a single embedding space, our approach leverages cross-model agreement to guide representation distillation and refinement. The technique allows representations to be reduced by more than 75% in dimensionality with improved downstream performance, or enhanced at fixed dimensionality via post-hoc representation transfer from larger or fine-tuned models. Empirical results on ImageNet-1k, CIFAR-100, MNIST, and additional benchmarks show consistent improvements over both baseline and PCA-projected representations, with accuracy gains of up to 12.6%.
- Abstract(参考訳): 現代のビジョンパイプラインは、タスクやモデル間で表現が再利用される事前訓練されたイメージエンコーダにますます依存しているが、これらの表現はしばしばオーバーコンプリートであり、モデル固有のものである。
ポストホック正準相関解析 (CCA) 演算子を用いて, 画像表現の効率を向上させるための, 簡単な訓練不要な手法を提案する。
予め訓練された2つの画像エンコーダが生成する表現間の共有構造を利用して,表現選択と次元還元の原理的形式として機能し,冗長な次元を排除しながら共有意味内容を保持する線形射影を求める。
一つの埋め込み空間で動作するPCAのような標準次元還元技術とは異なり,本手法では,表現蒸留と精錬の導出にクロスモデル合意を利用する。
この技術により、下流の性能を改善して次元を75%以上削減したり、より大型または微調整されたモデルからのポストホック表現の転送を通じて、固定次元で拡張することができる。
ImageNet-1k、CIFAR-100、MNIST、その他のベンチマークでの実証的な結果は、ベースラインとPCAプロジェクションの両方で一貫した改善が見られ、精度は最大12.6%向上した。
関連論文リスト
- CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval [54.15776146365823]
Composed Image Retrieval (CIR)では、ユーザーは参照画像と操作テキストの両方を使用してターゲットイメージを検索できる。
CSMCIRは3つの相乗的コンポーネントを通して効率的なクエリターゲットアライメントを実現する統一表現フレームワークである。
論文 参考訳(メタデータ) (2026-01-07T09:21:38Z) - GloTok: Global Perspective Tokenizer for Image Reconstruction and Generation [51.95701097588426]
トークン化された特徴のより均一な意味分布をモデル化するために,Global Perspective Tokenizer(GloTok)を導入する。
量子化による再構成誤差を最小限に抑えるために, 微細な細部を復元するために, 残差学習モジュールを提案する。
標準のImageNet-1kベンチマーク実験により,提案手法が最先端の復元性能と生成品質を実現することを確認した。
論文 参考訳(メタデータ) (2025-11-18T06:40:26Z) - Learning Diffusion Models with Flexible Representation Guidance [49.26046407886349]
本稿では,表現指導を拡散モデルに組み込むための体系的枠組みを提案する。
拡散モデルにおける表現アライメントを強化するための2つの新しい戦略を導入する。
画像、タンパク質配列、分子生成タスクにわたる実験は、優れた性能を示し、訓練を加速する。
論文 参考訳(メタデータ) (2025-07-11T19:29:02Z) - Efficient Fairness-Performance Pareto Front Computation [45.088727439928704]
最適公正表現はいくつかの有用な構造特性を持つことを示す。
そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文 参考訳(メタデータ) (2024-09-26T08:46:48Z) - The Deep Generative Decoder: MAP estimation of representations improves
modeling of single-cell RNA data [0.0]
モデルパラメータと表現を直接最大後部推定(MAP)により計算する単純な生成モデルを提案する。
このアプローチの利点は、その単純さと、同等のVAEよりもはるかに小さな次元の表現を提供する能力である。
論文 参考訳(メタデータ) (2021-10-13T12:17:46Z) - Generating Images with Sparse Representations [21.27273495926409]
画像の高次元化は、確率に基づく生成モデルのアーキテクチャとサンプリング効率の課題を示す。
JPEGのような一般的な画像圧縮法に触発された代替手法を提示し、画像を量子化された離散コサイン変換(DCT)ブロックに変換する。
本稿では,次の要素の条件分布を逐次的に予測するトランスフォーマに基づく自己回帰型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-03-05T17:56:03Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。