論文の概要: Geodesic Prototype Matching via Diffusion Maps for Interpretable Fine-Grained Recognition
- arxiv url: http://arxiv.org/abs/2509.17050v1
- Date: Sun, 21 Sep 2025 12:15:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.090748
- Title: Geodesic Prototype Matching via Diffusion Maps for Interpretable Fine-Grained Recognition
- Title(参考訳): 微細粒度認識のための拡散マップによる測地的プロトタイプマッチング
- Authors: Junhao Jia, Yunyou Liu, Yifei Sun, Huangwei Chen, Feiwei Qin, Changmiao Wang, Yong Peng,
- Abstract要約: 本稿では,深部特徴の内在的幾何学において類似性を固定するプロトタイプベース認識のための新しいパラダイムを提案する。
具体的には、各クラスの潜在多様体構造を拡散空間に蒸留し、微分可能なナイストローム距離を導入する。
効率性を確保するために、周期的な更新を伴うクラスごとのランドマークセットをコンパクトに採用する。
- 参考スコア(独自算出の注目度): 8.300049635963141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nonlinear manifolds are widespread in deep visual features, where Euclidean distances often fail to capture true similarity. This limitation becomes particularly severe in prototype-based interpretable fine-grained recognition, where subtle semantic distinctions are essential. To address this challenge, we propose a novel paradigm for prototype-based recognition that anchors similarity within the intrinsic geometry of deep features. Specifically, we distill the latent manifold structure of each class into a diffusion space and introduce a differentiable Nystr\"om interpolation, making the geometry accessible to both unseen samples and learnable prototypes. To ensure efficiency, we employ compact per-class landmark sets with periodic updates. This design keeps the embedding aligned with the evolving backbone, enabling fast and scalable inference. Extensive experiments on the CUB-200-2011 and Stanford Cars datasets show that our GeoProto framework produces prototypes focusing on semantically aligned parts, significantly outperforming Euclidean prototype networks.
- Abstract(参考訳): 非線形多様体は深い視覚的特徴に広がり、ユークリッド距離は真の類似性を捉えないことが多い。
この制限は、微妙な意味的区別が不可欠であるプロトタイプベースの解釈可能な微粒化認識において特に深刻になる。
この課題に対処するために,深部特徴の内在的幾何学において類似性を固定するプロトタイプベース認識のための新しいパラダイムを提案する。
具体的には、各クラスの潜在多様体構造を拡散空間に蒸留し、微分可能な Nystr\"om 補間を導入することにより、幾何学は目に見えないサンプルと学習可能なプロトタイプの両方にアクセスできる。
効率性を確保するために、周期的な更新を伴うクラスごとのランドマークセットをコンパクトに採用する。
この設計は、組み込みを進化するバックボーンと一致させ、高速でスケーラブルな推論を可能にする。
CUB-200-2011およびStanford Carsデータセットの大規模な実験により、我々のGeoProtoフレームワークは、意味的に整合した部分に焦点を当てたプロトタイプを生産し、ユークリッドのプロトタイプネットワークを著しく上回った。
関連論文リスト
- Few to Big: Prototype Expansion Network via Diffusion Learner for Point Cloud Few-shot Semantic Segmentation [12.971351926107289]
Prototype Expansion Network (PENet) は、2つのアノテートされた特徴源から大容量のプロトタイプを構築するフレームワークである。
PENetは、様々ないくつかのショット設定で最先端のメソッドを著しく上回っている。
論文 参考訳(メタデータ) (2025-09-16T09:29:46Z) - Rethinking Features-Fused-Pyramid-Neck for Object Detection [0.0]
本稿では,マルチヘッド検出器における特徴アンフューズドピラミドネックの有効性を評価するために,独立階層ピラミッド(IHP)アーキテクチャを提案する。
また,各階層における特徴核融合の影響を軽減するために,重度下降係数を持つ軟質近傍(SNI)も導入した。
これらの進歩は,Pascal および MS におけるリアルタイム検出のための二次特徴アライメントソリューション (SA) で達成され,最先端の結果が得られた。
論文 参考訳(メタデータ) (2025-05-19T08:01:11Z) - GSSF: Generalized Structural Sparse Function for Deep Cross-modal Metric Learning [51.677086019209554]
ペアワイド類似性学習のためのモダリティ間の強力な関係を捕捉する汎用構造スパースを提案する。
距離メートル法は、対角線とブロック対角線の2つの形式を微妙にカプセル化する。
クロスモーダルと2つの余分なユニモーダル検索タスクの実験は、その優位性と柔軟性を検証した。
論文 参考訳(メタデータ) (2024-10-20T03:45:50Z) - Beyond Prototypes: Semantic Anchor Regularization for Better
Representation Learning [82.29761875805369]
表現学習の最終的な目標の1つは、クラス内のコンパクトさとクラス間の十分な分離性を達成することである。
本稿では,機能セントロイドとして機能する事前定義されたクラスアンカーを用いて,特徴学習を一方向ガイドする新しい視点を提案する。
提案したSemantic Anchor Regularization (SAR) は,既存モデルのプラグアンドプレイ方式で使用することができる。
論文 参考訳(メタデータ) (2023-12-19T05:52:38Z) - Engineering the Neural Collapse Geometry of Supervised-Contrastive Loss [28.529476019629097]
Supervised-Contrastive Los (SCL) は、分類タスクのためのクロスエントロピー(CE)の代替品である。
コントラスト損失を補正することにより,学習した特徴埋め込みの幾何学を設計する手法を提案する。
論文 参考訳(メタデータ) (2023-10-02T04:23:17Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - ContraFeat: Contrasting Deep Features for Semantic Discovery [102.4163768995288]
StyleGANは、アンタングル化セマンティックコントロールの強い可能性を示している。
StyleGANの既存の意味発見手法は、修正された潜在層を手作業で選択することで、良好な操作結果が得られる。
本稿では,このプロセスを自動化し,最先端のセマンティック発見性能を実現するモデルを提案する。
論文 参考訳(メタデータ) (2022-12-14T15:22:13Z) - Semi-Supervised Manifold Learning with Complexity Decoupled Chart Autoencoders [45.29194877564103]
本研究は、クラスラベルなどの半教師付き情報を付加できる非対称符号化復号プロセスを備えたチャートオートエンコーダを導入する。
このようなネットワークの近似力を議論し、周囲空間の次元ではなく、本質的にデータ多様体の内在次元に依存する境界を導出する。
論文 参考訳(メタデータ) (2022-08-22T19:58:03Z) - Quadric hypersurface intersection for manifold learning in feature space [52.83976795260532]
適度な高次元と大きなデータセットに適した多様体学習技術。
この手法は、二次超曲面の交点という形で訓練データから学習される。
テスト時、この多様体は任意の新しい点に対する外れ値スコアを導入するのに使うことができる。
論文 参考訳(メタデータ) (2021-02-11T18:52:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。