論文の概要: Learning to Align Generative Appearance Priors for Fine-grained Image Retrieval
- arxiv url: http://arxiv.org/abs/2605.09859v1
- Date: Mon, 11 May 2026 01:35:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.458396
- Title: Learning to Align Generative Appearance Priors for Fine-grained Image Retrieval
- Title(参考訳): きめ細かい画像検索のための生成的出現前処理の学習
- Authors: Shijie Wang, Yadan Luo, Zijian Wang, Xin Yu, Zi Huang,
- Abstract要約: GAPanは、カテゴリー予測から外観モデリングへの学習目標を再構成するアライメントネットワークである。
GAPanは、広く使われている細粒度ベンチマークと粗粒度ベンチマークの両方で最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 54.09324791167742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained image retrieval (FGIR) typically relies on supervision from seen categories to learn discriminative embeddings for retrieving unseen categories. However, such supervision often biases retrieval models toward the semantics of seen categories rather than the underlying appearance characteristics that generalize across categories, thereby limiting retrieval performance on unseen categories. To tackle this, we propose GAPan, a Generative Appearance Prior alignment network that reformulates the learning objective from category prediction toward appearance modeling. Technically, GAPan treats retrieval features with an invertible density model based on normalizing flows. In the forward direction, the flow maps all instance features into a latent density space, where each seen category is modeled by a class-conditional Gaussian prior and optimized via exact likelihood estimation. This formulation preserves richer appearance details by leveraging the invertible property of the flows. In the reverse direction, samples from the high-density regions of these learned priors are mapped back to the feature space to produce appearance-aware anchors that reflect intra-category variation. These anchors supervise a prior-driven alignment objective that aligns retrieval embeddings with category-specific appearance distributions, thereby improving generalization to unseen categories. Evaluations demonstrate that our GAPan achieves state-of-the-art performance on both widely-used fine- and coarse-grained benchmarks.
- Abstract(参考訳): きめ細かい画像検索(FGIR)は、通常、目に見えないカテゴリを検索するために識別的埋め込みを学ぶために、目に見えないカテゴリの監督に依存する。
しかし、このような監督は、カテゴリ全体にわたって一般化される基本的な外観特性よりも、目に見えないカテゴリのセマンティクスに対する検索モデルに偏りがあるため、目に見えないカテゴリでの検索性能が制限されることが多い。
そこで本研究では,学習対象をカテゴリー予測から外観モデルへ変換するGAPanを提案する。
技術的には、GAPanは正規化フローに基づいた非可逆密度モデルで検索機能を扱います。
前方方向では、フローは全てのインスタンス特徴を潜在密度空間にマッピングし、各カテゴリーはクラス条件ガウスによって事前にモデル化され、正確な推定によって最適化される。
この定式化は、フローの可逆性を活用することにより、よりリッチな外観の詳細を保存する。
逆方向では、これらの学習前の高密度領域からのサンプルを特徴空間にマッピングし、カテゴリ内変動を反映した外観認識アンカーを生成する。
これらのアンカーは、検索埋め込みをカテゴリ固有の外観分布と整合させる事前駆動アライメントの目的を監督し、その結果、目に見えないカテゴリへの一般化を改善する。
我々のGAPanは、広く使われている細粒度ベンチマークと粗粒度ベンチマークの両方で最先端のパフォーマンスを実現していることを示す。
関連論文リスト
- Adversarial Reconstruction Feedback for Robust Fine-grained Generalization [29.202222418152285]
AdvRFは,カテゴリ非依存の差分表現を学習するための,新たな逆変換フィードバックフレームワークである。
FGIRは、検索モデルからカテゴリ認識の離散化を相乗化することにより、視覚的不一致再構築タスクとして再構成する。
広く使われているきめ細かいデータセットと粗いきめ細かなデータセットの両方で、素晴らしいパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-07-29T12:20:03Z) - Learn to Categorize or Categorize to Learn? Self-Coding for Generalized
Category Discovery [49.1865089933055]
テスト時に未知のカテゴリを発見できる新しい,効率的かつ自己管理手法を提案する。
このアプローチの健全な特徴は、個々のデータインスタンスに最小長のカテゴリコードの割り当てである。
試行錯誤による評価は, 提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-10-30T17:45:32Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Imagine by Reasoning: A Reasoning-Based Implicit Semantic Data
Augmentation for Long-Tailed Classification [17.08583412899347]
実世界のデータは、しばしば長い尾の分布に従うため、既存の分類アルゴリズムの性能は大幅に低下する。
本稿では,他のクラスから変換方向を借用する,推論に基づく暗黙的意味データ拡張手法を提案する。
CIFAR-100-LT, ImageNet-LT, iNaturalist 2018の実験結果から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-12-15T07:14:39Z) - On Clustering Categories of Categorical Predictors in Generalized Linear
Models [0.0]
本稿では,分類予測器の存在下での一般化線形モデルの複雑性を低減する手法を提案する。
各カテゴリがダミー変数で表される従来のワンホット符号化は、無駄で解釈が難しく、過度に適合する傾向がある。
本稿では,カテゴリをクラスタリングすることでカテゴリ予測器の表現を小さくすることで,これらの課題に対処する。
論文 参考訳(メタデータ) (2021-10-19T15:36:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。