論文の概要: TOAN: Target-Oriented Alignment Network for Fine-Grained Image
Categorization with Few Labeled Samples
- arxiv url: http://arxiv.org/abs/2005.13820v2
- Date: Wed, 10 Mar 2021 05:40:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 05:19:59.112941
- Title: TOAN: Target-Oriented Alignment Network for Fine-Grained Image
Categorization with Few Labeled Samples
- Title(参考訳): toan: 少ないラベル付きサンプルで細粒度画像分類を行うターゲット指向アライメントネットワーク
- Authors: Huaxi Huang, Junjie Zhang, Jian Zhang, Qiang Wu, Chang Xu
- Abstract要約: 本稿では,対象のクエリイメージとサポートクラスとの関係を詳細に把握するために,TOAN(Target-Oriented Alignment Network)を提案する。
各サポート画像の特徴は、埋め込み特徴空間内のクエリ特徴と一致するように変換され、各カテゴリ内での差異を明示的に低減する。
- 参考スコア(独自算出の注目度): 25.68199820110267
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The challenges of high intra-class variance yet low inter-class fluctuations
in fine-grained visual categorization are more severe with few labeled samples,
\textit{i.e.,} Fine-Grained categorization problems under the Few-Shot setting
(FGFS). High-order features are usually developed to uncover subtle differences
between sub-categories in FGFS, but they are less effective in handling the
high intra-class variance. In this paper, we propose a Target-Oriented
Alignment Network (TOAN) to investigate the fine-grained relation between the
target query image and support classes. The feature of each support image is
transformed to match the query ones in the embedding feature space, which
reduces the disparity explicitly within each category. Moreover, different from
existing FGFS approaches devise the high-order features over the global image
with less explicit consideration of discriminative parts, we generate
discriminative fine-grained features by integrating compositional concept
representations to global second-order pooling. Extensive experiments are
conducted on four fine-grained benchmarks to demonstrate the effectiveness of
TOAN compared with the state-of-the-art models.
- Abstract(参考訳): FGFS(Few-Shot set)の下での細粒度視覚分類におけるクラス内偏差の増大とクラス間ゆらぎの低さの課題は、少ないラベル付きサンプルでより深刻である。
高次特徴は、FGFSのサブカテゴリ間の微妙な差異を明らかにするために通常開発されるが、高いクラス内分散を扱うには効果が低い。
本稿では,対象とする問合せ画像と支援クラスとのきめ細かな関係を調べるための目標指向アライメントネットワーク(toan)を提案する。
各サポート画像の特徴は、埋め込み特徴空間内のクエリ特徴と一致するように変換され、各カテゴリ内での差異を明示的に低減する。
さらに, 従来のFGFSアプローチと異なり, 大域的画像上の高次特徴を識別的部分の明確な考慮なく考案し, 合成概念表現をグローバルな2次プールに組み込むことにより, 識別的細粒度特徴を生成する。
最先端モデルと比較して,TOANの有効性を示すために,4つのきめ細かいベンチマーク実験を行った。
関連論文リスト
- EIANet: A Novel Domain Adaptation Approach to Maximize Class Distinction with Neural Collapse Principles [15.19374752514876]
ソースフリードメイン適応(SFDA)は、ラベル付きソースドメインから未ラベルのターゲットドメインに知識を転送することを目的としている。
SFDAにおける大きな課題は、ターゲットドメインの正確な分類情報を導き出すことである。
クラスプロトタイプを分離するための新しいETF-Informed Attention Network(EIANet)を導入する。
論文 参考訳(メタデータ) (2024-07-23T05:31:05Z) - Beyond Mask: Rethinking Guidance Types in Few-shot Segmentation [67.35274834837064]
我々は、テキスト、マスク、ボックス、画像からのプロンプトを統合するユニバーサルビジョン言語フレームワーク(UniFSS)を開発した。
UniFSSは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-07-16T08:41:01Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Balanced Classification: A Unified Framework for Long-Tailed Object
Detection [74.94216414011326]
従来の検出器は、分類バイアスによる長期データを扱う際の性能劣化に悩まされる。
本稿では,カテゴリ分布の格差に起因する不平等の適応的是正を可能にする,BAlanced CLassification (BACL) と呼ばれる統一フレームワークを提案する。
BACLは、さまざまなバックボーンとアーキテクチャを持つさまざまなデータセット間で、一貫してパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-08-04T09:11:07Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - R2-Trans:Fine-Grained Visual Categorization with Redundancy Reduction [21.11038841356125]
細粒度視覚分類(FGVC)は、クラス内の大きな多様性と微妙なクラス間差が主な課題である類似のサブカテゴリを識別することを目的としている。
本稿では,FGVCに対する新たなアプローチを提案する。FGVCは,環境条件における部分的かつ十分な識別情報を同時に利用でき,また,対象物に対するクラストークンにおける冗長情報を圧縮することができる。
論文 参考訳(メタデータ) (2022-04-21T13:35:38Z) - BDA-SketRet: Bi-Level Domain Adaptation for Zero-Shot SBIR [52.78253400327191]
BDA-SketRetは、視覚データペアの空間的特徴と意味的特徴を整合させるために、バイレベルドメイン適応を実行する新しいフレームワークである。
拡張されたSketchy、TU-Berlin、QuickDrawの実験結果は、文献よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-01-17T18:45:55Z) - A Compositional Feature Embedding and Similarity Metric for
Ultra-Fine-Grained Visual Categorization [16.843126268445726]
きめ細かい視覚分類(FGVC)は、クラス間の差異が小さいオブジェクトを分類することを目的としている。
本稿では,超微細な視覚分類のための新しい構成的特徴埋め込みと類似度指標(CECS)を提案する。
最近のベンチマーク手法を用いた2つの超FGVCデータセットと1つのFGVCデータセットの実験結果から,提案手法が最先端性能を実現することを一貫して示している。
論文 参考訳(メタデータ) (2021-09-25T15:05:25Z) - Channel DropBlock: An Improved Regularization Method for Fine-Grained
Visual Classification [58.07257910065007]
既存のアプローチは主に、識別的部分を見つけるための注意機構や、高度にパラメータ化された特徴を弱教師付きで抽出する特徴符号化アプローチを導入することでこの問題に対処している。
本研究では,CDB(Channel DropBlock)と呼ばれる軽量で効果的な正規化手法を提案する。
論文 参考訳(メタデータ) (2021-06-07T09:03:02Z) - Label Geometry Aware Discriminator for Conditional Generative Networks [40.89719383597279]
条件付きGenerative Adversarial Networks(GAN)は、目的のターゲットクラスで高画質の画像を生成することができます。
これらの合成画像は、画像分類などの下流監督タスクを改善するために必ずしも役に立たない。
論文 参考訳(メタデータ) (2021-05-12T08:17:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。