論文の概要: Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment
- arxiv url: http://arxiv.org/abs/2210.01439v1
- Date: Tue, 4 Oct 2022 07:54:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 14:23:25.407903
- Title: Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment
- Title(参考訳): 背景抑制と前景アライメントを用いたファウショット微粒化認識
- Authors: Zican Zha, Hao Tang, Yunlian Sun, and Jinhui Tang
- Abstract要約: FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
- 参考スコア(独自算出の注目度): 53.401889855278704
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot fine-grained recognition (FS-FGR) aims to recognize novel
fine-grained categories with the help of limited available samples.
Undoubtedly, this task inherits the main challenges from both few-shot learning
and fine-grained recognition. First, the lack of labeled samples makes the
learned model easy to overfit. Second, it also suffers from high intra-class
variance and low inter-class difference in the datasets. To address this
challenging task, we propose a two-stage background suppression and foreground
alignment framework, which is composed of a background activation suppression
(BAS) module, a foreground object alignment (FOA) module, and a local to local
(L2L) similarity metric. Specifically, the BAS is introduced to generate a
foreground mask for localization to weaken background disturbance and enhance
dominative foreground objects. What's more, considering the lack of labeled
samples, we compute the pairwise similarity of feature maps using both the raw
image and the refined image. The FOA then reconstructs the feature map of each
support sample according to its correction to the query ones, which addresses
the problem of misalignment between support-query image pairs. To enable the
proposed method to have the ability to capture subtle differences in confused
samples, we present a novel L2L similarity metric to further measure the local
similarity between a pair of aligned spatial features in the embedding space.
Extensive experiments conducted on multiple popular fine-grained benchmarks
demonstrate that our method outperforms the existing state-of-the-art by a
large margin.
- Abstract(参考訳): FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
このタスクは、数発の学習ときめ細かい認識の両方から主要な課題を継承する。
まず、ラベル付きサンプルの欠如により、学習したモデルがオーバーフィットしやすくなる。
第二に、データセットのクラス内ばらつきが高く、クラス間の違いも低い。
本稿では,この課題に対処するために,背景活性化抑制(bas)モジュール,フォアグラウンドオブジェクトアライメント(foa)モジュール,局所的/局所的(l2l)類似度メトリクスからなる2段階の背景抑制・前景アライメントフレームワークを提案する。
具体的には、BASを導入して、背景乱れを弱め、支配的な前景オブジェクトを強化するために、前景マスクを生成する。
さらに,ラベル付きサンプルの欠如を考慮すると,生画像と精巧な画像の両方を用いて特徴地図の相似性を計算する。
FOAは、各サポートサンプルの特徴マップを、クエリマップの修正に従って再構成し、サポートクエリとイメージペア間のミスアライメントの問題に対処する。
提案手法は, 混合試料の微妙な相違を捉えることができるため, 埋め込み空間における一対の空間的特徴の局所的類似度を更に測定する新しいL2L類似度尺度を提案する。
複数のベンチマークで行った大規模な実験により、我々の手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
関連論文リスト
- Skeleton-Guided Instance Separation for Fine-Grained Segmentation in
Microscopy [23.848474219551818]
顕微鏡(MS)画像解析における基本的な課題の1つは、インスタンスセグメンテーション(IS)である。
我々は,この課題に対処し,MS画像におけるISの精度を高めるために,A2B-ISという新しいワンステージフレームワークを提案する。
提案手法は2つの大規模MSデータセットに対して徹底的に検証されている。
論文 参考訳(メタデータ) (2024-01-18T11:14:32Z) - Dense Affinity Matching for Few-Shot Segmentation [83.65203917246745]
Few-Shot (FSS) は、新しいクラスイメージをいくつかのサンプルで分割することを目的としている。
本稿では,サポートクエリ間の相互作用を生かした密接な親和性マッチングフレームワークを提案する。
我々のフレームワークは0.68万のパラメータしか持たない異なる設定で非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2023-07-17T12:27:15Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Embedding contrastive unsupervised features to cluster in- and
out-of-distribution noise in corrupted image datasets [18.19216557948184]
Web画像検索に検索エンジンを使用することは、イメージデータセットを作成する際の手作業によるキュレーションに代わる誘惑的な手段である。
主な欠点は、回収された間違った(ノイズの多い)サンプルの割合である。
本稿では,教師なしのコントラスト特徴学習を用いた検出ステップから始める2段階のアルゴリズムを提案する。
比較学習のアライメントと均一性原理により,OODサンプルは単位超球面上のIDサンプルから線形に分離できることがわかった。
論文 参考訳(メタデータ) (2022-07-04T16:51:56Z) - BDA-SketRet: Bi-Level Domain Adaptation for Zero-Shot SBIR [52.78253400327191]
BDA-SketRetは、視覚データペアの空間的特徴と意味的特徴を整合させるために、バイレベルドメイン適応を実行する新しいフレームワークである。
拡張されたSketchy、TU-Berlin、QuickDrawの実験結果は、文献よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-01-17T18:45:55Z) - Inter-class Discrepancy Alignment for Face Recognition [55.578063356210144]
IA(Inter-class DiscrepancyAlignment)という統合フレームワークを提案する。
IDA-DAOは、画像と隣人の相違を考慮した類似度スコアの整合に使用される。
IDA-SSEは、GANで生成された仮想候補画像を導入することで、説得力のあるクラス間隣人を提供できます。
論文 参考訳(メタデータ) (2021-03-02T08:20:08Z) - ANL: Anti-Noise Learning for Cross-Domain Person Re-Identification [25.035093667770052]
2つのモジュールを含むアンチノイズラーニング(ANL)アプローチを提案します。
FDAモジュールは、カメラ回りのコントラスト学習と逆適応を通じて、ID関連サンプルを収集し、ID非関連サンプルを分散するように設計されています。
reliable sample selection(rss)モジュールは、ノイズラベルを訂正し、メインモデルの信頼できるサンプルを選択するために補助モデルを使用する。
論文 参考訳(メタデータ) (2020-12-27T02:38:45Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。