論文の概要: Background-aware Classification Activation Map for Weakly Supervised
Object Localization
- arxiv url: http://arxiv.org/abs/2112.14379v1
- Date: Wed, 29 Dec 2021 03:12:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-30 15:22:21.683631
- Title: Background-aware Classification Activation Map for Weakly Supervised
Object Localization
- Title(参考訳): 弱教師付きオブジェクトローカライゼーションのためのバックグラウンドアウェア分類活性化マップ
- Authors: Lei Zhu, Qi She, Qian Chen, Xiangxi Meng, Mufeng Geng, Lujia Jin, Zhe
Jiang, Bin Qiu, Yunfei You, Yibao Zhang, Qiushi Ren, Yanye Lu
- Abstract要約: 対象と背景の両方のローカライズスコアを同時に学習するための背景認識型分類活性化マップ(B-CAM)を提案する。
我々のB-CAMは、提案したスタガー分類損失に基づいてエンドツーエンドで訓練することができる。
実験の結果,我々のB-CAMはCUB-200,OpenImages,VOC2012データセット上で一段階WSOL法より優れていた。
- 参考スコア(独自算出の注目度): 14.646874544729426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization (WSOL) relaxes the requirement of dense
annotations for object localization by using image-level classification masks
to supervise its learning process. However, current WSOL methods suffer from
excessive activation of background locations and need post-processing to obtain
the localization mask. This paper attributes these issues to the unawareness of
background cues, and propose the background-aware classification activation map
(B-CAM) to simultaneously learn localization scores of both object and
background with only image-level labels. In our B-CAM, two image-level
features, aggregated by pixel-level features of potential background and object
locations, are used to purify the object feature from the object-related
background and to represent the feature of the pure-background sample,
respectively. Then based on these two features, both the object classifier and
the background classifier are learned to determine the binary object
localization mask. Our B-CAM can be trained in end-to-end manner based on a
proposed stagger classification loss, which not only improves the objects
localization but also suppresses the background activation. Experiments show
that our B-CAM outperforms one-stage WSOL methods on the CUB-200, OpenImages
and VOC2012 datasets.
- Abstract(参考訳): 弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクを用いて、オブジェクトローカライゼーションのための高密度アノテーションの要求を緩和する。
しかし、現在のWSOLメソッドはバックグラウンドロケーションの過剰な活性化に悩まされており、ローカライゼーションマスクを得るためには後処理が必要である。
本稿では,これらの課題を背景手がかりの認識不能性に起因し,画像レベルのラベルだけで対象と背景の両方のローカライズスコアを同時に学習する背景認識分類活性化マップ(B-CAM)を提案する。
B-CAMでは,2つの画像レベルの特徴を,潜在的背景と対象位置の画素レベルの特徴で集約し,対象特徴を対象背景から精製し,純粋な背景試料の特徴を表現する。
そして、これらの2つの特徴に基づき、オブジェクト分類器と背景分類器の両方を学び、バイナリオブジェクトのローカライゼーションマスクを決定する。
我々のB-CAMは、オブジェクトのローカライゼーションを改善するだけでなく、バックグラウンドアクティベーションを抑えるため、提案したスタガー分類損失に基づいてエンドツーエンドで訓練することができる。
実験の結果,我々のB-CAMはCUB-200,OpenImages,VOC2012データセット上で一段階WSOL法より優れていた。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Spatial-Aware Token for Weakly Supervised Object Localization [137.0570026552845]
タスク固有の空間認識トークンを,弱教師付き方式で条件定位に提案する。
実験の結果、SATはCUB-200とImageNetの両方で、98.45%と73.13%のGT-known Locで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2023-03-18T15:38:17Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Re-Attention Transformer for Weakly Supervised Object Localization [45.417606565085116]
本稿では,トークン精錬トランス (TRT) と呼ばれる再アテンション機構を提案する。
具体的には、TPSM(トークン優先スコアリングモジュール)と呼ばれる新しいモジュールを導入し、ターゲットオブジェクトにフォーカスしながらバックグラウンドノイズの影響を抑える。
論文 参考訳(メタデータ) (2022-08-03T04:34:28Z) - Contrastive learning of Class-agnostic Activation Map for Weakly
Supervised Object Localization and Semantic Segmentation [32.76127086403596]
ラベルなし画像データを用いたクラス非依存型活性化マップ(C$2$AM)生成のためのコントラスト学習を提案する。
我々は上記の関係に基づいて正対と負の対を形成し、ネットワークを前景と背景を乱すように強制する。
ネットワークは画像前景を識別するために誘導されるため,本手法で学習したクラス非依存のアクティベーションマップは,より完全なオブジェクト領域を生成する。
論文 参考訳(メタデータ) (2022-03-25T08:46:24Z) - Shallow Feature Matters for Weakly Supervised Object Localization [35.478997006168484]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルのみを利用してオブジェクトをローカライズすることを目的としている。
以前のCAMベースの手法では、WSOLが重要であったにもかかわらず、浅い特徴を十分に活用できなかった。
本稿では,Shallow機能を考慮したPseudo supervised Object Localization (SPOL) モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T13:16:48Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。