論文の概要: Background Activation Suppression for Weakly Supervised Object
Localization
- arxiv url: http://arxiv.org/abs/2112.00580v1
- Date: Wed, 1 Dec 2021 15:53:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 14:55:43.711055
- Title: Background Activation Suppression for Weakly Supervised Object
Localization
- Title(参考訳): 弱教師付き物体定位に対する背景アクティベーション抑制
- Authors: Pingyu Wu, Wei Zhai, Yang Cao
- Abstract要約: より効率的な学習を実現するためにアクティベーション値を使うことを議論する。
本稿では,背景活動抑制法(BAS)を提案する。
BASは、CUB-200-2011データセットとILSVRCデータセットのベースラインメソッドに対して、大幅に、一貫した改善を実現している。
- 参考スコア(独自算出の注目度): 11.31345656299108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization (WSOL) aims to localize the object
region using only image-level labels as supervision. Recently a new paradigm
has emerged by generating a foreground prediction map (FPM) to achieve the
localization task. Existing FPM-based methods use cross-entropy (CE) to
evaluate the foreground prediction map and to guide the learning of generator.
We argue for using activation value to achieve more efficient learning. It is
based on the experimental observation that, for a trained network, CE converges
to zero when the foreground mask covers only part of the object region. While
activation value increases until the mask expands to the object boundary, which
indicates that more object areas can be learned by using activation value. In
this paper, we propose a Background Activation Suppression (BAS) method.
Specifically, an Activation Map Constraint module (AMC) is designed to
facilitate the learning of generator by suppressing the background activation
values. Meanwhile, by using the foreground region guidance and the area
constraint, BAS can learn the whole region of the object. Furthermore, in the
inference phase, we consider the prediction maps of different categories
together to obtain the final localization results. Extensive experiments show
that BAS achieves significant and consistent improvement over the baseline
methods on the CUB-200-2011 and ILSVRC datasets.
- Abstract(参考訳): weakly supervised object localization (wsol)は、画像レベルのラベルのみを監督として、オブジェクト領域をローカライズすることを目的としている。
近年,FPM(フォアグラウンド予測マップ)を作成した新たなパラダイムが出現し,ローカライゼーションタスクを実現している。
既存のFPMベースの手法では、クロスエントロピー(CE)を用いて前景予測マップを評価し、ジェネレータの学習を指導している。
より効率的な学習を実現するためにアクティベーション値を使うことを議論する。
これは、トレーニングされたネットワークに対して、前景マスクが対象領域の一部だけを覆う場合、CEがゼロに収束するという実験的な観察に基づいている。
アクティベーション値は、マスクがオブジェクト境界に広がるまで増加するが、アクティベーション値を用いてより多くのオブジェクト領域を学習できることを示す。
本稿では,背景活動抑制法(BAS)を提案する。
具体的には、アクティベーションマップ制約モジュール(AMC)は、バックグラウンドのアクティベーション値を抑制することでジェネレータの学習を容易にするように設計されている。
一方、前景領域ガイダンスと領域制約を用いることで、BASは対象領域全体を学ぶことができる。
さらに, 推定段階では, 様々なカテゴリの予測マップを組み合わせることで, 最終的な局所化結果を得る。
大規模な実験により、BASは CUB-200-2011 および ILSVRC データセットのベースライン法よりも顕著で一貫した改善を達成している。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MOST: Multiple Object localization with Self-supervised Transformers for
object discovery [97.47075050779085]
自己教師型トランスフォーマー(MOST)を用いた複数オブジェクトのローカライゼーションを提案する。
MOSTは、自己教師付き学習を用いて訓練されたトランスフォーマーの機能を使用して、実世界の画像に複数のオブジェクトをローカライズする。
対象検出器の自己教師付き事前学習にはMOSTが有効であり, 半教師付きオブジェクト検出と非教師付き領域提案生成において一貫した改善が得られた。
論文 参考訳(メタデータ) (2023-04-11T17:57:27Z) - Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T19:58:38Z) - CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping [18.67907876709536]
Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-27T11:57:41Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - Online Refinement of Low-level Feature Based Activation Map for Weakly
Supervised Object Localization [15.665479740413229]
弱教師付きオブジェクトローカライゼーション(WSOL)のための2段階学習フレームワークを提案する。
第1段階では、アクティベーションマップ生成装置は、分類器内の低レベル特徴写像に基づいてアクティベーションマップを生成する。
第2段階では、活性化マップ生成器によって予測される活性化マップを評価するために評価器を用いる。
第1段階で保存された低レベルのオブジェクト情報に基づいて、第2のステージモデルは、画像中のオブジェクトの十分に分離され、完全で、コンパクトなアクティベーションマップを徐々に生成する。
論文 参考訳(メタデータ) (2021-10-12T05:09:21Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。