論文の概要: Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2309.12943v1
- Date: Fri, 22 Sep 2023 15:44:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-25 13:59:00.470740
- Title: Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation
- Title(参考訳): 弱教師付き物体定位と意味セグメンテーションに対する背景アクティベーション抑制
- Authors: Wei Zhai, Pingyu Wu, Kai Zhu, Yang Cao, Feng Wu, Zheng-Jun Zha
- Abstract要約: 弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
- 参考スコア(独自算出の注目度): 84.62067728093358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised object localization and semantic segmentation aim to
localize objects using only image-level labels. Recently, a new paradigm has
emerged by generating a foreground prediction map (FPM) to achieve pixel-level
localization. While existing FPM-based methods use cross-entropy to evaluate
the foreground prediction map and to guide the learning of the generator, this
paper presents two astonishing experimental observations on the object
localization learning process: For a trained network, as the foreground mask
expands, 1) the cross-entropy converges to zero when the foreground mask covers
only part of the object region. 2) The activation value continuously increases
until the foreground mask expands to the object boundary. Therefore, to achieve
a more effective localization performance, we argue for the usage of activation
value to learn more object regions. In this paper, we propose a Background
Activation Suppression (BAS) method. Specifically, an Activation Map Constraint
(AMC) module is designed to facilitate the learning of generator by suppressing
the background activation value. Meanwhile, by using foreground region guidance
and area constraint, BAS can learn the whole region of the object. In the
inference phase, we consider the prediction maps of different categories
together to obtain the final localization results. Extensive experiments show
that BAS achieves significant and consistent improvement over the baseline
methods on the CUB-200-2011 and ILSVRC datasets. In addition, our method also
achieves state-of-the-art weakly supervised semantic segmentation performance
on the PASCAL VOC 2012 and MS COCO 2014 datasets. Code and models are available
at https://github.com/wpy1999/BAS-Extension.
- Abstract(参考訳): 弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
近年,画素レベルの局所化を実現するためにフォアグラウンド予測マップ(fpm)を生成する新しいパラダイムが登場している。
既設のfpmに基づく手法では,前景予測マップの評価と生成者の学習指導にクロスエントロピーを用いるが,本論文では,前景マスクが拡大するにつれて,学習対象の局所化学習過程に関する驚くべき2つの実験結果を示す。
1)前景マスクが対象領域の一部のみを覆うと、クロスエントロピーはゼロに収束する。
2)前景マスクがオブジェクト境界まで広がるまで、アクティベーション値は継続的に増加する。
したがって、より効果的なローカライズ性能を達成するために、より多くのオブジェクト領域を学ぶためにアクティベーション値を使うことを議論する。
本稿では,背景活動抑制法(BAS)を提案する。
具体的には、背景アクティベーション値を抑制して、ジェネレータの学習を容易にするように、アクティベーションマップ制約(amc)モジュールを設計する。
一方、前景領域ガイダンスと領域制約を用いることで、BASは対象領域全体を学ぶことができる。
推定フェーズでは,様々なカテゴリの予測マップを組み合わせることで,最終的な局所化結果を得る。
大規模な実験により、BASは CUB-200-2011 および ILSVRC データセットのベースライン法よりも顕著で一貫した改善を達成している。
さらに,本手法は,pascal voc 2012およびms coco 2014データセット上で,最先端の教師付き意味セグメンテーション性能を実現する。
コードとモデルはhttps://github.com/wpy1999/bas-extensionで入手できる。
関連論文リスト
- Spatial Structure Constraints for Weakly Supervised Semantic
Segmentation [100.0316479167605]
クラスアクティベーションマップ(CAM)は、オブジェクトの最も識別性の高い部分のみを見つけることができる。
注意伸縮の余剰なオブジェクトの過剰な活性化を軽減するために,弱い教師付きセマンティックセマンティックセグメンテーションのための空間構造制約(SSC)を提案する。
提案手法は,PASCAL VOC 2012とCOCOデータセットでそれぞれ72.7%,47.0%mIoUを達成した。
論文 参考訳(メタデータ) (2024-01-20T05:25:25Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MOST: Multiple Object localization with Self-supervised Transformers for
object discovery [97.47075050779085]
自己教師型トランスフォーマー(MOST)を用いた複数オブジェクトのローカライゼーションを提案する。
MOSTは、自己教師付き学習を用いて訓練されたトランスフォーマーの機能を使用して、実世界の画像に複数のオブジェクトをローカライズする。
対象検出器の自己教師付き事前学習にはMOSTが有効であり, 半教師付きオブジェクト検出と非教師付き領域提案生成において一貫した改善が得られた。
論文 参考訳(メタデータ) (2023-04-11T17:57:27Z) - CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping [18.67907876709536]
Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-27T11:57:41Z) - Background Activation Suppression for Weakly Supervised Object
Localization [11.31345656299108]
より効率的な学習を実現するためにアクティベーション値を使うことを議論する。
本稿では,背景活動抑制法(BAS)を提案する。
BASは、CUB-200-2011データセットとILSVRCデータセットのベースラインメソッドに対して、大幅に、一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-12-01T15:53:40Z) - Online Refinement of Low-level Feature Based Activation Map for Weakly
Supervised Object Localization [15.665479740413229]
弱教師付きオブジェクトローカライゼーション(WSOL)のための2段階学習フレームワークを提案する。
第1段階では、アクティベーションマップ生成装置は、分類器内の低レベル特徴写像に基づいてアクティベーションマップを生成する。
第2段階では、活性化マップ生成器によって予測される活性化マップを評価するために評価器を用いる。
第1段階で保存された低レベルのオブジェクト情報に基づいて、第2のステージモデルは、画像中のオブジェクトの十分に分離され、完全で、コンパクトなアクティベーションマップを徐々に生成する。
論文 参考訳(メタデータ) (2021-10-12T05:09:21Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。