論文の概要: Online Refinement of Low-level Feature Based Activation Map for Weakly
Supervised Object Localization
- arxiv url: http://arxiv.org/abs/2110.05741v1
- Date: Tue, 12 Oct 2021 05:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-13 14:53:17.691515
- Title: Online Refinement of Low-level Feature Based Activation Map for Weakly
Supervised Object Localization
- Title(参考訳): 弱監視対象位置推定のための低レベル特徴量活性化マップのオンラインリファインメント
- Authors: Jinheng Xie, Cheng Luo, Xiangping Zhu, Ziqi Jin, Weizeng Lu, Linlin
Shen
- Abstract要約: 弱教師付きオブジェクトローカライゼーション(WSOL)のための2段階学習フレームワークを提案する。
第1段階では、アクティベーションマップ生成装置は、分類器内の低レベル特徴写像に基づいてアクティベーションマップを生成する。
第2段階では、活性化マップ生成器によって予測される活性化マップを評価するために評価器を用いる。
第1段階で保存された低レベルのオブジェクト情報に基づいて、第2のステージモデルは、画像中のオブジェクトの十分に分離され、完全で、コンパクトなアクティベーションマップを徐々に生成する。
- 参考スコア(独自算出の注目度): 15.665479740413229
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a two-stage learning framework for weakly supervised object
localization (WSOL). While most previous efforts rely on high-level feature
based CAMs (Class Activation Maps), this paper proposes to localize objects
using the low-level feature based activation maps. In the first stage, an
activation map generator produces activation maps based on the low-level
feature maps in the classifier, such that rich contextual object information is
included in an online manner. In the second stage, we employ an evaluator to
evaluate the activation maps predicted by the activation map generator. Based
on this, we further propose a weighted entropy loss, an attentive erasing, and
an area loss to drive the activation map generator to substantially reduce the
uncertainty of activations between object and background, and explore less
discriminative regions. Based on the low-level object information preserved in
the first stage, the second stage model gradually generates a well-separated,
complete, and compact activation map of object in the image, which can be
easily thresholded for accurate localization. Extensive experiments on
CUB-200-2011 and ImageNet-1K datasets show that our framework surpasses
previous methods by a large margin, which sets a new state-of-the-art for WSOL.
- Abstract(参考訳): 弱教師付きオブジェクトローカライゼーション(WSOL)のための2段階学習フレームワークを提案する。
従来は高レベル機能ベースCAM(Class Activation Maps)に頼っていたが,低レベル機能ベースアクティベーションマップを用いたオブジェクトのローカライズを提案する。
第1段階では、アクティベーションマップ生成装置は、リッチなコンテキストオブジェクト情報がオンライン形式で含まれるように、分類器内の低レベル特徴マップに基づいてアクティベーションマップを生成する。
第2段階では、活性化マップ生成器によって予測される活性化マップを評価するために評価器を用いる。
さらに,対象と背景の間の活性化の不確かさを実質的に低減するために,重み付きエントロピー損失,注意的消去,領域損失を提案し,識別領域の少ない領域を探索する。
第1ステージに保存された低レベルオブジェクト情報に基づいて、第2ステージモデルは、画像中のオブジェクトの分離された完全かつコンパクトなアクティベーションマップを徐々に生成する。
CUB-200-2011とImageNet-1Kデータセットの大規模な実験により、我々のフレームワークが従来の手法をはるかに上回っていることが示され、WSOLの新たな最先端が実現された。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - Rethinking Class Activation Maps for Segmentation: Revealing Semantic
Information in Shallow Layers by Reducing Noise [2.462953128215088]
クラス活性化マップの性能に対する大きな制限は、畳み込みニューラルネットワークの最後の層にある特徴マップの小さな空間分解能である。
本稿では, 雑音を正の勾配で除去し, ノイズを除去する簡易な勾配法を提案する。
提案手法は,他のCAM関連手法にも容易に適用可能であり,高品質なクラスアクティベーションマップの取得が容易である。
論文 参考訳(メタデータ) (2023-08-04T03:04:09Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping [18.67907876709536]
Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-27T11:57:41Z) - Background-aware Classification Activation Map for Weakly Supervised
Object Localization [14.646874544729426]
対象と背景の両方のローカライズスコアを同時に学習するための背景認識型分類活性化マップ(B-CAM)を提案する。
我々のB-CAMは、提案したスタガー分類損失に基づいてエンドツーエンドで訓練することができる。
実験の結果,我々のB-CAMはCUB-200,OpenImages,VOC2012データセット上で一段階WSOL法より優れていた。
論文 参考訳(メタデータ) (2021-12-29T03:12:09Z) - Background Activation Suppression for Weakly Supervised Object
Localization [11.31345656299108]
より効率的な学習を実現するためにアクティベーション値を使うことを議論する。
本稿では,背景活動抑制法(BAS)を提案する。
BASは、CUB-200-2011データセットとILSVRCデータセットのベースラインメソッドに対して、大幅に、一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-12-01T15:53:40Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z) - BiDet: An Efficient Binarized Object Detector [96.19708396510894]
本稿では,効率的な物体検出のためのバイナライズニューラルネットワークのBiDetを提案する。
我々のBiDetは、冗長除去による物体検出にバイナリニューラルネットワークの表現能力を完全に活用している。
我々の手法は、最先端のバイナリニューラルネットワークを大きなマージンで上回る。
論文 参考訳(メタデータ) (2020-03-09T08:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。