論文の概要: Shallow Feature Matters for Weakly Supervised Object Localization
- arxiv url: http://arxiv.org/abs/2108.00873v1
- Date: Mon, 2 Aug 2021 13:16:48 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 21:05:39.679634
- Title: Shallow Feature Matters for Weakly Supervised Object Localization
- Title(参考訳): 弱教師付き物体定位のための浅部特徴量
- Authors: Jun Wei, Qin Wang, Zhen Li, Sheng Wang, S.Kevin Zhou, Shuguang Cui
- Abstract要約: 弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルのみを利用してオブジェクトをローカライズすることを目的としている。
以前のCAMベースの手法では、WSOLが重要であったにもかかわらず、浅い特徴を十分に活用できなかった。
本稿では,Shallow機能を考慮したPseudo supervised Object Localization (SPOL) モデルを提案する。
- 参考スコア(独自算出の注目度): 35.478997006168484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly supervised object localization (WSOL) aims to localize objects by only
utilizing image-level labels. Class activation maps (CAMs) are the commonly
used features to achieve WSOL. However, previous CAM-based methods did not take
full advantage of the shallow features, despite their importance for WSOL.
Because shallow features are easily buried in background noise through
conventional fusion. In this paper, we propose a simple but effective Shallow
feature-aware Pseudo supervised Object Localization (SPOL) model for accurate
WSOL, which makes the utmost of low-level features embedded in shallow layers.
In practice, our SPOL model first generates the CAMs through a novel
element-wise multiplication of shallow and deep feature maps, which filters the
background noise and generates sharper boundaries robustly. Besides, we further
propose a general class-agnostic segmentation model to achieve the accurate
object mask, by only using the initial CAMs as the pseudo label without any
extra annotation. Eventually, a bounding box extractor is applied to the object
mask to locate the target. Experiments verify that our SPOL outperforms the
state-of-the-art on both CUB-200 and ImageNet-1K benchmarks, achieving 93.44%
and 67.15% (i.e., 3.93% and 2.13% improvement) Top-5 localization accuracy,
respectively.
- Abstract(参考訳): weakly supervised object localization (wsol) は、画像レベルのラベルのみを利用してオブジェクトをローカライズすることを目的としている。
クラスアクティベーションマップ(CAM)はWSOLを実現するのによく使われる機能である。
しかし、従来のCAMベースの手法は、WSOLの重要性にもかかわらず、浅い特徴を完全に活用しなかった。
浅い特徴は従来の融合によって容易に背景雑音に埋もれるためである。
本稿では, 浅層に埋もれた低レベル特徴を最大限に活用する, 高精度なwsolのための, 単純かつ効果的な浅層特徴認識擬似教師付き物体定位モデルを提案する。
実際、SPOLモデルは、背景雑音をフィルタし、よりシャープな境界を強固に生成する、浅い特徴写像と深い特徴写像の要素ワイド乗算により、まずCAMを生成する。
さらに,初期CAMを付加アノテーションなしで擬似ラベルとしてのみ使用することにより,精度の高いオブジェクトマスクを実現するための一般クラス非依存セグメンテーションモデルを提案する。
最終的に、対象マスクにバウンディングボックス抽出器を塗布してターゲットを特定する。
実験により、我々のSPOLはCUB-200とImageNet-1Kのベンチマークでそれぞれ93.44%と67.15%(すなわち3.93%と2.13%の改善)を達成した。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - Rethinking the Localization in Weakly Supervised Object Localization [51.29084037301646]
弱教師付きオブジェクトローカライゼーション(WSOL)は、コンピュータビジョンにおいて最も人気があり、困難なタスクの1つである。
最近、WSOLを2つの部分(クラスに依存しないオブジェクトのローカライゼーションとオブジェクトの分類)に分割することが、このタスクの最先端のパイプラインになっている。
本研究では,SCRを複数物体の局所化のためのバイナリクラス検出器(BCD)に置き換えることを提案する。
論文 参考訳(メタデータ) (2023-08-11T14:38:51Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Background-aware Classification Activation Map for Weakly Supervised
Object Localization [14.646874544729426]
対象と背景の両方のローカライズスコアを同時に学習するための背景認識型分類活性化マップ(B-CAM)を提案する。
我々のB-CAMは、提案したスタガー分類損失に基づいてエンドツーエンドで訓練することができる。
実験の結果,我々のB-CAMはCUB-200,OpenImages,VOC2012データセット上で一段階WSOL法より優れていた。
論文 参考訳(メタデータ) (2021-12-29T03:12:09Z) - Oriented Feature Alignment for Fine-grained Object Recognition in
High-Resolution Satellite Imagery [1.0635248457021498]
我々は,物体認識の重要な課題を分析し,オブジェクト指向特徴アライメントネットワーク(OFA-Net)を用いて高性能物体認識を実現する。
OFA-Netは、回転したバウンディングボックスリファインメントモジュールを通じて、正確なオブジェクトローカライズを実現する。
提案手法はGaoFenコンペで46.51%のmAPを達成し, ISPRSベンチマークでは43.73%で3位となった。
論文 参考訳(メタデータ) (2021-10-13T10:48:11Z) - Scale Normalized Image Pyramids with AutoFocus for Object Detection [75.71320993452372]
スケール正規化画像ピラミッド(SNIP)が生成され、人間の視覚と同様に、異なるスケールで固定されたサイズ範囲内のオブジェクトにのみ参加する。
本研究では,オブジェクトを含む可能性のある固定サイズのサブリージョンのみで動作する,効率的な空間サブサンプリング手法を提案する。
結果のアルゴリズムはAutoFocusと呼ばれ、SNIPを使用する場合の推論では2.5~5倍のスピードアップとなる。
論文 参考訳(メタデータ) (2021-02-10T18:57:53Z) - Rethinking the Route Towards Weakly Supervised Object Localization [28.90792512056726]
弱教師付きオブジェクトローカライゼーションは、クラスに依存しないオブジェクトローカライゼーションとオブジェクト分類の2つの部分に分けられるべきである。
クラス非依存のオブジェクトローカライゼーションでは、クラス非依存のメソッドを使用してノイズの多い擬似アノテーションを生成し、クラスラベルなしで境界ボックスのレグレッションを実行する必要がある。
我々のPSOLモデルは、微調整なしで異なるデータセット間で良好な転送性を持つ。
論文 参考訳(メタデータ) (2020-02-26T08:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。