論文の概要: Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization
- arxiv url: http://arxiv.org/abs/2207.07818v1
- Date: Sat, 16 Jul 2022 03:03:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 16:11:02.595434
- Title: Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization
- Title(参考訳): 弱教師付き物体定位のためのバグング地域分類活性化マップ
- Authors: Lei Zhu, Qian Chen, Lujia Jin, Yunfei You, and Yanye Lu
- Abstract要約: BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
- 参考スコア(独自算出の注目度): 11.25759292976175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification activation map (CAM), utilizing the classification structure
to generate pixel-wise localization maps, is a crucial mechanism for weakly
supervised object localization (WSOL). However, CAM directly uses the
classifier trained on image-level features to locate objects, making it prefers
to discern global discriminative factors rather than regional object cues. Thus
only the discriminative locations are activated when feeding pixel-level
features into this classifier. To solve this issue, this paper elaborates a
plug-and-play mechanism called BagCAMs to better project a well-trained
classifier for the localization task without refining or re-training the
baseline structure. Our BagCAMs adopts a proposed regional localizer generation
(RLG) strategy to define a set of regional localizers and then derive them from
a well-trained classifier. These regional localizers can be viewed as the base
learner that only discerns region-wise object factors for localization tasks,
and their results can be effectively weighted by our BagCAMs to form the final
localization map. Experiments indicate that adopting our proposed BagCAMs can
improve the performance of baseline WSOL methods to a great extent and obtains
state-of-the-art performance on three WSOL benchmarks. Code are released at
https://github.com/zh460045050/BagCAMs.
- Abstract(参考訳): 分類アクティベーションマップ (CAM) は, 画素ワイドなローカライゼーションマップを生成するために分類構造を利用しており, 弱教師付きオブジェクトローカライゼーション (WSOL) の重要なメカニズムである。
しかし、CAMは画像レベルの特徴に基づいて訓練された分類器を直接使用して対象を特定する。
したがって、この分類器に画素レベルの特徴を供給すると、識別位置のみが活性化される。
そこで本研究では,BagCAMと呼ばれるプラグイン・アンド・プレイ機構を,ベースライン構造を洗練・再学習することなく,局所化タスクのためのよく訓練された分類器をよりよく計画する。
提案する地域ローカライザ生成 (rlg) 戦略を用いて, 地域ローカライザの集合を定義し, 十分に訓練された分類器から導出する。
これらの地域ローカライザは、局所化タスクの領域的対象因子のみを識別する基礎学習者と見なすことができ、その結果は我々のBagCAMsによって効果的に重み付けされ、最終ローカライズマップを形成することができる。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が大幅に向上し,3つのWSOLベンチマークの最先端性能が得られることが示された。
コードはhttps://github.com/zh460045050/bagcamsでリリースされる。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。
特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。
マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文 参考訳(メタデータ) (2023-08-03T17:59:04Z) - LCPFormer: Towards Effective 3D Point Cloud Analysis via Local Context
Propagation in Transformers [60.51925353387151]
本稿では,近隣地域間のメッセージパッシングを活用するために,LCP (Local Context Propagation) という新しいモジュールを提案する。
隣接するローカル領域の重複点を仲介として使用した後、異なるローカルリージョンからの共有ポイントの特徴を再重み付けし、その後、次のレイヤに渡す。
提案手法は, 異なるタスクに適用可能であり, 3次元形状分類や高密度予測タスクを含むベンチマークにおいて, 様々なトランスフォーマーベースの手法より優れる。
論文 参考訳(メタデータ) (2022-10-23T15:43:01Z) - Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T19:58:38Z) - CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping [18.67907876709536]
Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-27T11:57:41Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - Bridging the Gap between Classification and Localization for Weakly
Supervised Object Localization [39.63778214094173]
弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのような弱い監督しか持たない対象領域を所定の画像内に見つけることを目的としている。
入力特徴とクラス固有の重みの方向のずれから,分類と局所化のギャップを見いだす。
本稿では,特徴方向をクラス固有の重みに整合させてギャップを埋める手法を提案する。
論文 参考訳(メタデータ) (2022-04-01T05:49:22Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Local Context Attention for Salient Object Segmentation [5.542044768017415]
本研究では,一様表現型アーキテクチャで局所強化特徴写像を生成するための新しいローカルコンテキスト注意ネットワーク(LCANet)を提案する。
提案するネットワークでは,粗い予測と大域的コンテキストの間の相関特徴写像を計算し,アテンショナル・コリレーション・フィルタ (ACF) モジュールを導入している。
いくつかの有能なオブジェクトセグメンテーションデータセットに対して総合的な実験を行い、提案したLCANetの最先端手法に対する優れた性能を実証した。
論文 参考訳(メタデータ) (2020-09-24T09:20:06Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。