論文の概要: Region-CAM: Towards Accurate Object Regions in Class Activation Maps for Weakly Supervised Learning Tasks
- arxiv url: http://arxiv.org/abs/2510.25134v1
- Date: Wed, 29 Oct 2025 03:28:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:44.999856
- Title: Region-CAM: Towards Accurate Object Regions in Class Activation Maps for Weakly Supervised Learning Tasks
- Title(参考訳): Region-CAM: 弱教師付き学習課題のためのクラス活性化マップにおける正確な対象領域を目指して
- Authors: Qingdong Cai, Charith Abhayaratne,
- Abstract要約: クラスアクティベーションマッピング(CAM)手法は、弱い教師付き学習タスクに広く適用されている。
これらの強調された領域は、しばしばオブジェクト全体をカバーすることができず、しばしばオブジェクトの境界と一致しない。
そこで本稿では, 対象領域の多さを強調する新しいアクティベーション手法であるRegional-CAMを提案する。
- 参考スコア(独自算出の注目度): 2.191505742658975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Class Activation Mapping (CAM) methods are widely applied in weakly supervised learning tasks due to their ability to highlight object regions. However, conventional CAM methods highlight only the most discriminative regions of the target. These highlighted regions often fail to cover the entire object and are frequently misaligned with object boundaries, thereby limiting the performance of downstream weakly supervised learning tasks, particularly Weakly Supervised Semantic Segmentation (WSSS), which demands pixel-wise accurate activation maps to get the best results. To alleviate the above problems, we propose a novel activation method, Region-CAM. Distinct from network feature weighting approaches, Region-CAM generates activation maps by extracting semantic information maps (SIMs) and performing semantic information propagation (SIP) by considering both gradients and features in each of the stages of the baseline classification model. Our approach highlights a greater proportion of object regions while ensuring activation maps to have precise boundaries that align closely with object edges. Region-CAM achieves 60.12% and 58.43% mean intersection over union (mIoU) using the baseline model on the PASCAL VOC training and validation datasets, respectively, which are improvements of 13.61% and 13.13% over the original CAM (46.51% and 45.30%). On the MS COCO validation set, Region-CAM achieves 36.38%, a 16.23% improvement over the original CAM (20.15%). We also demonstrate the superiority of Region-CAM in object localization tasks, using the ILSVRC2012 validation set. Region-CAM achieves 51.7% in Top-1 Localization accuracy Loc1. Compared with LayerCAM, an activation method designed for weakly supervised object localization, Region-CAM achieves 4.5% better performance in Loc1.
- Abstract(参考訳): クラス活性化マッピング (Class Activation Mapping, CAM) 法は, 対象領域を強調表示できるため, 弱い教師付き学習タスクに広く適用されている。
しかし、従来のCAM手法では、ターゲットの最も差別的な領域のみをハイライトする。
これらの強調された領域は、オブジェクト全体をカバーすることができず、しばしばオブジェクトの境界に不整合しているため、下流の教師付き学習タスク、特にピクセル単位で正確なアクティベーションマップを必要とする弱監視セマンティックセマンティックセグメンテーション(WSSS)のパフォーマンスが制限される。
上記の問題を緩和するために,新しいアクティベーション手法であるRerea-CAMを提案する。
ネットワーク特徴重み付け手法と異なり、Rerea-CAMは、セマンティック情報マップ(SIM)を抽出し、セマンティック情報伝搬(SIP)を実行することにより、ベースライン分類モデルの各段階の勾配と特徴を考慮し、アクティベーションマップを生成する。
提案手法では,オブジェクト領域の比率が大きくなるとともに,アクティベーションマップがオブジェクトエッジと密接に一致した正確な境界を持つことを保証している。
リージョンCAMは、PASCAL VOCトレーニングおよび検証データセットのベースラインモデルを用いて、60.12%と58.43%の平均交叉(mIoU)を達成し、元のCAM(46.51%と45.30%)よりも13.61%と13.13%改善している。
MS COCO検証セットでは、Rerea-CAMは36.38%、オリジナルのCAM(20.15%)よりも16.23%改善している。
また、ILSVRC2012検証セットを用いて、オブジェクトローカライゼーションタスクにおけるRegional-CAMの優位性を示す。
Region-CAM は Top-1 のローカライゼーション精度 Loc1 で51.7% を達成する。
弱教師付きオブジェクトローカライゼーション用に設計されたアクティベーション方式であるLayerCAMと比較して、Rerea-CAMはLoc1では4.5%性能が向上した。
関連論文リスト
- Instance-Guided Class Activation Mapping for Weakly Supervised Semantic Segmentation [5.539128209356213]
我々は,高品質で境界対応なローカライゼーションマップを生成する新しい手法IG-CAMを提案する。
提案手法は,完全な対象範囲と正確な境界線による局所化精度が向上することを示す。
IG-CAMを弱教師付きセマンティックセグメンテーションのための新しいベンチマークとして確立した。
論文 参考訳(メタデータ) (2025-09-15T22:41:44Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Exploit CAM by itself: Complementary Learning System for Weakly
Supervised Semantic Segmentation [59.24824050194334]
本稿では,CLS(Complementary Learning System)というエージェント学習における興味深い作業機構について述べる。
このシンプルだが効果的な学習パターンを動機として,汎用学習機構(GSLM)を提案する。
汎用学習モジュール(GLM)と特定学習モジュール(SLM)を開発するGSLM
論文 参考訳(メタデータ) (2023-03-04T16:16:47Z) - Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization [11.25759292976175]
BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-07-16T03:03:01Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping [18.67907876709536]
Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-27T11:57:41Z) - Shallow Feature Matters for Weakly Supervised Object Localization [35.478997006168484]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルのみを利用してオブジェクトをローカライズすることを目的としている。
以前のCAMベースの手法では、WSOLが重要であったにもかかわらず、浅い特徴を十分に活用できなかった。
本稿では,Shallow機能を考慮したPseudo supervised Object Localization (SPOL) モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T13:16:48Z) - Improving Weakly-supervised Object Localization via Causal Intervention [41.272141902638275]
最近登場したweakly supervised object localization (wsol)メソッドは、画像レベルのラベルのみを使用して、画像内のオブジェクトをローカライズすることを学ぶことができる。
以前の作品では、小さめの判別的注意マップからインターバルオブジェクトを知覚しようと試みているが、共作者は無視している。
提案手法はci-camと呼ばれ,画像,コンテキスト,カテゴリ間の因果関係を探索し,クラスアクティベーションマップにおける共起バイアスを解消する。
論文 参考訳(メタデータ) (2021-04-21T04:44:33Z) - TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised
Object Localization [112.46381729542658]
弱監督オブジェクトローカリゼーション(WSOL)は、画像カテゴリラベルを与えられたときに難しい問題です。
長距離依存抽出のための視覚変換器における自己注意機構をフル活用するために,トークン意味結合注意マップ(TS-CAM)を導入する。
論文 参考訳(メタデータ) (2021-03-27T09:43:16Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。