論文の概要: CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping
- arxiv url: http://arxiv.org/abs/2205.13922v1
- Date: Fri, 27 May 2022 11:57:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 23:35:38.183753
- Title: CREAM: Weakly Supervised Object Localization via Class RE-Activation
Mapping
- Title(参考訳): CREAM: クラス再活性化マッピングによるオブジェクトローカライゼーションの弱さ
- Authors: Jilan Xu, Junlin Hou, Yuejie Zhang, Rui Feng, Rui-Wei Zhao, Tao Zhang,
Xuequan Lu, Shang Gao
- Abstract要約: Class Re-Activation Mapping (CREAM)は、統合オブジェクト領域の活性化値を高めるクラスタリングベースのアプローチである。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 18.67907876709536
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly Supervised Object Localization (WSOL) aims to localize objects with
image-level supervision. Existing works mainly rely on Class Activation Mapping
(CAM) derived from a classification model. However, CAM-based methods usually
focus on the most discriminative parts of an object (i.e., incomplete
localization problem). In this paper, we empirically prove that this problem is
associated with the mixup of the activation values between less discriminative
foreground regions and the background. To address it, we propose Class
RE-Activation Mapping (CREAM), a novel clustering-based approach to boost the
activation values of the integral object regions. To this end, we introduce
class-specific foreground and background context embeddings as cluster
centroids. A CAM-guided momentum preservation strategy is developed to learn
the context embeddings during training. At the inference stage, the
re-activation mapping is formulated as a parameter estimation problem under
Gaussian Mixture Model, which can be solved by deriving an unsupervised
Expectation-Maximization based soft-clustering algorithm. By simply integrating
CREAM into various WSOL approaches, our method significantly improves their
performance. CREAM achieves the state-of-the-art performance on CUB, ILSVRC and
OpenImages benchmark datasets. Code will be available at
https://github.com/Jazzcharles/CREAM.
- Abstract(参考訳): Weakly Supervised Object Localization (WSOL)は、オブジェクトを画像レベルの監視でローカライズすることを目的としている。
既存の作品は、主に分類モデルから派生したクラスアクティベーションマッピング(cam)に依存している。
しかし、CAMベースの手法は通常、オブジェクトの最も差別的な部分(すなわち不完全局所化問題)に焦点を当てる。
本稿では, 差別的でない前景領域と背景領域のアクティベーション値の混合と, この問題が関係していることを実証的に証明する。
そこで本研究では,統合オブジェクト領域の活性化値を高めるために,クラスタリングに基づく新しいアプローチであるクラス再活性化マッピング(CREAM)を提案する。
この目的のために,クラス固有のフォアグラウンドと背景コンテキストの埋め込みをクラスタセントロイドとして導入する。
CAM誘導運動量保存戦略を開発し、トレーニング中の文脈埋め込みを学習する。
推定段階では、再活性化写像はガウス混合モデルの下でパラメータ推定問題として定式化され、教師なし期待最大化に基づくソフトクラスタリングアルゴリズムを導出することで解決できる。
CREAMを様々なWSOLアプローチに統合することで、本手法は性能を大幅に改善する。
CREAMは、CUB、ILSVRC、OpenImagesベンチマークデータセットの最先端のパフォーマンスを達成する。
コードはhttps://github.com/Jazzcharles/CREAM.comから入手できる。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Weakly Supervised Semantic Segmentation via Progressive Patch Learning [39.87150496277798]
分類の局所的詳細抽出を改善するために「プログレッシブ・パッチ・ラーニング」アプローチを提案する。
は、機能マップをパッチに分解し、最終的なアグリゲーションの前に各ローカルパッチを独立して処理する。
プログレッシブ・パッチ・ラーニング(Progressive Patch Learning)は、特徴の破壊とパッチ・ラーニングをさらにプログレッシブな方法で多段階の粒度に拡張する。
論文 参考訳(メタデータ) (2022-09-16T09:54:17Z) - Refine and Represent: Region-to-Object Representation Learning [55.70715883351945]
本稿では、領域ベースとオブジェクト中心の事前学習を統一する領域対オブジェクト表現学習(R2O)を提案する。
R2Oは、エンコーダを訓練して、領域ベースのセグメントをオブジェクト中心のマスクに動的に洗練する。
ImageNetで事前トレーニングを行った後、R2Oモデルは教師なしオブジェクトセグメンテーションにおける既存の最先端技術を上回ることができる。
論文 参考訳(メタデータ) (2022-08-25T01:44:28Z) - Bagging Regional Classification Activation Maps for Weakly Supervised
Object Localization [11.25759292976175]
BagCAMsは、ローカライゼーションタスクのためのよく訓練された分類器をより良く投影するためのプラグアンドプレイ機構である。
我々のBagCAMは、地域ローカライザの集合を定義するために、提案した地域ローカライザ生成戦略を採用する。
実験により,提案したBagCAMを用いることで,ベースラインWSOL法の性能が向上することが示唆された。
論文 参考訳(メタデータ) (2022-07-16T03:03:01Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Background Activation Suppression for Weakly Supervised Object
Localization [11.31345656299108]
より効率的な学習を実現するためにアクティベーション値を使うことを議論する。
本稿では,背景活動抑制法(BAS)を提案する。
BASは、CUB-200-2011データセットとILSVRCデータセットのベースラインメソッドに対して、大幅に、一貫した改善を実現している。
論文 参考訳(メタデータ) (2021-12-01T15:53:40Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。