論文の概要: Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2004.04581v1
- Date: Thu, 9 Apr 2020 14:57:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 03:03:06.095331
- Title: Self-supervised Equivariant Attention Mechanism for Weakly Supervised
Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのための自己教師付き同変注意機構
- Authors: Yude Wang, Jie Zhang, Meina Kan, Shiguang Shan, Xilin Chen
- Abstract要約: 本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,完全教師付きセマンティックセグメンテーションにおいて,同値が暗黙の制約であることを示す。
本稿では,ネットワーク学習のための自己スーパービジョンを提供するために,様々な変換画像から予測されたCAMの整合性正則化を提案する。
- 参考スコア(独自算出の注目度): 93.83369981759996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image-level weakly supervised semantic segmentation is a challenging problem
that has been deeply studied in recent years. Most of advanced solutions
exploit class activation map (CAM). However, CAMs can hardly serve as the
object mask due to the gap between full and weak supervisions. In this paper,
we propose a self-supervised equivariant attention mechanism (SEAM) to discover
additional supervision and narrow the gap. Our method is based on the
observation that equivariance is an implicit constraint in fully supervised
semantic segmentation, whose pixel-level labels take the same spatial
transformation as the input images during data augmentation. However, this
constraint is lost on the CAMs trained by image-level supervision. Therefore,
we propose consistency regularization on predicted CAMs from various
transformed images to provide self-supervision for network learning. Moreover,
we propose a pixel correlation module (PCM), which exploits context appearance
information and refines the prediction of current pixel by its similar
neighbors, leading to further improvement on CAMs consistency. Extensive
experiments on PASCAL VOC 2012 dataset demonstrate our method outperforms
state-of-the-art methods using the same level of supervision. The code is
released online.
- Abstract(参考訳): 画像レベルの弱教師付きセマンティックセグメンテーションは近年深く研究されている課題である。
高度なソリューションのほとんどはクラスアクティベーションマップ(CAM)を利用している。
しかし、完全な監視と弱い監視の間にあるため、カムはオブジェクトマスクとして機能することができない。
本稿では,自己監督同変注意機構(SEAM)を提案する。
本手法は,全教師付き意味セグメンテーションにおける等価性が暗黙の制約であり,そのピクセルレベルラベルはデータ拡張中に入力画像と同じ空間変換を行うという観察に基づく。
しかし、この制約は画像レベルの監督によって訓練されたCAMで失われる。
そこで本研究では,様々な変換画像から予測されたCAMの整合性正規化を提案する。
さらに,文脈情報を活用した画素相関モジュール(pcm)を提案し,その類似した近傍による現在の画素の予測を洗練し,camsの一貫性をさらに向上させる。
PASCAL VOC 2012データセットの大規模な実験は、我々の手法が同じレベルの監督レベルを用いて最先端の手法より優れていることを示した。
コードはオンラインで公開されている。
関連論文リスト
- Continual Panoptic Perception: Towards Multi-modal Incremental Interpretation of Remote Sensing Images [16.0258685984844]
継続的学習(CL)は、一方的なトレーニングの方法を破壊し、モデルが新しいデータ、セマンティクス、タスクに継続的に適応できるようにする。
本稿では,画素レベルの分類,インスタンスレベルのセグメンテーション,イメージレベルの知覚を対象とするマルチタスク共同学習を利用した統合型連続学習モデルを提案する。
論文 参考訳(メタデータ) (2024-07-19T12:22:32Z) - Continual-MAE: Adaptive Distribution Masked Autoencoders for Continual Test-Time Adaptation [49.827306773992376]
連続的テスト時間適応(CTTA)は、ソース事前学習モデルから目標分布の連続的な変化に移行するために提案される。
提案手法は,CTTAタスクの分類とセグメンテーションの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-19T15:34:52Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Boosting Weakly-Supervised Image Segmentation via Representation,
Transform, and Compensator [26.991314511807907]
既存のWSISアプローチでは多段階の訓練手順が広く使われており、質の高い擬似マスクを基礎として取得している。
そこで本研究では,Symese ネットワークとコントラスト学習を用いて,クラスアクティベーションマップ(CAM)の品質を向上し,自己補充プロセスを実現するための,新しいワンステージ WSIS 手法を提案する。
PASCAL VOC 2012データセットでは67.2%と68.76%のmIoUを達成した。
論文 参考訳(メタデータ) (2023-09-02T09:07:25Z) - Learning to Mask and Permute Visual Tokens for Vision Transformer
Pre-Training [59.923672191632065]
我々はMasked and Permuted Vision Transformer(MaPeT)という自己教師型事前学習手法を提案する。
MaPeTは、自動回帰および置換予測を使用して、パッチ内依存関係をキャプチャする。
以上の結果から,MaPeTはImageNet上での競合性能を実証した。
論文 参考訳(メタデータ) (2023-06-12T18:12:19Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Activation Modulation and Recalibration Scheme for Weakly Supervised
Semantic Segmentation [24.08326440298189]
弱教師付きセマンティックセグメンテーションのための新しいアクティベーション変調と再校正手法を提案する。
PASCAL VOC 2012データセット上で,AMRが新たな最先端パフォーマンスを確立することを示す。
また,本手法はプラグアンドプレイであり,他の手法と組み合わせて性能向上を図ることが可能であることを実験により明らかにした。
論文 参考訳(メタデータ) (2021-12-16T16:26:14Z) - Railroad is not a Train: Saliency as Pseudo-pixel Supervision for Weakly
Supervised Semantic Segmentation [16.560870740946275]
EPS (Explicit Pseudo-Pixel Supervision) は2つの弱い監督と組み合わせることでピクセルレベルのフィードバックから学習する。
両情報間の補完関係を完全に活用するための共同学習戦略を考案する。
提案手法は, 正確なオブジェクト境界を求め, 共起画素を破棄することにより, 擬似マスクの品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-05-19T07:31:11Z) - Weakly supervised segmentation with cross-modality equivariant
constraints [7.757293476741071]
弱い教師付き学習は、セマンティックセグメンテーションにおける大きなラベル付きデータセットの必要性を軽減するための魅力的な代替手段として登場した。
本稿では,マルチモーダル画像シナリオにおける自己スーパービジョンを活用した新しい学習戦略を提案する。
私たちのアプローチは、同じ学習条件下で関連する最近の文学を上回ります。
論文 参考訳(メタデータ) (2021-04-06T13:14:20Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。