論文の概要: Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds
- arxiv url: http://arxiv.org/abs/2203.16045v1
- Date: Wed, 30 Mar 2022 04:26:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 15:07:25.401747
- Title: Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds
- Title(参考訳): WSSSにおける閾値:閾値に対するロバストかつ正確なセグメンテーションモデルの活性化を操作する
- Authors: Minhyun Lee, Dongseob Kim, Hyunjung Shim
- Abstract要約: 弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
- 参考スコア(独自算出の注目度): 16.6833745997519
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly-supervised semantic segmentation (WSSS) has recently gained much
attention for its promise to train segmentation models only with image-level
labels. Existing WSSS methods commonly argue that the sparse coverage of CAM
incurs the performance bottleneck of WSSS. This paper provides analytical and
empirical evidence that the actual bottleneck may not be sparse coverage but a
global thresholding scheme applied after CAM. Then, we show that this issue can
be mitigated by satisfying two conditions; 1) reducing the imbalance in the
foreground activation and 2) increasing the gap between the foreground and the
background activation. Based on these findings, we propose a novel activation
manipulation network with a per-pixel classification loss and a label
conditioning module. Per-pixel classification naturally induces two-level
activation in activation maps, which can penalize the most discriminative
parts, promote the less discriminative parts, and deactivate the background
regions. Label conditioning imposes that the output label of pseudo-masks
should be any of true image-level labels; it penalizes the wrong activation
assigned to non-target classes. Based on extensive analysis and evaluations, we
demonstrate that each component helps produce accurate pseudo-masks, achieving
the robustness against the choice of the global threshold. Finally, our model
achieves state-of-the-art records on both PASCAL VOC 2012 and MS COCO 2014
datasets.
- Abstract(参考訳): 弱教師付きセマンティックセグメンテーション(wsss)は最近、画像レベルのラベルのみでセグメンテーションモデルをトレーニングするという約束で多くの注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されるグローバルしきい値設定方式である,という分析的および実証的な証拠を提供する。
そして,この問題を2つの条件を満たすことで緩和できることを示す。
1)前景の活性化と不均衡の低減
2)前景と背景アクティベーションのギャップを増加させる。
そこで本研究では,画素単位の分類損失とラベル条件付きモジュールを備えた新しいアクティベーション操作ネットワークを提案する。
ピクセルごとの分類は、アクティベーションマップにおいて自然に2段階の活性化を誘導し、最も差別的な部分をペナルティ化し、より差別的な部分を促進し、背景領域を非活性化させる。
ラベル条件付けでは、擬似マスクの出力ラベルは真のイメージレベルのラベルのいずれかでなければならないと規定されている。
広範な分析と評価に基づいて,各コンポーネントが正確な擬似マスクを生成し,グローバルしきい値の選択に対するロバスト性を達成することを実証する。
最後に, PASCAL VOC 2012 と MS COCO 2014 の2つのデータセット上で, 最先端の記録を達成した。
関連論文リスト
- Enhancing Weakly Supervised Semantic Segmentation with Multi-modal Foundation Models: An End-to-End Approach [7.012760526318993]
Weakly-Supervised Semantic (WSSS)は、広範囲なラベリングに対してコスト効率のよい回避手段を提供する。
既存のWSSSメソッドは、セグメンテーション結果の低さにつながるオブジェクトの境界を理解するのに苦労しています。
本稿では,境界ボックス内の視覚的基盤モデルを活用することにより,これらの問題に対処する,新しい効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-10T16:42:25Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - Anti-Adversarially Manipulated Attributions for Weakly Supervised
Semantic Segmentation and Object Localization [31.69344455448125]
本稿では,最終ソフトマックス層やシグモイド層の前に分類器が生成する分類スコアを増やすために操作した画像の属性マップを提案する。
この操作は対逆的な方法で実現され、元の画像は対逆攻撃で使用されるものと反対方向に画素勾配に沿って摂動される。
さらに,対象物に関係のない領域の不正な帰属と,対象物の小さな領域への過剰な帰属の集中を抑制する新たな正規化手法を導入する。
論文 参考訳(メタデータ) (2022-04-11T06:18:02Z) - Inferring the Class Conditional Response Map for Weakly Supervised
Semantic Segmentation [27.269847900950943]
そこで我々は,より優れた擬似ラベルを生成するために,クラス条件推論戦略とアクティベーション対応マスク精細化損失関数を提案する。
本手法は,分類器の再学習を必要とせず,優れたWSSS結果が得られる。
論文 参考訳(メタデータ) (2021-10-27T09:43:40Z) - Multi-Layer Pseudo-Supervision for Histopathology Tissue Semantic
Segmentation using Patch-level Classification Labels [26.349051136954195]
本稿では,病理組織像の組織的セグメンテーションを実現するために,パッチレベルの分類ラベルのみを用いる。
画素レベルのアノテーションとパッチレベルのアノテーションの間の情報ギャップを減らすために、いくつかの技術革新が提案されている。
提案手法は, 最先端の2つのWSSS手法より優れている。
論文 参考訳(メタデータ) (2021-10-14T08:02:07Z) - Rethinking Pseudo Labels for Semi-Supervised Object Detection [84.697097472401]
物体検出に適した確実な擬似ラベルを導入する。
我々は,クラス不均衡問題を緩和するために,各カテゴリの擬似ラベルと再重み付き損失関数を生成するために使用する閾値を動的に調整する。
提案手法では,COCOのラベル付きデータのみを用いて,教師付きベースラインを最大10%改善する。
論文 参考訳(メタデータ) (2021-06-01T01:32:03Z) - Causal Intervention for Weakly-Supervised Semantic Segmentation [122.1846968696862]
画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
論文 参考訳(メタデータ) (2020-09-26T09:26:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。