論文の概要: Causal Intervention for Weakly-Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2009.12547v2
- Date: Wed, 7 Oct 2020 04:20:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 08:52:35.475750
- Title: Causal Intervention for Weakly-Supervised Semantic Segmentation
- Title(参考訳): 軽度改善セマンティックセグメンテーションに対する因果的介入
- Authors: Dong Zhang, Hanwang Zhang, Jinhui Tang, Xiansheng Hua, Qianru Sun
- Abstract要約: 画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
- 参考スコア(独自算出の注目度): 122.1846968696862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a causal inference framework to improve Weakly-Supervised Semantic
Segmentation (WSSS). Specifically, we aim to generate better pixel-level
pseudo-masks by using only image-level labels -- the most crucial step in WSSS.
We attribute the cause of the ambiguous boundaries of pseudo-masks to the
confounding context, e.g., the correct image-level classification of "horse"
and "person" may be not only due to the recognition of each instance, but also
their co-occurrence context, making the model inspection (e.g., CAM) hard to
distinguish between the boundaries. Inspired by this, we propose a structural
causal model to analyze the causalities among images, contexts, and class
labels. Based on it, we develop a new method: Context Adjustment (CONTA), to
remove the confounding bias in image-level classification and thus provide
better pseudo-masks as ground-truth for the subsequent segmentation model. On
PASCAL VOC 2012 and MS-COCO, we show that CONTA boosts various popular WSSS
methods to new state-of-the-arts.
- Abstract(参考訳): Weakly-Supervised Semantic Segmentation (WSSS)を改善するための因果推論フレームワークを提案する。
具体的には、画像レベルのラベルのみを使用して、より良いピクセルレベルの擬似マスクを生成しようとしています。
擬似マスクの曖昧な境界の原因は、例えば、「ホース」と「人」の正しい画像レベルの分類は、各インスタンスの認識によるだけでなく、それらの共起コンテキストによるものであり、モデル検査(例えば、CAM)は境界を区別することが困難である。
そこで本研究では,画像,コンテキスト,クラスラベル間の因果関係を分析する構造因果モデルを提案する。
画像レベルの分類において,コンテキスト調整(context Adjustment, CONTA)という手法を新たに開発し, その後のセグメンテーションモデルの基盤として,より優れた擬似マスクを提供する。
PASCAL VOC 2012 と MS-COCO では, CONTA が様々な WSSS メソッドを新しい最先端技術に拡張することを示す。
関連論文リスト
- SemPLeS: Semantic Prompt Learning for Weakly-Supervised Semantic
Segmentation [36.41778553250247]
Weakly-Supervised Semantic (WSSS) は、画像レベルの監督のみで画像データを用いてセグメンテーションモデルを訓練することを目的としている。
本稿では,CLIP潜伏空間を効果的に促進するためのWSSS(Semantic Prompt Learning for WSSS)フレームワークを提案する。
SemPLeSはオブジェクト領域と関連するクラスラベル間のセマンティックアライメントを改善することができる。
論文 参考訳(メタデータ) (2024-01-22T09:41:05Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - Semantic Connectivity-Driven Pseudo-labeling for Cross-domain
Segmentation [89.41179071022121]
自己学習はドメイン間セマンティックセグメンテーションにおいて一般的なアプローチである。
本稿ではセマンティック・コネクティビティ駆動の擬似ラベル方式を提案する。
このアプローチは、接続レベルにおいて擬似ラベルを定式化し、構造的および低雑音のセマンティクスの学習を容易にする。
論文 参考訳(メタデータ) (2023-12-11T12:29:51Z) - Generative Semantic Segmentation [40.57488730457299]
セマンティックセグメンテーションのための生成学習手法を提案する。
画像条件付きマスク生成問題として,セマンティックセグメンテーションを論じる。
実験により,GASは標準的なセマンティックセグメンテーション設定において,先行技術と競合して動作可能であることが示された。
論文 参考訳(メタデータ) (2023-03-20T17:55:37Z) - Pointly-Supervised Panoptic Segmentation [106.68888377104886]
弱教師付き単眼セグメンテーションにポイントレベルのアノテーションを適用するための新しい手法を提案する。
完全に教師された方法で使用される高密度のピクセルレベルラベルの代わりに、ポイントレベルラベルは、監督対象ごとに単一のポイントしか提供しない。
我々は、ポイントレベルのラベルから同時に汎視的擬似マスクを生成し、それらから学習することで、エンドツーエンドのフレームワークにおける問題を定式化する。
論文 参考訳(メタデータ) (2022-10-25T12:03:51Z) - A Simple Baseline for Zero-shot Semantic Segmentation with Pre-trained
Vision-language Model [61.58071099082296]
オブジェクト検出やセマンティックセグメンテーションといった、より広範な視覚問題に対して、ゼロショット認識をどのようにうまく機能させるかは定かではない。
本稿では,既訓練の視覚言語モデルであるCLIPを用いて,ゼロショットセマンティックセマンティックセマンティックセマンティクスを構築することを目的とした。
実験結果から, この単純なフレームワークは, 従来の最先端をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2021-12-29T18:56:18Z) - POPCORN: Progressive Pseudo-labeling with Consistency Regularization and
Neighboring [3.4253416336476246]
半教師付き学習(SSL)では、ラベルのないデータを使用して、画像の不足と、未確認領域へのメソッドの一般化の欠如を補う。
画像分割のための整合正則化と擬似ラベル化を組み合わせた新しい手法POPCORNを提案する。
論文 参考訳(メタデータ) (2021-09-13T23:36:36Z) - Per-Pixel Classification is Not All You Need for Semantic Segmentation [184.2905747595058]
マスク分類はセマンティックレベルのセグメンテーションタスクとインスタンスレベルのセグメンテーションタスクの両方を解くのに十分一般的である。
マスクの集合を予測する単純なマスク分類モデルであるMaskFormerを提案する。
提案手法は,現在の最先端セマンティック(ADE20Kでは55.6 mIoU)とパノプティックセグメンテーション(COCOでは52.7 PQ)モデルの両方に優れる。
論文 参考訳(メタデータ) (2021-07-13T17:59:50Z) - Zero-Shot Recognition through Image-Guided Semantic Classification [9.291055558504588]
ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。
複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。
IGSCは概念的には単純であり、分類のための既存のディープアーキテクチャをわずかに拡張することで実現可能である。
論文 参考訳(メタデータ) (2020-07-23T06:22:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。