論文の概要: Out-of-Candidate Rectification for Weakly Supervised Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2211.12268v1
- Date: Tue, 22 Nov 2022 13:37:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 18:19:55.979897
- Title: Out-of-Candidate Rectification for Weakly Supervised Semantic
Segmentation
- Title(参考訳): 弱教師付き意味セグメンテーションのための候補外整流法
- Authors: Zesen Cheng, Pengchong Qiao, Kehan Li, Siheng Li, Pengxu Wei,
Xiangyang Ji, Li Yuan, Chang Liu, Jie Chen
- Abstract要約: グループランキングに基づくOCR(Out-of-Candidate Rectification)機構をプラグアンドプレイ方式で開発する。
パスカルVOCとMS COCOの両方のデータセットにおいて、余分なトレーニングオーバーヘッドが無視できるようなパフォーマンス向上が達成できる。
- 参考スコア(独自算出の注目度): 40.17455241502738
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised semantic segmentation is typically inspired by class
activation maps, which serve as pseudo masks with class-discriminative regions
highlighted. Although tremendous efforts have been made to recall precise and
complete locations for each class, existing methods still commonly suffer from
the unsolicited Out-of-Candidate (OC) error predictions that not belongs to the
label candidates, which could be avoidable since the contradiction with
image-level class tags is easy to be detected. In this paper, we develop a
group ranking-based Out-of-Candidate Rectification (OCR) mechanism in a
plug-and-play fashion. Firstly, we adaptively split the semantic categories
into In-Candidate (IC) and OC groups for each OC pixel according to their prior
annotation correlation and posterior prediction correlation. Then, we derive a
differentiable rectification loss to force OC pixels to shift to the IC group.
Incorporating our OCR with seminal baselines (e.g., AffinityNet, SEAM,
MCTformer), we can achieve remarkable performance gains on both Pascal VOC
(+3.2%, +3.3%, +0.8% mIoU) and MS COCO (+1.0%, +1.3%, +0.5% mIoU) datasets with
negligible extra training overhead, which justifies the effectiveness and
generality of our OCR.
- Abstract(参考訳): 弱教師付きセマンティックセグメンテーションは一般にクラスアクティベーションマップにインスパイアされ、クラス識別領域が強調された擬似マスクとして機能する。
各クラスの正確な位置と完全な位置をリコールするための多大な努力がなされているが、既存の手法ではラベル候補に属さない未解決のOC(Out-of-Candidate)エラー予測に悩まされがちであり、画像レベルのクラスタグとの矛盾が検出されやすいため回避可能である。
本稿では,グループランキングに基づくOCR(Out-of-Candidate Rectification)機構をプラグアンドプレイ方式で開発する。
まず,各OC画素のセマンティックカテゴリを,先行アノテーションの相関と後部予測の相関に基づいて,IC群とOC群に適応的に分割する。
次に、OC画素をICグループにシフトさせるように、異なる補正損失を導出する。
OCRをセミナルベースライン(例えば、AffinityNet, SEAM, MCTformer)に組み込むことで、パスカルVOC(+3.2%, +3.3%, +0.8% mIoU)とMS COCO(+1.0%, +1.3%, +0.5% mIoU)の両方で優れたパフォーマンス向上を実現できます。
関連論文リスト
- Leveraging CORAL-Correlation Consistency Network for Semi-Supervised Left Atrium MRI Segmentation [14.296441810235223]
半教師付き学習(SSL)は、ラベル付き画像とラベルなし画像の両方から学習するために広く使われている。
現在のSSLベースのセグメンテーションメソッドの多くは、ラベル付きデータとラベルなしデータの類似した特徴を識別するためにピクセル値を直接使用する。
我々は,グローバルな構造形状と左房の局所的詳細を捉えるために,CORAL(Correlation-Aligned)-Correlation Consistency Network (CORN)を導入した。
論文 参考訳(メタデータ) (2024-10-21T11:46:28Z) - Progressive Feature Self-reinforcement for Weakly Supervised Semantic
Segmentation [55.69128107473125]
Weakly Supervised Semantic (WSSS) のイメージレベルラベルを用いたシングルステージアプローチを提案する。
我々は、画像内容が決定論的領域(例えば、自信ある前景と背景)と不確実領域(例えば、オブジェクト境界と誤分類されたカテゴリ)に適応的に分割して、別々の処理を行う。
そこで我々は,これらの自信のある領域と同一のクラスラベルを持つ拡張画像とのセマンティック一貫性を制約する補完的な自己強調手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:21:52Z) - CAFS: Class Adaptive Framework for Semi-Supervised Semantic Segmentation [5.484296906525601]
半教師付きセマンティックセグメンテーションは、いくつかのラベル付きサンプルと多数のラベルなし画像を使用して、ピクセルを特定のクラスに分類するモデルを学ぶ。
半教師付きセマンティックセグメンテーション(CAFS)のためのクラス適応型セミスーパービジョンフレームワークを提案する。
CAFSはラベル付きデータセットに検証セットを構築し、各クラスの校正性能を活用する。
論文 参考訳(メタデータ) (2023-03-21T05:56:53Z) - InterMPL: Momentum Pseudo-Labeling with Intermediate CTC Loss [43.39035144463951]
Momentum PL (MPL) は、ラベルのないデータに基づいてコネクショニスト時間分類 (CTC) に基づくモデルを訓練する。
CTCは、単純かつ高速な推論アルゴリズムと崩壊ラベルの生成に対する堅牢性のため、MPLやPLベースの半教師付きASRによく適している。
CTCに基づくモデリングの最近の進歩に触発されて、中間損失を導入し、MPLを強化することを提案する。
論文 参考訳(メタデータ) (2022-11-02T00:18:25Z) - ConFUDA: Contrastive Fewshot Unsupervised Domain Adaptation for Medical
Image Segmentation [12.991221415461673]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインから未ラベルのターゲットドメインに学習した知識を転送することを目的としている。
画像セグメント化では、画素単位のコントラスト損失の計算による大きなメモリフットプリントは使用を禁止している。
本稿では,CCL(Centroid-based contrastive learning)とCNR(Centroid norm regularizer)を提案する。
論文 参考訳(メタデータ) (2022-06-08T13:39:12Z) - Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds [16.6833745997519]
弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
論文 参考訳(メタデータ) (2022-03-30T04:26:14Z) - DenseCLIP: Extract Free Dense Labels from CLIP [130.3830819077699]
対照的に、CLIP(Contrastive Language- Image Pre-Training)は、オープンボキャブラリゼロショット画像認識において画期的な進歩を遂げた。
DenseCLIP+はSOTAトランスダクティブなゼロショットセマンティックセグメンテーション法を大きなマージンで上回る。
我々の発見は、DenseCLIPが高密度予測タスクの信頼性の高い新たな監視源となることを示唆している。
論文 参考訳(メタデータ) (2021-12-02T09:23:01Z) - Intermediate Loss Regularization for CTC-based Speech Recognition [58.33721897180646]
本稿では,コネクショニスト時間分類(CTC)の目的に基づいて,自動音声認識(ASR)のための簡易かつ効率的な補助的損失関数を提案する。
提案手法は,WSJコーパスの単語誤り率(WER)9.9%,AISHELL-1コーパスの文字誤り率(CER)5.2%である。
論文 参考訳(メタデータ) (2021-02-05T15:01:03Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z) - Generalized Zero-Shot Learning Via Over-Complete Distribution [79.5140590952889]
そこで本稿では,CVAE (Conditional Variational Autoencoder) を用いたOCD(Over-Complete Distribution) の生成を提案する。
フレームワークの有効性は,Zero-Shot LearningプロトコルとGeneralized Zero-Shot Learningプロトコルの両方を用いて評価する。
論文 参考訳(メタデータ) (2020-04-01T19:05:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。