論文の概要: DuPL: Dual Student with Trustworthy Progressive Learning for Robust Weakly Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2403.11184v1
- Date: Sun, 17 Mar 2024 12:14:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 18:06:05.354707
- Title: DuPL: Dual Student with Trustworthy Progressive Learning for Robust Weakly Supervised Semantic Segmentation
- Title(参考訳): DuPL:ロバストに監督されたセマンティックセグメンテーションのための信頼できる進歩的学習を持つ2人の学生
- Authors: Yuanchen Wu, Xichen Ye, Kequan Yang, Jide Li, Xiaoqiang Li,
- Abstract要約: 信頼に足る進歩的学習(DuPL)を伴う2つの学生フレームワークを提案する。
実験結果は、PASCAL VOC 2012とMSデータセットにおける最近の最先端の代替よりも、提案されたDuPLの方が優れていることを示す。
- 参考スコア(独自算出の注目度): 6.775785126617824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, One-stage Weakly Supervised Semantic Segmentation (WSSS) with image-level labels has gained increasing interest due to simplification over its cumbersome multi-stage counterpart. Limited by the inherent ambiguity of Class Activation Map (CAM), we observe that one-stage pipelines often encounter confirmation bias caused by incorrect CAM pseudo-labels, impairing their final segmentation performance. Although recent works discard many unreliable pseudo-labels to implicitly alleviate this issue, they fail to exploit sufficient supervision for their models. To this end, we propose a dual student framework with trustworthy progressive learning (DuPL). Specifically, we propose a dual student network with a discrepancy loss to yield diverse CAMs for each sub-net. The two sub-nets generate supervision for each other, mitigating the confirmation bias caused by learning their own incorrect pseudo-labels. In this process, we progressively introduce more trustworthy pseudo-labels to be involved in the supervision through dynamic threshold adjustment with an adaptive noise filtering strategy. Moreover, we believe that every pixel, even discarded from supervision due to its unreliability, is important for WSSS. Thus, we develop consistency regularization on these discarded regions, providing supervision of every pixel. Experiment results demonstrate the superiority of the proposed DuPL over the recent state-of-the-art alternatives on PASCAL VOC 2012 and MS COCO datasets. Code is available at https://github.com/Wu0409/DuPL.
- Abstract(参考訳): 近年、画像レベルのラベルを持つワンステージのWakly Supervised Semantic Segmentation (WSSS) は、面倒なマルチステージよりも単純化され、関心が高まりつつある。
クラスアクティベーションマップ(CAM)の固有曖昧さに制限された結果,CAM擬似ラベルの誤りによる確認バイアスに陥り,最終的なセグメンテーション性能が損なわれることが判明した。
近年の研究では、この問題を暗黙的に緩和するために、信頼できない疑似ラベルの多くを廃止しているが、彼らはモデルに対する十分な監督を活用できなかった。
この目的のために,信頼に足る進歩学習(DuPL)を備えた2つの学生フレームワークを提案する。
具体的には、各サブネットに対して多様なCAMを生成するために、差分損失を持つ2つの学生ネットワークを提案する。
2つのサブネットは互いに監督し合い、誤った擬似ラベルを学習することによって生じる確認バイアスを緩和する。
本研究では,適応雑音フィルタリング手法を用いて動的しきい値調整を行うことにより,より信頼性の高い疑似ラベルを徐々に導入する。
さらに我々は、すべてのピクセルが、信頼性の低いため監督から外されたとしても、WSSSにとって重要であると信じている。
そこで我々は,これら捨てられた領域の整合性正規化を開発し,各ピクセルの監督を行う。
実験結果は、PASCAL VOC 2012とMS COCOデータセットにおける最近の最先端の代替よりも、提案されたDuPLの方が優れていることを示す。
コードはhttps://github.com/Wu0409/DuPLで入手できる。
関連論文リスト
- CamoTeacher: Dual-Rotation Consistency Learning for Semi-Supervised Camouflaged Object Detection [58.07124777351955]
本稿では,Dual-Rotation Consistency Learning(DRCL)を利用した新しい半教師付きCODフレームワークであるCamoTeacherを紹介する。
DRCLは、画素レベルとインスタンスレベルの回転ビューの一貫性を活用することで、擬似ラベルノイズを最小化する。
私たちのコードはまもなく利用可能になります。
論文 参考訳(メタデータ) (2024-08-15T09:33:43Z) - Weakly Supervised Co-training with Swapping Assignments for Semantic Segmentation [21.345548821276097]
クラスアクティベーションマップ(CAM)は通常、擬似ラベルを生成するために弱教師付きセマンティックセマンティックセグメンテーション(WSSS)で使用される。
我々は、ガイド付きCAMを組み込んだエンドツーエンドWSSSモデルを提案し、CAMをオンラインで同時最適化しながらセグメンテーションモデルを訓練する。
CoSAは、追加の監督を持つものを含む、既存のマルチステージメソッドをすべて上回る、最初のシングルステージアプローチである。
論文 参考訳(メタデータ) (2024-02-27T21:08:23Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic
Segmentation [27.831267434546024]
Wevisit the weak-to-strong consistency framework popular by FixMatch from semi-supervised classification。
本稿では,補助的特徴摂動流を補足として提案し,拡張された摂動空間を創出する。
我々のUnified Dual-Stream Perturbationsアプローチ(UniMatch)は、すべての評価プロトコルで既存のメソッドをはるかに上回っています。
論文 参考訳(メタデータ) (2022-08-21T15:32:43Z) - Label Matching Semi-Supervised Object Detection [85.99282969977541]
半教師対象検出は,教師主導型自己学習の開発において大きな進歩を遂げている。
ラベルミスマッチ問題は、以前の研究でまだ完全に解明されていないため、自己学習中に重大な確証バイアスが生じる。
本稿では,2つの異なる相補的視点から,単純かつ効果的な LabelMatch フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-14T05:59:41Z) - Threshold Matters in WSSS: Manipulating the Activation for the Robust
and Accurate Segmentation Model Against Thresholds [16.6833745997519]
弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、画像レベルのラベルだけでセマンティクスモデルをトレーニングするという約束により、最近注目を集めている。
既存のWSSSメソッドは一般的に、CAMのスパースカバレッジがWSSSのパフォーマンスボトルネックを引き起こすと主張している。
本稿は, 実際のボトルネックはスパースカバレッジではなく, CAM後に適用されたグローバルしきい値決定方式である,という分析的および実証的な証拠を提供する。
論文 参考訳(メタデータ) (2022-03-30T04:26:14Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Adversarial Dual-Student with Differentiable Spatial Warping for
Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。
また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。
我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文 参考訳(メタデータ) (2022-03-05T17:36:17Z) - Two-phase Pseudo Label Densification for Self-training based Domain
Adaptation [93.03265290594278]
TPLDと呼ばれる,新規な二相擬似ラベル高密度化フレームワークを提案する。
第1フェーズでは,スライディングウインドウ投票を用いて,画像内の内在的空間相関を利用して,自信のある予測を広める。
第2フェーズでは,信頼度に基づく容易な分類を行う。
トレーニングプロセスの容易化と騒音予測の回避を目的として,ブートストラップ機構の導入を行った。
論文 参考訳(メタデータ) (2020-12-09T02:35:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。