論文の概要: Using Unreliable Pseudo-Labels for Label-Efficient Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2306.02314v2
- Date: Tue, 20 Aug 2024 14:30:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 21:01:16.571628
- Title: Using Unreliable Pseudo-Labels for Label-Efficient Semantic Segmentation
- Title(参考訳): ラベル効率の良いセマンティックセグメンテーションにおける信頼できない擬似ラベルの利用
- Authors: Haochen Wang, Yuchao Wang, Yujun Shen, Junsong Fan, Yuxi Wang, Zhaoxiang Zhang,
- Abstract要約: 私たちは、すべてのピクセルがモデルトレーニングに重要であり、信頼できない、曖昧なピクセルでさえも重要だと論じます。
我々は予測のエントロピーを通して信頼できないピクセルを分離し、信頼できない各ピクセルを負のキーからなるカテゴリワイドキューにプッシュする。
トレーニングの進化を考えると、信頼できない分割の閾値を適応的に調整する。
- 参考スコア(独自算出の注目度): 78.56076985502291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The crux of label-efficient semantic segmentation is to produce high-quality pseudo-labels to leverage a large amount of unlabeled or weakly labeled data. A common practice is to select the highly confident predictions as the pseudo-ground-truths for each pixel, but it leads to a problem that most pixels may be left unused due to their unreliability. However, we argue that every pixel matters to the model training, even those unreliable and ambiguous pixels. Intuitively, an unreliable prediction may get confused among the top classes, however, it should be confident about the pixel not belonging to the remaining classes. Hence, such a pixel can be convincingly treated as a negative key to those most unlikely categories. Therefore, we develop an effective pipeline to make sufficient use of unlabeled data. Concretely, we separate reliable and unreliable pixels via the entropy of predictions, push each unreliable pixel to a category-wise queue that consists of negative keys, and manage to train the model with all candidate pixels. Considering the training evolution, we adaptively adjust the threshold for the reliable-unreliable partition. Experimental results on various benchmarks and training settings demonstrate the superiority of our approach over the state-of-the-art alternatives.
- Abstract(参考訳): ラベル効率の良いセマンティックセグメンテーションの欠如は、大量のラベル付きまたは弱いラベル付きデータを活用するために高品質な擬似ラベルを作成することである。
一般的には、各ピクセルの擬似地上構造として高い信頼性の予測を選択するが、その信頼性の低いためほとんどのピクセルが未使用のままになるという問題が生じる。
しかし、各ピクセルはモデルトレーニングに重要であり、信頼できない、曖昧なピクセルでさえも重要であると我々は主張する。
直感的には、信頼できない予測は上位クラスの間で混乱するかもしれないが、残りのクラスに属していないピクセルに自信を持つべきである。
したがって、そのようなピクセルは、最もありそうもないカテゴリの負の鍵として、説得的に扱うことができる。
そこで我々は,ラベルのないデータを十分に活用するための効果的なパイプラインを構築した。
具体的には、予測のエントロピーを通じて信頼できない画素を分離し、信頼できない各ピクセルを負のキーからなるカテゴリワイドキューにプッシュし、すべての候補画素でモデルをトレーニングする。
トレーニングの進化を考えると、信頼できない分割の閾値を適応的に調整する。
様々なベンチマークとトレーニング設定の実験結果から、最先端の代替案に対するアプローチの優位性を実証した。
関連論文リスト
- Weighting Pseudo-Labels via High-Activation Feature Index Similarity and Object Detection for Semi-Supervised Segmentation [33.384621509857524]
半教師付きセマンティックセグメンテーション法は、擬似ラベル付けによってラベル付けされていないデータを活用する。
既存の手法では、誤った擬似ラベルを避けるため、主に高信頼画素を選択する。
疑似ラベルから確実に学習するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T14:58:04Z) - Semi-supervised Counting via Pixel-by-pixel Density Distribution
Modelling [135.66138766927716]
本稿では,トレーニングデータのごく一部をラベル付けした半教師付き群集カウントに着目した。
我々は1つの決定論的値ではなく、確率分布として回帰するためにピクセル単位の密度値を定式化する。
本手法は,様々なラベル付き比率設定の下で,競争相手よりも明らかに優れる。
論文 参考訳(メタデータ) (2024-02-23T12:48:02Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Semi-Supervised Semantic Segmentation Using Unreliable Pseudo-Labels [29.32275289325213]
すべてのピクセルがモデルトレーニングに重要であり、その予測でさえ曖昧である、と我々は主張する。
予測のエントロピーを通じて信頼できない画素を分離し、各信頼できない画素を負のサンプルからなるカテゴリワイドキューにプッシュし、すべての候補画素でモデルをトレーニングする。
論文 参考訳(メタデータ) (2022-03-08T07:16:23Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - Pixel-by-Pixel Cross-Domain Alignment for Few-Shot Semantic Segmentation [16.950853152484203]
自律運転アプリケーションにおけるセマンティックセグメンテーションの課題について考察する。
この文脈では、ピクセル単位のクラス不均衡により、ドメインの整列がより困難になる。
我々は Pixel-By-Pixel Cross-Domain Alignment (PixDA) と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-22T08:27:17Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - KRADA: Known-region-aware Domain Alignment for Open World Semantic
Segmentation [64.03817806316903]
セマンティックセグメンテーションでは、画像中のすべてのピクセルにカテゴリラベルを割り当てるために、ピクセルレベルの分類器を訓練することを目指している。
オープンな世界では、ラベル付けされていないテスト画像はおそらく未知のカテゴリを含み、ラベル付けされた画像とは異なる分布を持つ。
本稿では,未知のクラスを識別し,ラベル付きおよびラベルなしのオープンワールド画像中の既知のクラスの分布を整列する,エンドツーエンドの学習フレームワークKRADAを提案する。
論文 参考訳(メタデータ) (2021-06-11T08:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。