論文の概要: Towards Robust Pseudo-Label Learning in Semantic Segmentation: An Encoding Perspective
- arxiv url: http://arxiv.org/abs/2512.06870v1
- Date: Sun, 07 Dec 2025 14:56:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-09 22:03:54.568555
- Title: Towards Robust Pseudo-Label Learning in Semantic Segmentation: An Encoding Perspective
- Title(参考訳): セマンティックセグメンテーションにおけるロバストな擬似ラベル学習に向けて:エンコードの視点から
- Authors: Wangkai Li, Rui Sun, Zhaoyang Li, Tianzhu Zhang,
- Abstract要約: ECOCSegは、誤り訂正出力符号(ECOC)を利用して各クラスに対してきめ細かいエンコーディングを作成するセグメンテーションモデルのための新しい視点である。
まず、ECOCベースの分類器を導入し、モデルがクラスを属性に切り離し、部分的不正確なビットを処理できるようにする。
第2に、高品質な擬似ラベルを生成するためにビットレベルのラベル記述機構を開発し、未ラベル画像に対する適切な、堅牢な監視を提供する。
- 参考スコア(独自算出の注目度): 39.71485484981733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pseudo-label learning is widely used in semantic segmentation, particularly in label-scarce scenarios such as unsupervised domain adaptation (UDA) and semisupervised learning (SSL). Despite its success, this paradigm can generate erroneous pseudo-labels, which are further amplified during training due to utilization of one-hot encoding. To address this issue, we propose ECOCSeg, a novel perspective for segmentation models that utilizes error-correcting output codes (ECOC) to create a fine-grained encoding for each class. ECOCSeg offers several advantages. First, an ECOC-based classifier is introduced, enabling model to disentangle classes into attributes and handle partial inaccurate bits, improving stability and generalization in pseudo-label learning. Second, a bit-level label denoising mechanism is developed to generate higher-quality pseudo-labels, providing adequate and robust supervision for unlabeled images. ECOCSeg can be easily integrated with existing methods and consistently demonstrates significant improvements on multiple UDA and SSL benchmarks across different segmentation architectures. Code is available at https://github.com/Woof6/ECOCSeg.
- Abstract(参考訳): 擬似ラベル学習は、セマンティックセグメンテーション、特にunsupervised domain adaptation (UDA) や semisupervised learning (SSL) のようなラベルスカースシナリオで広く使われている。
その成功にもかかわらず、このパラダイムは間違った擬似ラベルを生成することができ、これはワンホット符号化の利用によりトレーニング中にさらに増幅される。
そこで本研究では,誤り訂正出力符号(ECOC)を用いて各クラスに対して微細なエンコードを生成するセグメンテーションモデルのための新しい視点であるECOCCSegを提案する。
ECOCSegにはいくつかの利点がある。
まず、ECOCベースの分類器を導入し、クラスを属性に分解し、部分的不正確なビットを処理し、擬似ラベル学習における安定性と一般化を改善する。
第2に、高品質な擬似ラベルを生成するためにビットレベルのラベル記述機構を開発し、未ラベル画像に対する適切な、堅牢な監視を提供する。
ECOCSegは既存のメソッドと簡単に統合でき、異なるセグメンテーションアーキテクチャで複数のUDAとSSLベンチマークで大幅に改善されていることを一貫して示している。
コードはhttps://github.com/Woof6/ECOCSeg.comで入手できる。
関連論文リスト
- Bridging Weakly-Supervised Learning and VLM Distillation: Noisy Partial Label Learning for Efficient Downstream Adaptation [51.67328507400985]
ノイズ部分ラベル学習(NPLL)では、各トレーニングサンプルは、複数のノイズアノテータによって注釈付けされた候補ラベルのセットに関連付けられている。
本稿では、事前学習された視覚言語モデルによって注釈付けされた部分ラベルからの学習に焦点を当てる。
革新的な協調整合正則化(Co-Reg)法を提案する。
論文 参考訳(メタデータ) (2025-06-03T12:48:54Z) - Semi-supervised Semantic Segmentation with Multi-Constraint Consistency Learning [81.02648336552421]
本稿では,エンコーダとデコーダの段階的拡張を容易にするためのマルチ制約一貫性学習手法を提案する。
自己適応型特徴マスキングとノイズ注入は、デコーダの堅牢な学習のための特徴を摂動させるために、インスタンス固有の方法で設計されている。
Pascal VOC2012およびCityscapesデータセットの実験結果から,提案したMCCLが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2025-03-23T03:21:33Z) - SGC-VQGAN: Towards Complex Scene Representation via Semantic Guided Clustering Codebook [9.993066868670283]
本稿では,SGC-VQGANをセマンティックオンラインクラスタリング法で導入し,一貫性セマンティックラーニングによるトークンセマンティクスを強化する。
提案手法は時間空間的に一貫したセマンティック・コードブックを構築し,コードブックの崩壊問題と不均衡なトークン・セマンティクスに対処する。
論文 参考訳(メタデータ) (2024-09-09T23:12:43Z) - TagCLIP: A Local-to-Global Framework to Enhance Open-Vocabulary
Multi-Label Classification of CLIP Without Training [29.431698321195814]
Contrastive Language-Image Pre-Training (CLIP) はオープン語彙分類において顕著な能力を示した。
CLIPは、グローバル機能が最も顕著なクラスに支配される傾向があるため、マルチラベルデータセットのパフォーマンスが低い。
画像タグを得るための局所言語フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-20T08:15:40Z) - Semantic Connectivity-Driven Pseudo-labeling for Cross-domain
Segmentation [89.41179071022121]
自己学習はドメイン間セマンティックセグメンテーションにおいて一般的なアプローチである。
本稿ではセマンティック・コネクティビティ駆動の擬似ラベル方式を提案する。
このアプローチは、接続レベルにおいて擬似ラベルを定式化し、構造的および低雑音のセマンティクスの学習を容易にする。
論文 参考訳(メタデータ) (2023-12-11T12:29:51Z) - Improving Semi-Supervised Semantic Segmentation with Dual-Level Siamese Structure Network [7.438140196173472]
画素単位のコントラスト学習のための二重レベルシームス構造ネットワーク(DSSN)を提案する。
弱強監督のための新しいクラス認識型擬似ラベル選択戦略を導入する。
提案手法は,2つのデータセットに対して最先端の結果を得る。
論文 参考訳(メタデータ) (2023-07-26T03:30:28Z) - CLIP-VG: Self-paced Curriculum Adapting of CLIP for Visual Grounding [86.79903269137971]
擬似ラベルを用いて地域を特定するために、教師なしの視覚的接地法が開発された。
CLIP-VG は,CLIP を擬似言語ラベルに適応させる手法である。
提案手法は,RefCOCO/+/gデータセットにおいて,最先端の教師なし手法よりも有意差がある。
論文 参考訳(メタデータ) (2023-05-15T14:42:02Z) - PseudoSeg: Designing Pseudo Labels for Semantic Segmentation [78.35515004654553]
ラベルなしまたは弱いラベル付きデータを用いたトレーニングのための構造化された擬似ラベルを生成するための擬似ラベルの再設計を提案する。
提案手法の有効性を,低データと高データの両方において示す。
論文 参考訳(メタデータ) (2020-10-19T17:59:30Z) - ESL: Entropy-guided Self-supervised Learning for Domain Adaptation in
Semantic Segmentation [35.03150829133562]
より正確な擬似ラベルを生成するための信頼性指標としてエントロピーを利用したエントロピー誘導型自己教師学習を提案する。
異なるUDAベンチマークでは、ESLは強いSSLベースラインを一貫して上回り、最先端の結果を得る。
論文 参考訳(メタデータ) (2020-06-15T18:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。