論文の概要: Unlocking Robust Semantic Segmentation Performance via Label-only Elastic Deformations against Implicit Label Noise
- arxiv url: http://arxiv.org/abs/2508.10383v1
- Date: Thu, 14 Aug 2025 06:27:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.201505
- Title: Unlocking Robust Semantic Segmentation Performance via Label-only Elastic Deformations against Implicit Label Noise
- Title(参考訳): 入射ラベル雑音に対するラベルのみ弾性変形によるロバストなセマンティックセマンティックセグメンテーション性能
- Authors: Yechan Kim, Dongho Yoon, Younkwan Lee, Unse Fatima, Hong Kook Kim, Songjae Lee, Sanga Park, Jeong Ho Park, Seonjong Kang, Moongu Jeon,
- Abstract要約: NSegment+は、画像とラベルの変換を分離し、セマンティックセグメンテーションのための現実的なノイズに対処するフレームワークである。
NSegment+はパフォーマンスを継続的に改善し、Vayhingen、LoveDA、Cityscapes、PASCAL VOCで平均+2.29、+2.38、+1.75、+3.39までのmIoUゲインを達成する。
これらの利得は、CutMixやLabel Smoothingなど、他のトレーニングトリックと組み合わせることでさらに増幅することができる。
- 参考スコア(独自算出の注目度): 14.467823970534011
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While previous studies on image segmentation focus on handling severe (or explicit) label noise, real-world datasets also exhibit subtle (or implicit) label imperfections. These arise from inherent challenges, such as ambiguous object boundaries and annotator variability. Although not explicitly present, such mild and latent noise can still impair model performance. Typical data augmentation methods, which apply identical transformations to the image and its label, risk amplifying these subtle imperfections and limiting the model's generalization capacity. In this paper, we introduce NSegment+, a novel augmentation framework that decouples image and label transformations to address such realistic noise for semantic segmentation. By introducing controlled elastic deformations only to segmentation labels while preserving the original images, our method encourages models to focus on learning robust representations of object structures despite minor label inconsistencies. Extensive experiments demonstrate that NSegment+ consistently improves performance, achieving mIoU gains of up to +2.29, +2.38, +1.75, and +3.39 in average on Vaihingen, LoveDA, Cityscapes, and PASCAL VOC, respectively-even without bells and whistles, highlighting the importance of addressing implicit label noise. These gains can be further amplified when combined with other training tricks, including CutMix and Label Smoothing.
- Abstract(参考訳): イメージセグメンテーションに関する以前の研究は、厳しい(または明示的な)ラベルノイズを扱うことに重点を置いていたが、現実のデータセットは微妙な(または暗黙的な)ラベルの欠陥も示している。
これらは、曖昧なオブジェクト境界やアノテータの変数など、固有の課題から生じる。
明確には存在しないが、そのような緩やかな遅延ノイズはモデル性能を損なうことがある。
画像とそのラベルに同じ変換を適用する典型的なデータ拡張手法は、これらの微妙な欠陥を増幅し、モデルの一般化能力を制限する。
本稿では、画像とラベルの変換を分離し、セマンティックセグメンテーションのための現実的なノイズに対処する新しい拡張フレームワークNSegment+を紹介する。
制御された弾性変形は,原画像の保存中にのみセグメンテーションラベルにのみ導入することにより,小さなラベルの不整合にもかかわらず,オブジェクト構造の堅牢な表現を学習することに集中するよう,モデルに推奨する。
NSegment+はパフォーマンスを継続的に改善し、Vayhingen、LoveDA、Cityscapes、PASCAL VOCで平均+2.29、+2.38、+1.75、+3.39までのmIoUゲインを達成する。
これらの利得は、CutMixやLabel Smoothingなど、他のトレーニングトリックと組み合わせることでさらに増幅することができる。
関連論文リスト
- NSegment : Label-specific Deformations for Remote Sensing Image Segmentation [10.585761836168409]
リモートセンシング(RS)画像セグメンテーションデータセットにおける誤りのラベル付けは暗黙的かつ微妙なままであることが多い。
ラベル付けの高コストによる注釈付きRSデータの不足は、ノイズ・ロバストモデルの訓練を複雑にする。
NSegmentは、この問題を軽減するために、シンプルだが効果的なデータ拡張ソリューションである。
論文 参考訳(メタデータ) (2025-04-28T09:49:35Z) - ERASE: Error-Resilient Representation Learning on Graphs for Label Noise
Tolerance [53.73316938815873]
本稿では, ERASE (Error-Resilient representation learning on graphs for lAbel noiSe tolerancE) という手法を提案する。
ERASEは、プロトタイプの擬似ラベルとプロパゲーションされた識別ラベルを組み合わせて、表現をエラーレジリエンスで更新する。
提案手法は, 広い雑音レベルにおいて, 複数のベースラインをクリアマージンで上回り, 高いスケーラビリティを享受できる。
論文 参考訳(メタデータ) (2023-12-13T17:59:07Z) - Category-Adaptive Label Discovery and Noise Rejection for Multi-label
Image Recognition with Partial Positive Labels [78.88007892742438]
部分正ラベル(MLR-PPL)を用いたマルチラベルモデルの訓練が注目されている。
これまでの研究では、未知のラベルを負とみなし、従来のMLRアルゴリズムを採用した。
我々は,MLR-PPLタスクを容易にするために,異なる画像間の意味的相関について検討する。
論文 参考訳(メタデータ) (2022-11-15T02:11:20Z) - Transductive CLIP with Class-Conditional Contrastive Learning [68.51078382124331]
雑音ラベル付き分類ネットワークをスクラッチから学習するための新しいフレームワークであるTransductive CLIPを提案する。
擬似ラベルへの依存を軽減するために,クラス条件のコントラスト学習機構を提案する。
アンサンブルラベルは、ノイズラベル付きディープニューラルネットワークのトレーニングを安定化するための擬似ラベル更新戦略として採用されている。
論文 参考訳(メタデータ) (2022-06-13T14:04:57Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。