論文の概要: Not All Pixels Are Equal: Learning Pixel Hardness for Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2305.08462v1
- Date: Mon, 15 May 2023 09:04:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 15:21:51.732830
- Title: Not All Pixels Are Equal: Learning Pixel Hardness for Semantic
Segmentation
- Title(参考訳): すべてのピクセルが等しいわけではない:セマンティックセグメンテーションのためのピクセルハードネスの学習
- Authors: Xin Xiao, Daiguo Zhou, Jiagao Hu, Yi Hu, Yongchao Xu
- Abstract要約: 本稿では,大域的および歴史的損失値に含まれる難易度情報を活用することで,セマンティックセグメンテーションのための画素硬度を学習することを提案する。
我々は、硬度重み付きセグメンテーション損失を最大化することにより、硬度レベル(HL)マップを学習するための勾配非依存ブランチを追加する。
その単純さにもかかわらず、提案手法は、推論とトレーニングの間に、全く、限界的な余分なコストで、ほとんどのセグメンテーション手法に適用することができる。
- 参考スコア(独自算出の注目度): 15.789253608352027
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation has recently witnessed great progress. Despite the
impressive overall results, the segmentation performance in some hard areas
(e.g., small objects or thin parts) is still not promising. A straightforward
solution is hard sample mining, which is widely used in object detection. Yet,
most existing hard pixel mining strategies for semantic segmentation often rely
on pixel's loss value, which tends to decrease during training. Intuitively,
the pixel hardness for segmentation mainly depends on image structure and is
expected to be stable. In this paper, we propose to learn pixel hardness for
semantic segmentation, leveraging hardness information contained in global and
historical loss values. More precisely, we add a gradient-independent branch
for learning a hardness level (HL) map by maximizing hardness-weighted
segmentation loss, which is minimized for the segmentation head. This
encourages large hardness values in difficult areas, leading to appropriate and
stable HL map. Despite its simplicity, the proposed method can be applied to
most segmentation methods with no and marginal extra cost during inference and
training, respectively. Without bells and whistles, the proposed method
achieves consistent/significant improvement (1.37% mIoU on average) over most
popular semantic segmentation methods on Cityscapes dataset, and demonstrates
good generalization ability across domains. The source codes are available at
https://github.com/Menoly-xin/Hardness-Level-Learning .
- Abstract(参考訳): セマンティックセグメンテーションは近年大きく進歩している。
全体的な成果は印象的なものだが、いくつかの硬い領域(例えば、小さな物体や薄い部分)でのセグメンテーション性能はまだ期待できない。
簡単な解決策はハードサンプルマイニングであり、オブジェクト検出で広く使われている。
しかし、セマンティクスセグメンテーションのための既存のハードピクセルマイニング戦略の多くは、トレーニング中に減少する傾向があるピクセルの損失値に依存することが多い。
直感的には、セグメンテーションのピクセル硬度は主に画像構造に依存し、安定することが期待される。
本稿では,グローバルおよび歴史的な損失値に含まれるハードネス情報を活用して,意味セグメンテーションのためのピクセルのハードネスを学ぶことを提案する。
より正確には、分割ヘッドに対して最小化される硬度重み付きセグメンテーション損失を最大化することにより、硬度レベル(HL)マップを学習するための勾配非依存ブランチを追加する。
これにより、難しい領域で大きな硬度値が奨励され、適切な安定なhlマップが作成される。
その単純さにもかかわらず、提案手法は、推論とトレーニングの間、それぞれノーとマージンの余分なコストで、ほとんどのセグメンテーション法に適用することができる。
ベルやホイッスルがなければ、提案手法は、cityscapesデータセット上の最も一般的なセマンティクスセグメンテーションメソッドよりも一貫性と重要な改善(平均1.37%miou)を達成し、ドメイン間の優れた一般化能力を示す。
ソースコードはhttps://github.com/menoly-xin/hardness-level-learningで入手できる。
関連論文リスト
- Superpixel Segmentation: A Long-Lasting Ill-Posed Problem [1.104960878651584]
スーパーピクセルの分割は,スーパーピクセルの形状とサイズに暗黙の規則性制約があるため,基本的に不適切な問題であることを示す。
我々は,超画素セグメンテーションタスクを専用にトレーニングすることなく,SAM(Segment Anything Model)のような最近のアーキテクチャを用いて,競争力のある結果が得られることを示す。
論文 参考訳(メタデータ) (2024-11-10T14:31:56Z) - Learning Semantic Segmentation with Query Points Supervision on Aerial Images [57.09251327650334]
セマンティックセグメンテーションアルゴリズムを学習するための弱教師付き学習アルゴリズムを提案する。
提案手法は正確なセマンティックセグメンテーションを行い,手作業のアノテーションに要するコストと時間を大幅に削減することで効率を向上する。
論文 参考訳(メタデータ) (2023-09-11T14:32:04Z) - PCA: Semi-supervised Segmentation with Patch Confidence Adversarial
Training [52.895952593202054]
医用画像セグメンテーションのためのPatch Confidence Adrial Training (PCA) と呼ばれる半教師付き対向法を提案する。
PCAは各パッチの画素構造とコンテキスト情報を学習し、十分な勾配フィードバックを得る。
本手法は, 医用画像のセグメンテーションにおいて, 最先端の半教師付き手法より優れており, その有効性を示している。
論文 参考訳(メタデータ) (2022-07-24T07:45:47Z) - Learning to segment from object sizes [0.0]
本稿では,数画素の注釈付き画像と既知のオブジェクトサイズを持つ多数の画像のデータセットから,ディープセグメンテーションネットワークをトレーニングするアルゴリズムを提案する。
このアルゴリズムは、勾配をサンプリングし、標準のバックプロパゲーションアルゴリズムを使用することで、オブジェクトサイズに対して定義された離散的な(微分不可能な)損失関数を最小化する。
論文 参考訳(メタデータ) (2022-07-01T09:34:44Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - A Simple Baseline for Semi-supervised Semantic Segmentation with Strong
Data Augmentation [74.8791451327354]
セマンティックセグメンテーションのためのシンプルで効果的な半教師付き学習フレームワークを提案する。
単純な設計とトレーニングのテクニックのセットは、半教師付きセマンティックセグメンテーションの性能を大幅に向上させることができる。
本手法は,Cityscapes と Pascal VOC データセットの半教師付き設定において,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2021-04-15T06:01:39Z) - Sparse Object-level Supervision for Instance Segmentation with Pixel
Embeddings [4.038011160363972]
ほとんどの最先端のインスタンスセグメンテーションメソッドは、密接な注釈付き画像でトレーニングする必要があります。
非空間埋め込みに基づく提案フリーセグメンテーション手法を提案する。
本研究では, 異なる顕微鏡モードにおける2次元および3次元分割問題の解法について検討した。
論文 参考訳(メタデータ) (2021-03-26T16:36:56Z) - Exposing Semantic Segmentation Failures via Maximum Discrepancy
Competition [102.75463782627791]
オープンビジュアルの世界において,既存の意味セグメンテーション手法の失敗を露呈することで,質問に答える。
モデル改ざんに関するこれまでの研究に触発され、任意に大きい画像セットから始まり、2つのセグメンテーション方法間の差分法(MAD)をMAximizingすることによって、小さな画像セットを自動的にサンプリングします。
選択された画像は、2つの方法のいずれか(または両方)を偽造する最大の可能性を持っている。
また,MADコンペティションにおいて,障害の露呈が困難であるセグメンテーション法について検討した。
論文 参考訳(メタデータ) (2021-02-27T16:06:25Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。