論文の概要: Edge-guided and Class-balanced Active Learning for Semantic Segmentation of Aerial Images
- arxiv url: http://arxiv.org/abs/2405.18078v1
- Date: Tue, 28 May 2024 11:39:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 18:58:39.217573
- Title: Edge-guided and Class-balanced Active Learning for Semantic Segmentation of Aerial Images
- Title(参考訳): 航空画像のセマンティックセグメンテーションのためのエッジ誘導型・クラスバランスアクティブラーニング
- Authors: Lianlei Shan, Weiqiang Wang, Ke Lv, Bin Luo,
- Abstract要約: アクティブラーニングはデータアノテーションのコストを削減するための有望な方法である。
従来のALメソッドは、不合理なラベリングユニットとクラス不均衡の無視のために理想的ではない。
提案手法は3つのベンチマークデータセットの最先端手法と比較して11.2%以上のゲインを達成している。
- 参考スコア(独自算出の注目度): 32.82283290734487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation requires pixel-level annotation, which is time-consuming. Active Learning (AL) is a promising method for reducing data annotation costs. Due to the gap between aerial and natural images, the previous AL methods are not ideal, mainly caused by unreasonable labeling units and the neglect of class imbalance. Previous labeling units are based on images or regions, which does not consider the characteristics of segmentation tasks and aerial images, i.e., the segmentation network often makes mistakes in the edge region, and the edge of aerial images is often interlaced and irregular. Therefore, an edge-guided labeling unit is proposed and supplemented as the new unit. On the other hand, the class imbalance is severe, manifested in two aspects: the aerial image is seriously imbalanced, and the AL strategy does not fully consider the class balance. Both seriously affect the performance of AL in aerial images. We comprehensively ensure class balance from all steps that may occur imbalance, including initial labeled data, subsequent labeled data, and pseudo-labels. Through the two improvements, our method achieves more than 11.2\% gains compared to state-of-the-art methods on three benchmark datasets, Deepglobe, Potsdam, and Vaihingen, and more than 18.6\% gains compared to the baseline. Sufficient ablation studies show that every module is indispensable. Furthermore, we establish a fair and strong benchmark for future research on AL for aerial image segmentation.
- Abstract(参考訳): セマンティックセグメンテーションには、時間を要するピクセルレベルのアノテーションが必要である。
アクティブラーニング(AL)はデータアノテーションのコストを削減するための有望な方法である。
航空画像と自然画像のギャップのため、従来のAL手法は理想的ではなく、主に不合理なラベリングユニットとクラス不均衡の無視が原因である。
従来のラベリングユニットは画像や領域に基づいており、セグメンテーションタスクや空中画像の特徴を考慮していない。
そのため、エッジガイド付きラベリングユニットが提案され、新しいユニットとして補足される。
一方、クラス不均衡は深刻であり、航空画像は深刻な不均衡であり、AL戦略はクラスバランスを完全に考慮していない。
どちらも空中画像におけるALの性能に深刻な影響を与えている。
初期ラベル付きデータ、その後のラベル付きデータ、擬似ラベルを含む、不均衡が起こる可能性のあるすべてのステップから、クラスバランスを包括的に保証します。
この2つの改良により,Deepglobe, Potsdam, Vaihingenの3つのベンチマークデータセットの最先端手法と比較して11.2\%以上のゲインを達成し,ベースラインと比較して18.6\%以上のゲインを達成した。
十分なアブレーションの研究は、すべての加群が必須であることを示している。
さらに,航空画像セグメンテーションのためのAL研究のための,公平かつ強力なベンチマークを構築した。
関連論文リスト
- Learning from Unlabelled Data with Transformers: Domain Adaptation for Semantic Segmentation of High Resolution Aerial Images [30.324252605889356]
我々は,未ラベル画像のセマンティックセグメンテーションのための新しいモデルを開発した。
NEOSは、ターゲットドメインが基底真理セマンティックセグメンテーションマスクを持っていないため、ドメイン適応を行う。
ターゲットドメインとソースドメイン間の不整合は、取得シーン、環境条件、センサー、時間の違いに起因する。
論文 参考訳(メタデータ) (2024-04-17T12:12:48Z) - Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - Rethinking Scale Imbalance in Semi-supervised Object Detection for
Aerial Images [48.460468764544835]
本研究では,航空画像のためのS3OD学習パイプラインを提案する。
S3ODでは,3つの重要な要素,SAT(Size-aware Adaptive Thresholding),SLA(Size-re Balanced Label Assignment),TNL(Teacher-guided Negative Learning)が,非バイアス学習の保証のために提案されている。
論文 参考訳(メタデータ) (2023-10-23T08:55:10Z) - Label Structure Preserving Contrastive Embedding for Multi-Label
Learning with Missing Labels [30.79809627981242]
欠落ラベルを識別するためのラベル補正機構を導入し、欠落ラベル(CLML)を用いた多ラベル画像分類において、ユニークなコントラスト損失を定義する。
既存のマルチラベルCLの損失とは異なり、CLMLは潜在表現空間における低ランクなグローバルおよびローカルなラベル依存性も保持する。
提案した戦略は、3つの標準データセットでそれぞれ1.2%、1.6%、および1.3%のマージンでResnet101モデルの分類性能を改善することが示されている。
論文 参考訳(メタデータ) (2022-09-03T02:44:07Z) - Incorporating Semi-Supervised and Positive-Unlabeled Learning for
Boosting Full Reference Image Quality Assessment [73.61888777504377]
フル参照(FR)画像品質評価(IQA)は、その知覚的差異をプリズム品質基準で測定することにより、歪み画像の視覚的品質を評価する。
ラベルなしデータは、画像劣化または復元プロセスから容易に収集することができ、ラベルなしのトレーニングデータを利用してFR-IQA性能を高めることを奨励する。
本稿では, 半教師付き, 正の未ラベル学習(PU)を用いて, ラベルなしデータを活用し, オフレーヤの悪影響を軽減することを提案する。
論文 参考訳(メタデータ) (2022-04-19T09:10:06Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - Background Splitting: Finding Rare Classes in a Sea of Background [55.03789745276442]
我々は,少数の稀なカテゴリの画像分類のための,高精度な深層モデルの訓練という現実的な問題に焦点をあてる。
これらのシナリオでは、ほとんどの画像はデータセットの背景カテゴリに属します(データセットの95%は背景です)。
非バランスなデータセットをトレーニングするための標準的な微調整アプローチと最先端アプローチの両方が、この極端な不均衡の存在下で正確な深層モデルを生成していないことを実証する。
論文 参考訳(メタデータ) (2020-08-28T23:05:15Z) - Active Ensemble Deep Learning for Polarimetric Synthetic Aperture Radar
Image Classification [10.80252725670625]
本稿では,アクティブ・ラーニングの利点を生かし,PolSAR画像分類のためのアクティブ・アンサンブル・ディープ・ラーニング(AEDL)を提案する。
収束付近のディープラーニングモデルのスナップショットの予測されたラベルの35%は、まったく同じであった。
スナップショット委員会を用いてラベルなしデータの情報提供を行い、提案されたAEDLは、標準的なアクティブな学習戦略と比較して、2つの実際のPolSAR画像上でより優れたパフォーマンスを実現した。
論文 参考訳(メタデータ) (2020-06-29T01:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。