論文の概要: Rethinking Scale Imbalance in Semi-supervised Object Detection for
Aerial Images
- arxiv url: http://arxiv.org/abs/2310.14718v1
- Date: Mon, 23 Oct 2023 08:55:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 21:20:00.871820
- Title: Rethinking Scale Imbalance in Semi-supervised Object Detection for
Aerial Images
- Title(参考訳): 空中画像の半教師対象検出におけるスケール不均衡の再考
- Authors: Ruixiang Zhang, Chang Xu, Fang Xu, Wen Yang, Guangjun He, Huai Yu,
Gui-Song Xia
- Abstract要約: 本研究では,航空画像のためのS3OD学習パイプラインを提案する。
S3ODでは,3つの重要な要素,SAT(Size-aware Adaptive Thresholding),SLA(Size-re Balanced Label Assignment),TNL(Teacher-guided Negative Learning)が,非バイアス学習の保証のために提案されている。
- 参考スコア(独自算出の注目度): 48.460468764544835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on the scale imbalance problem of semi-supervised object
detection(SSOD) in aerial images. Compared to natural images, objects in aerial
images show smaller sizes and larger quantities per image, increasing the
difficulty of manual annotation. Meanwhile, the advanced SSOD technique can
train superior detectors by leveraging limited labeled data and massive
unlabeled data, saving annotation costs. However, as an understudied task in
aerial images, SSOD suffers from a drastic performance drop when facing a large
proportion of small objects. By analyzing the predictions between small and
large objects, we identify three imbalance issues caused by the scale bias,
i.e., pseudo-label imbalance, label assignment imbalance, and negative learning
imbalance. To tackle these issues, we propose a novel Scale-discriminative
Semi-Supervised Object Detection (S^3OD) learning pipeline for aerial images.
In our S^3OD, three key components, Size-aware Adaptive Thresholding (SAT),
Size-rebalanced Label Assignment (SLA), and Teacher-guided Negative Learning
(TNL), are proposed to warrant scale unbiased learning. Specifically, SAT
adaptively selects appropriate thresholds to filter pseudo-labels for objects
at different scales. SLA balances positive samples of objects at different
scales through resampling and reweighting. TNL alleviates the imbalance in
negative samples by leveraging information generated by a teacher model.
Extensive experiments conducted on the DOTA-v1.5 benchmark demonstrate the
superiority of our proposed methods over state-of-the-art competitors. Codes
will be released soon.
- Abstract(参考訳): 本稿では,空中画像における半教師対象検出(SSOD)のスケール不均衡問題に焦点をあてる。
自然画像と比較すると、空中画像のオブジェクトは画像あたりのサイズと量が小さく、手動のアノテーションの難しさが増す。
一方、advanced ssod技術は限定されたラベル付きデータと大量のラベルなしデータを利用して優れた検出器を訓練し、アノテーションコストを節約できる。
しかし、航空画像の未調査課題として、SSODは多数の小さな物体に直面すると、劇的な性能低下に悩まされる。
大規模オブジェクト間の予測を解析することにより、スケールバイアス、すなわち擬似ラベルの不均衡、ラベル割り当ての不均衡、負の学習不均衡による3つの不均衡問題を同定する。
これらの課題に対処するために,航空画像のためのS^3OD学習パイプラインを提案する。
S^3ODでは,3つの重要な要素,SAT(Size-aware Adaptive Thresholding),SLA(Size-re Balanced Label Assignment),TNL(Teacher-guided Negative Learning)を提案し,非バイアス学習を保証した。
具体的には、SATは、異なるスケールでオブジェクトの擬似ラベルをフィルタリングする適切なしきい値を選択する。
SLAは、再サンプリングと再重み付けによって、さまざまなスケールでオブジェクトの正のサンプルのバランスをとる。
tnlは教師モデルによって生成された情報を利用して負のサンプルの不均衡を緩和する。
DOTA-v1.5ベンチマークで行った大規模な実験は、提案手法が最先端の競合相手よりも優れていることを示した。
コードはまもなくリリースされる予定だ。
関連論文リスト
- Gradient-based Sampling for Class Imbalanced Semi-supervised Object Detection [111.0991686509715]
半教師付き物体検出(SSOD)におけるクラス不均衡問題を,より困難なシナリオ下で検討する。
本稿では,2種類の確認バイアスの観点から,クラス不均衡問題に対処する,単純かつ効果的な勾配に基づくサンプリングフレームワークを提案する。
提案手法は,MS-COCO,MS-COCO,Object365,LVISの3種類のサブタスクにおいて,現行の非平衡物体検出器よりもクリアマージンの方が優れていることを示す。
論文 参考訳(メタデータ) (2024-03-22T11:30:10Z) - Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。
本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。
本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-01-16T02:14:33Z) - Dynamic Coarse-to-Fine Learning for Oriented Tiny Object Detection [47.02127854553912]
向きの小さい物体の極端に幾何学的な形状と限られた特徴は、深刻なミスマッチと不均衡の問題を引き起こす。
我々は、DCFLと呼ばれる粗大なアサインラと共に、動的に先行する手法を提案する。
DOTA-v1.5, DOTA-v2.0, DIOR-Rデータセット上の1段検出器の最先端性能について検討した。
論文 参考訳(メタデータ) (2023-04-18T10:09:22Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - MUS-CDB: Mixed Uncertainty Sampling with Class Distribution Balancing
for Active Annotation in Aerial Object Detection [40.94800050576902]
最近の空中物体検出モデルは大量のラベル付きトレーニングデータに依存している。
アクティブラーニングは、情報および代表的未ラベルサンプルを選択的にクエリすることで、データラベリングコストを効果的に削減する。
本稿では,費用対効果の高い空中物体検出のための新しい能動学習手法を提案する。
論文 参考訳(メタデータ) (2022-12-06T07:50:00Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - Scale-Equivalent Distillation for Semi-Supervised Object Detection [57.59525453301374]
近年のSemi-Supervised Object Detection (SS-OD) 法は主に自己学習に基づいており、教師モデルにより、ラベルなしデータを監視信号としてハードな擬似ラベルを生成する。
実験結果から,これらの手法が直面する課題を分析した。
本稿では,大規模オブジェクトサイズの分散とクラス不均衡に頑健な簡易かつ効果的なエンド・ツー・エンド知識蒸留フレームワークであるSED(Scale-Equivalent Distillation)を提案する。
論文 参考訳(メタデータ) (2022-03-23T07:33:37Z) - AMRNet: Chips Augmentation in Aerial Images Object Detection [7.817259518365044]
3つの拡張手法を導入して,スケールの変動,オブジェクトの分散性,クラスの不均衡といった問題を解消する。
我々のモデルは、VisDroneとUAVDTの2つの一般的な空中画像データセットに対して、最先端のパーフォマンスを実現する。
論文 参考訳(メタデータ) (2020-09-15T15:16:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。