論文の概要: Density Crop-guided Semi-supervised Object Detection in Aerial Images
- arxiv url: http://arxiv.org/abs/2308.05032v1
- Date: Wed, 9 Aug 2023 15:59:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 13:02:52.966865
- Title: Density Crop-guided Semi-supervised Object Detection in Aerial Images
- Title(参考訳): 空中画像における密度作物誘導半教師対象検出
- Authors: Akhil Meethal, Eric Granger, Marco Pedersoli
- Abstract要約: 空中画像における物体検出のための密度作物誘導半監視検出器を提案する。
トレーニング中、ラベル付き画像とラベルなし画像から識別されたクラスタの画像作物を使用してトレーニングセットを増強する。
推論中、検出器は興味のある物体を検出できるが、小さな物体の密度が高い領域も検出できる。
- 参考スコア(独自算出の注目度): 12.944309759825902
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: One of the important bottlenecks in training modern object detectors is the
need for labeled images where bounding box annotations have to be produced for
each object present in the image. This bottleneck is further exacerbated in
aerial images where the annotators have to label small objects often
distributed in clusters on high-resolution images. In recent days, the
mean-teacher approach trained with pseudo-labels and weak-strong augmentation
consistency is gaining popularity for semi-supervised object detection.
However, a direct adaptation of such semi-supervised detectors for aerial
images where small clustered objects are often present, might not lead to
optimal results. In this paper, we propose a density crop-guided
semi-supervised detector that identifies the cluster of small objects during
training and also exploits them to improve performance at inference. During
training, image crops of clusters identified from labeled and unlabeled images
are used to augment the training set, which in turn increases the chance of
detecting small objects and creating good pseudo-labels for small objects on
the unlabeled images. During inference, the detector is not only able to detect
the objects of interest but also regions with a high density of small objects
(density crops) so that detections from the input image and detections from
image crops are combined, resulting in an overall more accurate object
prediction, especially for small objects. Empirical studies on the popular
benchmarks of VisDrone and DOTA datasets show the effectiveness of our density
crop-guided semi-supervised detector with an average improvement of more than
2\% over the basic mean-teacher method in COCO style AP. Our code is available
at: https://github.com/akhilpm/DroneSSOD.
- Abstract(参考訳): 現代のオブジェクト検出器のトレーニングにおける重要なボトルネックの1つは、画像に存在するオブジェクトごとにバウンディングボックスアノテーションを作成する必要があるラベル付きイメージの必要性である。
このボトルネックは、アノテータがしばしば高解像度画像上にクラスターに分布する小さな物体をラベル付けしなければならない空中画像においてさらに悪化する。
近年,半教師対象検出において,擬似ラベルと弱強強化一貫性を訓練した平均教師のアプローチが人気を集めている。
しかし、このような半教師付き検出器の小さな物体がしばしば存在する空中画像への直接適応は、最適な結果をもたらすものではないかもしれない。
本稿では,訓練中の小物体のクラスターを同定し,それを利用して推論性能を向上させる密度作物誘導半監視検出器を提案する。
トレーニング中、ラベル付き画像とラベル付画像から識別されたクラスタの画像作物を使用してトレーニングセットを増強し、それによって小さなオブジェクトを検出し、ラベル付画像上の小さなオブジェクトに対して優れた擬似ラベルを生成する。
推定中、検出器は興味のある対象を検出できるだけでなく、小さな物体(密度作物)の密度の高い領域も検出できるため、入力された画像からの検出と画像作物からの検出を組み合わせることで、特に小さな物体に対して、より正確な予測が可能になる。
VisDrone と DOTA データセットの一般的なベンチマークに関する実証研究は、COCO スタイル AP における基本的な平均教師法よりも平均 2 % 以上向上した密度の作物誘導半監視検出器の有効性を示している。
私たちのコードは、https://github.com/akhilpm/DroneSSOD.comで利用可能です。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images [33.80392696735718]
YOLC(You Only Look Clusters)は、アンカーフリーなオブジェクト検出器であるCenterNet上に構築された、効率的で効果的なフレームワークである。
大規模画像や非一様オブジェクトの分布がもたらす課題を克服するため,正確な検出のためにクラスタ領域のズームインを適応的に検索するローカルスケールモジュール(LSM)を導入する。
Visdrone 2019 と UAVDT を含む2つの航空画像データセットに対する広範な実験を行い、提案手法の有効性と優位性を実証した。
論文 参考訳(メタデータ) (2024-04-09T10:03:44Z) - Improving the Detection of Small Oriented Objects in Aerial Images [0.0]
本研究では,オブジェクト指向物体検出モデルの分類・回帰タスクを強化することにより,空中画像中の小型物体を高精度に検出する手法を提案する。
ガイド・アテンション・ロス(GALoss)とボックス・ポイント・ロス(BPLoss)の2つの損失からなるアテンション・ポイント・ネットワークを設計した。
実験結果から,小型オブジェクトインスタンスを用いた標準指向型空中データセットにおける注意点ネットワークの有効性が示された。
論文 参考訳(メタデータ) (2024-01-12T11:00:07Z) - Cascaded Zoom-in Detector for High Resolution Aerial Images [12.944309759825902]
密度誘導型トレーニングと推論のために検出器自体を再利用した効率的なカスケードズームイン検出器を提案する。
トレーニング中、密度作物が配置され、新しいクラスとしてラベル付けされ、トレーニングデータセットの強化に使用される。
このアプローチはどんな検出器にも容易に統合でき、標準検出プロセスに大きな変化は生じない。
論文 参考訳(メタデータ) (2023-03-15T16:39:21Z) - A Coarse to Fine Framework for Object Detection in High Resolution Image [8.316322664637537]
オブジェクト検出の現在のアプローチでは、高解像度画像における小さなオブジェクトや大規模な分散問題を検出することはめったにない。
本稿では,オブジェクト検出の精度を,特に小さなオブジェクトや大規模分散シーンに対して向上させる,シンプルで効率的なアプローチを提案する。
提案手法は,高分解能画像における物体の空間と情報を有効利用することにより,より効率的に検出できる。
論文 参考訳(メタデータ) (2023-03-02T13:04:33Z) - MUS-CDB: Mixed Uncertainty Sampling with Class Distribution Balancing
for Active Annotation in Aerial Object Detection [40.94800050576902]
最近の空中物体検出モデルは大量のラベル付きトレーニングデータに依存している。
アクティブラーニングは、情報および代表的未ラベルサンプルを選択的にクエリすることで、データラベリングコストを効果的に削減する。
本稿では,費用対効果の高い空中物体検出のための新しい能動学習手法を提案する。
論文 参考訳(メタデータ) (2022-12-06T07:50:00Z) - Exploiting Unlabeled Data with Vision and Language Models for Object
Detection [64.94365501586118]
堅牢で汎用的なオブジェクト検出フレームワークを構築するには、より大きなラベルスペースとより大きなトレーニングデータセットへのスケーリングが必要である。
本稿では,近年の視覚と言語モデルで利用可能なリッチなセマンティクスを利用して,未ラベル画像中のオブジェクトのローカライズと分類を行う手法を提案する。
生成した擬似ラベルの価値を,オープン語彙検出と半教師付きオブジェクト検出の2つのタスクで示す。
論文 参考訳(メタデータ) (2022-07-18T21:47:15Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。