論文の概要: On the Robustness of Object Detection Models on Aerial Images
- arxiv url: http://arxiv.org/abs/2308.15378v2
- Date: Mon, 13 Jan 2025 06:49:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:25:13.909589
- Title: On the Robustness of Object Detection Models on Aerial Images
- Title(参考訳): 空中画像における物体検出モデルのロバスト性について
- Authors: Haodong He, Jian Ding, Bowen Xu, Gui-Song Xia,
- Abstract要約: DOTA-v1.0に基づく新しいベンチマークを2つ導入する。
第1のベンチマークは、19の一般的な汚職を含むが、第2のベンチマークは、クラウド崩壊状態に焦点を当てている。
回転不変モデリングと強化されたバックボーンアーキテクチャはモデルの堅牢性を向上させることができる。
- 参考スコア(独自算出の注目度): 38.91734128770737
- License:
- Abstract: The robustness of object detection models is a major concern when applied to real-world scenarios. The performance of most models tends to degrade when confronted with images affected by corruptions, since they are usually trained and evaluated on clean datasets. While numerous studies have explored the robustness of object detection models on natural images, there is a paucity of research focused on models applied to aerial images, which feature complex backgrounds, substantial variations in scales, and orientations of objects. This paper addresses the challenge of assessing the robustness of object detection models on aerial images, with a specific emphasis on scenarios where images are affected by clouds. In this study, we introduce two novel benchmarks based on DOTA-v1.0. The first benchmark encompasses 19 prevalent corruptions, while the second focuses on the cloud-corrupted condition-a phenomenon uncommon in natural images yet frequent in aerial photography. We systematically evaluate the robustness of mainstream object detection models and perform necessary ablation experiments. Through our investigations, we find that rotation-invariant modeling and enhanced backbone architectures can improve the robustness of models. Furthermore, increasing the capacity of Transformer-based backbones can strengthen their robustness. The benchmarks we propose and our comprehensive experimental analyses can facilitate research on robust object detection on aerial images. The codes and datasets are available at: https://github.com/hehaodong530/DOTA-C.
- Abstract(参考訳): オブジェクト検出モデルの堅牢性は、現実のシナリオに適用する際の大きな関心事である。
ほとんどのモデルのパフォーマンスは、汚職の影響を受けやすい画像に直面すると劣化する傾向にある。
自然画像における物体検出モデルの堅牢性について多くの研究が行われてきたが、複雑な背景、スケールの相当な変化、物体の向きといった、空中画像に適用されたモデルに焦点を当てた研究が数多く行われている。
本稿では,物体検出モデルのロバスト性を航空画像上で評価する上での課題について述べる。
本研究では,DOTA-v1.0に基づく2つの新しいベンチマークを紹介する。
第1のベンチマークは、19件の汚職を含むが、第2のベンチマークは、雲が崩壊した状態(自然画像では珍しく、空中写真では頻繁に見られる現象)に焦点を当てている。
主流対象検出モデルのロバスト性を体系的に評価し,必要なアブレーション実験を行う。
本研究により、回転不変モデリングと強化されたバックボーンアーキテクチャがモデルの堅牢性を向上させることが判明した。
さらにトランスフォーマーベースのバックボーンの容量を増やすことで、その堅牢性を高めることができる。
提案するベンチマークと包括的実験分析により,航空画像上でのロバストな物体検出の研究が促進される。
コードとデータセットは、https://github.com/hehaodong530/DOTA-Cで公開されている。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Synthetic imagery for fuzzy object detection: A comparative study [3.652647451754697]
ファジィ物体検出はコンピュータビジョン(CV)研究の難しい分野である
火、煙、霧、蒸気のようなファジィな物体は、視覚的特徴の点で非常に複雑である。
完全合成火災画像の生成と自動アノテートのための代替手法を提案し,活用する。
論文 参考訳(メタデータ) (2024-10-01T23:22:54Z) - SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。
トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。
本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文 参考訳(メタデータ) (2024-05-02T19:47:08Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object
Detection [24.085715205081385]
我々は、オブジェクトのサイズを画像中の画素数、サイズ不均衡として、データセット内の特定のサイズのオブジェクトの過剰表現として表現する。
本稿では,任意のオブジェクト検出モデル上にプラグインとして適用可能な,新しいARchitectUre-Agnostic BAlanced Loss (ARUBA)を提案する。
論文 参考訳(メタデータ) (2022-10-10T11:28:16Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Knowledge Distillation for Oriented Object Detection on Aerial Images [1.827510863075184]
本稿では,KD-RNetの知識蒸留による空中画像の回転物体検出のためのモデル圧縮手法を提案する。
大規模空中物体検出データセット(DOTA)による実験結果から,提案したKD-RNetモデルにより,パラメータ数を削減した平均値精度(mAP)が向上し,同時にKD-RNetは,基底アノテーションと高い重なり合う高品質検出を提供することで,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-06-20T14:24:16Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。