論文の概要: Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images
- arxiv url: http://arxiv.org/abs/2112.06701v1
- Date: Mon, 13 Dec 2021 14:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 22:04:13.816829
- Title: Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images
- Title(参考訳): 空中画像におけるロバスト物体検出のためのモデルインタラクションによるアンカーリタッチ
- Authors: Dong Liang, Qixiang Geng, Zongqi Wei, Dmitry A. Vorontsov, Ekaterina
L. Kim, Mingqiang Wei and Huiyu Zhou
- Abstract要約: 本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
- 参考スコア(独自算出の注目度): 15.404024559652534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection has made tremendous strides in computer vision. Small object
detection with appearance degradation is a prominent challenge, especially for
aerial observations. To collect sufficient positive/negative samples for
heuristic training, most object detectors preset region anchors in order to
calculate Intersection-over-Union (IoU) against the ground-truthed data. In
this case, small objects are frequently abandoned or mislabeled. In this paper,
we present an effective Dynamic Enhancement Anchor (DEA) network to construct a
novel training sample generator. Different from the other state-of-the-art
techniques, the proposed network leverages a sample discriminator to realize
interactive sample screening between an anchor-based unit and an anchor-free
unit to generate eligible samples. Besides, multi-task joint training with a
conservative anchor-based inference scheme enhances the performance of the
proposed model while reducing computational complexity. The proposed scheme
supports both oriented and horizontal object detection tasks. Extensive
experiments on two challenging aerial benchmarks (i.e., DOTA and HRSC2016)
indicate that our method achieves state-of-the-art performance in accuracy with
moderate inference speed and computational overhead for training. On DOTA, our
DEA-Net which integrated with the baseline of RoI-Transformer surpasses the
advanced method by 0.40% mean-Average-Precision (mAP) for oriented object
detection with a weaker backbone network (ResNet-101 vs ResNet-152) and 3.08%
mean-Average-Precision (mAP) for horizontal object detection with the same
backbone. Besides, our DEA-Net which integrated with the baseline of ReDet
achieves the state-of-the-art performance by 80.37%. On HRSC2016, it surpasses
the previous best model by 1.1% using only 3 horizontal anchors.
- Abstract(参考訳): 物体検出はコンピュータビジョンにおいて大きな進歩を遂げた。
外観劣化を伴う小型物体検出は、特に空中観測において顕著な課題である。
ヒューリスティックトレーニングのための十分な正・負のサンプルを収集するために、ほとんどの物体検出器は、接地されたデータに対してIoU(Intersection-over-Union)を計算するために領域アンカーをプリセットする。
この場合、小さな物体はしばしば放棄されるか、誤記される。
本稿では,新しいトレーニングサンプル生成装置を構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
他の最先端技術とは違って,本ネットワークでは,アンカーベースユニットとアンカーフリーユニットとの対話型サンプルスクリーニングを実現するために,サンプル判別器を利用する。
さらに、保守的なアンカーベース推論スキームを用いたマルチタスク共同トレーニングにより、計算複雑性を低減しつつ、提案モデルの性能を向上させる。
提案手法はオブジェクト指向と水平物体検出の両方をサポートする。
2つの挑戦的航空ベンチマーク(DOTAとHRSC2016)の大規模な実験は、我々の手法が適度な推論速度と訓練のための計算オーバーヘッドで精度良く最先端の性能を達成することを示唆している。
DOTAでは、RoI-Transformerのベースラインと統合したDEA-Netが、より弱いバックボーンネットワーク(ResNet-101 vs ResNet-152)によるオブジェクト指向オブジェクト検出のための平均精度(mAP)と、同じバックボーンによる水平オブジェクト検出のための平均精度(mAP)を0.40%上回っている。
さらに,ReDetのベースラインと統合したDEA-Netでは,最先端のパフォーマンスが80.37%向上した。
hrsc2016では、従来のベストモデルを1.1%上回り、水平アンカーは3つしかない。
関連論文リスト
- Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - PointOBB-v3: Expanding Performance Boundaries of Single Point-Supervised Oriented Object Detection [65.84604846389624]
我々は,より強力な単一点制御OODフレームワークであるPointOBB-v3を提案する。
追加のプリミティブなしで擬似回転ボックスを生成し、エンドツーエンドのパラダイムをサポートする。
本手法は従来の最先端手法と比較して3.56%の精度向上を実現している。
論文 参考訳(メタデータ) (2025-01-23T18:18:15Z) - Efficient Oriented Object Detection with Enhanced Small Object Recognition in Aerial Images [2.9138705529771123]
本稿では,オブジェクト指向物体検出タスクに適したYOLOv8モデルを新たに拡張する。
本モデルでは,ASFP(Adaptive Scale Feature Pyramid)モジュールと,P2層の詳細を利用したウェーブレット変換に基づくC2fモジュールを特徴とする。
我々のアプローチは233万のパラメータを持つDecoupleNetよりも効率的なアーキテクチャ設計を提供し、検出精度を維持しています。
論文 参考訳(メタデータ) (2024-12-17T05:45:48Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。