論文の概要: Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images
- arxiv url: http://arxiv.org/abs/2112.06701v1
- Date: Mon, 13 Dec 2021 14:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 22:04:13.816829
- Title: Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images
- Title(参考訳): 空中画像におけるロバスト物体検出のためのモデルインタラクションによるアンカーリタッチ
- Authors: Dong Liang, Qixiang Geng, Zongqi Wei, Dmitry A. Vorontsov, Ekaterina
L. Kim, Mingqiang Wei and Huiyu Zhou
- Abstract要約: 本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
- 参考スコア(独自算出の注目度): 15.404024559652534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection has made tremendous strides in computer vision. Small object
detection with appearance degradation is a prominent challenge, especially for
aerial observations. To collect sufficient positive/negative samples for
heuristic training, most object detectors preset region anchors in order to
calculate Intersection-over-Union (IoU) against the ground-truthed data. In
this case, small objects are frequently abandoned or mislabeled. In this paper,
we present an effective Dynamic Enhancement Anchor (DEA) network to construct a
novel training sample generator. Different from the other state-of-the-art
techniques, the proposed network leverages a sample discriminator to realize
interactive sample screening between an anchor-based unit and an anchor-free
unit to generate eligible samples. Besides, multi-task joint training with a
conservative anchor-based inference scheme enhances the performance of the
proposed model while reducing computational complexity. The proposed scheme
supports both oriented and horizontal object detection tasks. Extensive
experiments on two challenging aerial benchmarks (i.e., DOTA and HRSC2016)
indicate that our method achieves state-of-the-art performance in accuracy with
moderate inference speed and computational overhead for training. On DOTA, our
DEA-Net which integrated with the baseline of RoI-Transformer surpasses the
advanced method by 0.40% mean-Average-Precision (mAP) for oriented object
detection with a weaker backbone network (ResNet-101 vs ResNet-152) and 3.08%
mean-Average-Precision (mAP) for horizontal object detection with the same
backbone. Besides, our DEA-Net which integrated with the baseline of ReDet
achieves the state-of-the-art performance by 80.37%. On HRSC2016, it surpasses
the previous best model by 1.1% using only 3 horizontal anchors.
- Abstract(参考訳): 物体検出はコンピュータビジョンにおいて大きな進歩を遂げた。
外観劣化を伴う小型物体検出は、特に空中観測において顕著な課題である。
ヒューリスティックトレーニングのための十分な正・負のサンプルを収集するために、ほとんどの物体検出器は、接地されたデータに対してIoU(Intersection-over-Union)を計算するために領域アンカーをプリセットする。
この場合、小さな物体はしばしば放棄されるか、誤記される。
本稿では,新しいトレーニングサンプル生成装置を構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
他の最先端技術とは違って,本ネットワークでは,アンカーベースユニットとアンカーフリーユニットとの対話型サンプルスクリーニングを実現するために,サンプル判別器を利用する。
さらに、保守的なアンカーベース推論スキームを用いたマルチタスク共同トレーニングにより、計算複雑性を低減しつつ、提案モデルの性能を向上させる。
提案手法はオブジェクト指向と水平物体検出の両方をサポートする。
2つの挑戦的航空ベンチマーク(DOTAとHRSC2016)の大規模な実験は、我々の手法が適度な推論速度と訓練のための計算オーバーヘッドで精度良く最先端の性能を達成することを示唆している。
DOTAでは、RoI-Transformerのベースラインと統合したDEA-Netが、より弱いバックボーンネットワーク(ResNet-101 vs ResNet-152)によるオブジェクト指向オブジェクト検出のための平均精度(mAP)と、同じバックボーンによる水平オブジェクト検出のための平均精度(mAP)を0.40%上回っている。
さらに,ReDetのベースラインと統合したDEA-Netでは,最先端のパフォーマンスが80.37%向上した。
hrsc2016では、従来のベストモデルを1.1%上回り、水平アンカーは3つしかない。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - Scale-Invariant Feature Disentanglement via Adversarial Learning for UAV-based Object Detection [18.11107031800982]
本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。
3つのベンチマークデータセット上で、最先端の3つの軽量検出フレームワークに適用する。
論文 参考訳(メタデータ) (2024-05-24T11:40:22Z) - Better Sampling, towards Better End-to-end Small Object Detection [7.7473020808686694]
限られた特性と高密度と相互重なり合いのため、小さな物体検出は不満足なままである。
エンド・ツー・エンド・フレームワークにおけるサンプリングの強化手法を提案する。
我々のモデルは、VisDroneデータセット上での最先端(SOTA)よりも平均精度(AP)が2.9%向上することを示す。
論文 参考訳(メタデータ) (2024-05-17T04:37:44Z) - PointOBB: Learning Oriented Object Detection via Single Point
Supervision [55.88982271340328]
本稿では,オブジェクト指向物体検出のための最初の単一点ベース OBB 生成法である PointOBB を提案する。
PointOBBは、オリジナルビュー、リサイズビュー、ローテーション/フリップ(rot/flp)ビューの3つのユニークなビューの協調利用を通じて動作する。
DIOR-RとDOTA-v1.0データセットの実験結果は、PointOBBが有望な性能を達成することを示す。
論文 参考訳(メタデータ) (2023-11-23T15:51:50Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Dynamic Anchor Learning for Arbitrary-Oriented Object Detection [4.247967690041766]
任意指向オブジェクトは、自然のシーン、空中写真、リモートセンシング画像などに広く現れる。
現在の回転検出器は、異なる向きのアンカーをたくさん使用して、地上の真実ボックスとの空間アライメントを実現します。
新たに定義されたマッチング度を利用した動的アンカー学習(DAL)法を提案する。
論文 参考訳(メタデータ) (2020-12-08T01:30:06Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。