論文の概要: HA-RDet: Hybrid Anchor Rotation Detector for Oriented Object Detection
- arxiv url: http://arxiv.org/abs/2412.14379v1
- Date: Wed, 18 Dec 2024 22:26:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:34.267858
- Title: HA-RDet: Hybrid Anchor Rotation Detector for Oriented Object Detection
- Title(参考訳): HA-RDet:オブジェクト指向物体検出用ハイブリッドアンカー回転検出器
- Authors: Phuc D. A. Nguyen,
- Abstract要約: 空中画像における物体の向き検出は、大きさや方向の異なるため、大きな課題となる。
オブジェクト指向物体検出のためのアンカーベースおよびアンカーフリースキームの利点を組み合わせたハイブリッドアンカー回転検出器(HA-RDet)を提案する。
HA-RDetは、DOTA-v1の75.41 mAP、DIOR-Rの65.3 mAP、HRSC2016の90.2 mAPなど、競争力のある精度を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Oriented object detection in aerial images poses a significant challenge due to their varying sizes and orientations. Current state-of-the-art detectors typically rely on either two-stage or one-stage approaches, often employing Anchor-based strategies, which can result in computationally expensive operations due to the redundant number of generated anchors during training. In contrast, Anchor-free mechanisms offer faster processing but suffer from a reduction in the number of training samples, potentially impacting detection accuracy. To address these limitations, we propose the Hybrid-Anchor Rotation Detector (HA-RDet), which combines the advantages of both anchor-based and anchor-free schemes for oriented object detection. By utilizing only one preset anchor for each location on the feature maps and refining these anchors with our Orientation-Aware Convolution technique, HA-RDet achieves competitive accuracies, including 75.41 mAP on DOTA-v1, 65.3 mAP on DIOR-R, and 90.2 mAP on HRSC2016, against current anchor-based state-of-the-art methods, while significantly reducing computational resources.
- Abstract(参考訳): 空中画像における物体の向き検出は、大きさや方向の異なるため、大きな課題となる。
現在の最先端検出器は、通常2段階または1段階のアプローチに依存し、しばしばアンカーベースの戦略を採用する。
対照的に、アンカーフリーメカニズムはより高速な処理を提供するが、トレーニングサンプルの数が減少し、検出精度に影響を及ぼす可能性がある。
これらの制約に対処するために、オブジェクト指向オブジェクト検出のためのアンカーベースおよびアンカーフリースキームの利点を組み合わせたハイブリッドアンカー回転検出器(HA-RDet)を提案する。
HA-RDetは、特徴マップ上の各位置のプリセットアンカーを1つだけ利用し、オリエンテーション・アウェア・コンボリューション(Orientation-Aware Convolution)技術でこれらのアンカーを精製することにより、DOTA-v1上の75.41 mAP、DIOR-R上の65.3 mAP、HRSC2016における90.2 mAPなどの競合的精度を実現し、計算資源を大幅に削減する。
関連論文リスト
- Multitask Learning for SAR Ship Detection with Gaussian-Mask Joint Segmentation [20.540873039361102]
本稿では,オブジェクト検出,スペックル抑制,ターゲットセグメンテーションタスクからなるSAR船舶検出のためのマルチタスク学習フレームワークを提案する。
アスペクト比重み付けによる角度分類損失を導入し、角度周期性と物体比に対処して検出精度を向上させる。
スペックル抑制タスクはデュアルフュージョンアテンション機構を使用してノイズを低減し、浅くノイズを生じさせる特徴を融合させ、ロバスト性を高める。
ターゲットセグメンテーションタスクは、回転したガウスマスクを利用して、乱雑な背景から対象領域を抽出するネットワークを支援し、画素レベルの予測により検出効率を向上させる。
論文 参考訳(メタデータ) (2024-11-21T05:10:41Z) - Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - Augmenting Anchors by the Detector Itself [14.6595323571382]
本研究では, AADI と呼ばれるアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカーアンカー拡張法を提案する。
AADIはアンカー自由法ではないが、アンカーのスケールとアスペクト比を連続空間から離散空間に変換する。
COCOデータセットの大規模な実験により、AADIは2段法と1段法の両方に明らかな利点があることが示された。
論文 参考訳(メタデータ) (2021-05-28T20:11:08Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。