論文の概要: ReDet: A Rotation-equivariant Detector for Aerial Object Detection
- arxiv url: http://arxiv.org/abs/2103.07733v1
- Date: Sat, 13 Mar 2021 15:37:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 10:28:56.223299
- Title: ReDet: A Rotation-equivariant Detector for Aerial Object Detection
- Title(参考訳): ReDet: 空中物体検出のための回転同変検出器
- Authors: Jiaming Han and Jian Ding and Nan Xue and Gui-Song Xia
- Abstract要約: これらの問題に対処するために、回転等変性検出器(ReDet)を提案する。
回転同変ネットワークを検出器に組み込んで回転同変特徴を抽出する。
本手法は,空中物体検出作業における最先端性能を実現する。
- 参考スコア(独自算出の注目度): 27.419045245853706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, object detection in aerial images has gained much attention in
computer vision. Different from objects in natural images, aerial objects are
often distributed with arbitrary orientation. Therefore, the detector requires
more parameters to encode the orientation information, which are often highly
redundant and inefficient. Moreover, as ordinary CNNs do not explicitly model
the orientation variation, large amounts of rotation augmented data is needed
to train an accurate object detector. In this paper, we propose a
Rotation-equivariant Detector (ReDet) to address these issues, which explicitly
encodes rotation equivariance and rotation invariance. More precisely, we
incorporate rotation-equivariant networks into the detector to extract
rotation-equivariant features, which can accurately predict the orientation and
lead to a huge reduction of model size. Based on the rotation-equivariant
features, we also present Rotation-invariant RoI Align (RiRoI Align), which
adaptively extracts rotation-invariant features from equivariant features
according to the orientation of RoI. Extensive experiments on several
challenging aerial image datasets DOTA-v1.0, DOTA-v1.5 and HRSC2016, show that
our method can achieve state-of-the-art performance on the task of aerial
object detection. Compared with previous best results, our ReDet gains 1.2, 3.5
and 2.6 mAP on DOTA-v1.0, DOTA-v1.5 and HRSC2016 respectively while reducing
the number of parameters by 60\% (313 Mb vs. 121 Mb). The code is available at:
\url{https://github.com/csuhan/ReDet}.
- Abstract(参考訳): 近年,空中画像における物体検出がコンピュータビジョンにおいて注目されている。
自然画像の物体と異なり、空中の物体はしばしば任意の方向で分布する。
したがって、検出器は方向情報を符号化するためにより多くのパラメータを必要とする。
さらに、通常のcnnは方位変化を明示的にモデル化しないので、正確な物体検出器の訓練には大量の回転拡張データが必要である。
本稿では、回転同変検出器(redet)を提案し、回転同変と回転不変性を明示的に符号化する。
より正確には、回転同変ネットワークを検出器に組み込んで回転同変特性を抽出し、方位を正確に予測し、モデルサイズを大幅に削減する。
回転同値な特徴に基づいて、回転不変なroiアライメント(riroiアライメント)も提示し、roiの向きに応じて同値な特徴から回転不変な特徴を適応的に抽出する。
航空画像データセット DOTA-v1.0, DOTA-v1.5, HRSC2016 の大規模実験により, 本手法は空中物体検出のタスクにおいて, 最先端の性能を実現することができることを示した。
従来の結果と比較すると, DOTA-v1.0, DOTA-v1.5, HRSC2016では1.2, 3.5, 2.6mAP, パラメータ数は60\%減少する(313Mb vs. 121Mb)。
コードは: \url{https://github.com/csuhan/ReDet}で入手できる。
関連論文リスト
- RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis [15.42293045246587]
RIDEは3D LiDAR-point-based object DEtectorの回転不変性の先駆的な探索である。
回転に敏感ではあるが幾何をよく保持できる2機能抽出器と、幾何情報をある程度失うが回転に頑健な回転不変特徴を抽出する。
我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
論文 参考訳(メタデータ) (2024-08-28T08:53:33Z) - FRED: Towards a Full Rotation-Equivariance in Aerial Image Object
Detection [28.47314201641291]
FRED(Fully Rotation-Equivariant Oriented Object Detector)を導入する。
提案手法は,DOTA-v1.0では同等の性能を示し,DOTA-v1.5では1.5mAP,モデルパラメータでは16%と大幅に低下する。
論文 参考訳(メタデータ) (2023-12-22T09:31:43Z) - Rotation Invariant Transformer for Recognizing Object in UAVs [66.1564328237299]
本稿では,UAVから興味の対象を認識するための回転不変視変換器(RotTrans)を提案する。
RotTrans は最先端の mAP と Rank1 よりも5.9%、かつ 4.8% 高い最先端の 最先端の 最先端の 最先端の 技術 をはるかに上回っている。
我々のソリューションは、マルチモーダルビデオ推論・アナライジングコンペティションにおいて、UAVベースの人物認識トラックで第一位を獲得しました。
論文 参考訳(メタデータ) (2023-11-05T03:55:08Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - DARDet: A Dense Anchor-free Rotated Object Detector in Aerial Images [11.45718985586972]
空中画像における回転物体検出のための高密度アンカーフリー回転物体検出器(DARDet)を提案する。
我々のDARDetは、特徴マップの各前景ピクセルで回転したボックスの5つのパラメータを直接予測する。
提案手法は, 一般的に使用されている3つの空中オブジェクトデータセットに対して, 最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-03T15:28:14Z) - RSDet++: Point-based Modulated Loss for More Accurate Rotated Object
Detection [53.57176614020894]
我々は、回転感度誤差(RSE)として、5パラメータと8パラメータの回転物体検出法の両方における損失の不連続性を分類する。
問題を軽減するために新しい変調された回転損失を導入し、回転感度検出ネットワーク(RSDet)を提案する。
10ピクセル未満のオブジェクトに対する本手法の精度をさらに向上するため,新しいRSDet++を提案する。
論文 参考訳(メタデータ) (2021-09-24T11:57:53Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Rotation Equivariant Feature Image Pyramid Network for Object Detection
in Optical Remote Sensing Imagery [39.25541709228373]
本稿では、回転同値畳み込みに基づく画像ピラミッドネットワークである回転同変特徴像ピラミッドネットワーク(REFIPN)を提案する。
提案するピラミッドネットワークは, 新規な畳み込みフィルタを用いて, 広い範囲で特徴を抽出する。
提案モデルの検出性能は2つの一般的な航空ベンチマークで検証される。
論文 参考訳(メタデータ) (2021-06-02T01:33:49Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。