論文の概要: Rotated Object Detection via Scale-invariant Mahalanobis Distance in
Aerial Images
- arxiv url: http://arxiv.org/abs/2204.00840v1
- Date: Sat, 2 Apr 2022 11:21:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 13:09:55.414842
- Title: Rotated Object Detection via Scale-invariant Mahalanobis Distance in
Aerial Images
- Title(参考訳): 空中画像におけるスケール不変マハラノビス距離による回転物体検出
- Authors: Siyang Wen, Wei Guo, Ruijie Wu and Yi Liu
- Abstract要約: 本稿では,回転物体検出のための新しい損失関数Mahalanobis Distance Lossを提案する。
提案手法により,DOTA-v1.0上での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 8.05597701532906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rotated object detection in aerial images is a meaningful yet challenging
task as objects are densely arranged and have arbitrary orientations. The
eight-parameter (coordinates of box vectors) methods in rotated object
detection usually use ln-norm losses (L1 loss, L2 loss, and smooth L1 loss) as
loss functions. As ln-norm losses are mainly based on non-scale-invariant
Minkowski distance, using ln-norm losses will lead to inconsistency with the
detection metric rotational Intersection-over-Union (IoU) and training
instability. To address the problems, we use Mahalanobis distance to calculate
loss between the predicted and the target box vertices' vectors, proposing a
new loss function called Mahalanobis Distance Loss (MDL) for eight-parameter
rotated object detection. As Mahalanobis distance is scale-invariant, MDL is
more consistent with detection metric than ln-norm losses and more stable
during training. To alleviate the problem of boundary discontinuity like all
other eight-parameter methods, we further take the minimum loss value to make
MDL continuous at boundary cases. We achieve state-of-art performance on
DOTA-v1.0 with the proposed method MDL. Furthermore, with the comparative
experiment of smooth L1 loss under the same condi-tion, we find that MDL
performs better in rotated object detection.
- Abstract(参考訳): 空中画像における回転物体検出は、物体が密に配置され任意の向きを持つため、有意義だが困難な作業である。
回転物体検出における8パラメータ法は通常、lnノルム損失(l1損失、l2損失、滑らかなl1損失)を損失関数として使用する。
ln-ノルムの損失は、主に非スケール不変ミンコフスキー距離に基づいており、ln-ノルムの損失を用いると、検出距離の回転交叉(IoU)とトレーニング不安定性に矛盾する。
そこで本研究では,8パラメータ回転物体検出のためのマハラノビス距離損失(marahnobis distance loss, mdl)という新たな損失関数を提案する。
マハラノビス距離はスケール不変であるため、MDLはln-ノルム損失よりも検出基準と一致し、訓練中に安定である。
他の8パラメータ法と同様に境界不連続性の問題を軽減するため, MDL を境界条件で連続させるために最小損失値を求める。
提案手法により,DOTA-v1.0の最先端性能を実現する。
さらに, 同一条件下での滑らかなL1損失の比較実験により, MDLは回転物体検出において良好な性能を示した。
関連論文リスト
- FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection [10.655167287088368]
最小点距離に基づく任意の形状比較のための新しい計量法を提案する。
FPDIoU$損失は、最先端の回転オブジェクト検出に適用される。
論文 参考訳(メタデータ) (2024-05-16T09:44:00Z) - Edge Based Oriented Object Detection [8.075609633483248]
対象物の検出精度を高めるために,エッジ勾配に基づく一意な損失関数を提案する。
DOTAデータセットのmAP増加率は1.3%である。
論文 参考訳(メタデータ) (2023-09-15T09:19:38Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - MKIoU Loss: Towards Accurate Oriented Object Detection in Aerial Images [0.0]
修正されたカルマンIoUのSkewIoUの損失は、MkioUと呼ばれる。
提案手法は他のガウス法にも容易に拡張できる。
論文 参考訳(メタデータ) (2022-06-30T08:17:01Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - RSDet++: Point-based Modulated Loss for More Accurate Rotated Object
Detection [53.57176614020894]
我々は、回転感度誤差(RSE)として、5パラメータと8パラメータの回転物体検出法の両方における損失の不連続性を分類する。
問題を軽減するために新しい変調された回転損失を導入し、回転感度検出ネットワーク(RSDet)を提案する。
10ピクセル未満のオブジェクトに対する本手法の精度をさらに向上するため,新しいRSDet++を提案する。
論文 参考訳(メタデータ) (2021-09-24T11:57:53Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。