論文の概要: FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection
- arxiv url: http://arxiv.org/abs/2405.09942v1
- Date: Thu, 16 May 2024 09:44:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-17 14:41:47.989648
- Title: FPDIoU Loss: A Loss Function for Efficient Bounding Box Regression of Rotated Object Detection
- Title(参考訳): FPDIoU損失: 回転物体検出の効率的なバウンディングボックス回帰のための損失関数
- Authors: Siliang Ma, Yong Xu,
- Abstract要約: 最小点距離に基づく任意の形状比較のための新しい計量法を提案する。
FPDIoU$損失は、最先端の回転オブジェクト検出に適用される。
- 参考スコア(独自算出の注目度): 10.655167287088368
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bounding box regression is one of the important steps of object detection. However, rotation detectors often involve a more complicated loss based on SkewIoU which is unfriendly to gradient-based training. Most of the existing loss functions for rotated object detection calculate the difference between two bounding boxes only focus on the deviation of area or each points distance (e.g., $\mathcal{L}_{Smooth-\ell 1}$, $\mathcal{L}_{RotatedIoU}$ and $\mathcal{L}_{PIoU}$). The calculation process of some loss functions is extremely complex (e.g. $\mathcal{L}_{KFIoU}$). In order to improve the efficiency and accuracy of bounding box regression for rotated object detection, we proposed a novel metric for arbitrary shapes comparison based on minimum points distance, which takes most of the factors from existing loss functions for rotated object detection into account, i.e., the overlap or nonoverlapping area, the central points distance and the rotation angle. We also proposed a loss function called $\mathcal{L}_{FPDIoU}$ based on four points distance for accurate bounding box regression focusing on faster and high quality anchor boxes. In the experiments, $FPDIoU$ loss has been applied to state-of-the-art rotated object detection (e.g., RTMDET, H2RBox) models training with three popular benchmarks of rotated object detection including DOTA, DIOR, HRSC2016 and two benchmarks of arbitrary orientation scene text detection including ICDAR 2017 RRC-MLT and ICDAR 2019 RRC-MLT, which achieves better performance than existing loss functions.
- Abstract(参考訳): 境界ボックス回帰は、オブジェクト検出の重要なステップの1つである。
しかし、回転検出器は勾配に基づく訓練に不都合なSkewIoUに基づくより複雑な損失を伴うことが多い。
回転物体検出のための既存の損失関数の多くは、領域の偏差と各点距離(例えば、$\mathcal{L}_{Smooth-\ell 1}$、$\mathcal{L}_{RotatedIoU}$、$\mathcal{L}_{PIoU}$)にのみフォーカスする2つの境界ボックス間の差を計算する。
損失関数の計算プロセスは非常に複雑である(例: $\mathcal{L}_{KFIoU}$)。
回転物体検出における境界ボックス回帰の効率と精度を向上させるため,回転物体検出のための既存の損失関数,すなわち重複領域や非重複領域,中心点距離,回転角を考慮に入れた,最小点距離に基づく任意の形状比較のための新しい指標を提案した。
また,高速かつ高品質なアンカーボックスに着目した正確なバウンディングボックス回帰のための4点距離に基づいて,$\mathcal{L}_{FPDIoU}$という損失関数を提案した。
FPDIoU$損失は、DOTA、DIOR、HRSC2016を含む回転オブジェクト検出の3つの一般的なベンチマークと、ICDAR 2017 RRC-MLTとICDAR 2019 RRC-MLTを含む任意の向きのシーンテキスト検出の2つのベンチマークを用いた、最先端の回転オブジェクト検出(例えば、RTMDET、H2RBox)モデルに適用される。
関連論文リスト
- MPDIoU: A Loss for Efficient and Accurate Bounding Box Regression [0.0]
本稿では,新しい境界ボックス類似度比較基準MPDIoUを提案する。
MPDIoU損失関数は、最先端のインスタンスセグメンテーション(YOLACT)やPASCAL VOC、MS COCO、IIIT5kで訓練されたオブジェクト検出(YOLOv7)モデルに適用される。
論文 参考訳(メタデータ) (2023-07-14T23:54:49Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - RSDet++: Point-based Modulated Loss for More Accurate Rotated Object
Detection [53.57176614020894]
我々は、回転感度誤差(RSE)として、5パラメータと8パラメータの回転物体検出法の両方における損失の不連続性を分類する。
問題を軽減するために新しい変調された回転損失を導入し、回転感度検出ネットワーク(RSDet)を提案する。
10ピクセル未満のオブジェクトに対する本手法の精度をさらに向上するため,新しいRSDet++を提案する。
論文 参考訳(メタデータ) (2021-09-24T11:57:53Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。