論文の概要: Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization
- arxiv url: http://arxiv.org/abs/2209.10839v1
- Date: Thu, 22 Sep 2022 07:50:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 12:30:59.032427
- Title: Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization
- Title(参考訳): ガウス分布としての回転物体の検出とその3次元一般化
- Authors: Xue Yang, Gefan Zhang, Xiaojiang Yang, Yue Zhou, Wentao Wang, Jin
Tang, Tao He, Junchi Yan
- Abstract要約: 既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
- 参考スコア(独自算出の注目度): 81.29406957201458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing detection methods commonly use a parameterized bounding box (BBox)
to model and detect (horizontal) objects and an additional rotation angle
parameter is used for rotated objects. We argue that such a mechanism has
fundamental limitations in building an effective regression loss for rotation
detection, especially for high-precision detection with high IoU (e.g. 0.75).
Instead, we propose to model the rotated objects as Gaussian distributions. A
direct advantage is that our new regression loss regarding the distance between
two Gaussians e.g. Kullback-Leibler Divergence (KLD), can well align the actual
detection performance metric, which is not well addressed in existing methods.
Moreover, the two bottlenecks i.e. boundary discontinuity and square-like
problem also disappear. We also propose an efficient Gaussian metric-based
label assignment strategy to further boost the performance. Interestingly, by
analyzing the BBox parameters' gradients under our Gaussian-based KLD loss, we
show that these parameters are dynamically updated with interpretable physical
meaning, which help explain the effectiveness of our approach, especially for
high-precision detection. We extend our approach from 2-D to 3-D with a
tailored algorithm design to handle the heading estimation, and experimental
results on twelve public datasets (2-D/3-D, aerial/text/face images) with
various base detectors show its superiority.
- Abstract(参考訳): 既存の検出手法では、パラメータ化バウンディングボックス(BBox)を用いて(水平)物体をモデル化・検出し、回転対象に対して追加の回転角パラメータを用いる。
このようなメカニズムは、特に高いIoU(例えば0.75)を用いた高精度検出において、回転検出に有効な回帰損失を構築する上で、基本的な制限があると主張する。
代わりに、回転対象をガウス分布としてモデル化する。
直接の利点は、KLD(Kulback-Leibler Divergence)のような2つのガウス間の距離に関する新たな回帰損失が、既存の手法ではうまく扱えない実際の検出性能指標を適切に整合させることができることである。
さらに、2つのボトルネック、すなわち境界の不連続性と正方形問題も消滅する。
また,より効率的なガウス計量に基づくラベル割り当て戦略を提案し,性能を向上する。
興味深いことに、ガウスに基づくKLD損失下でのBBoxパラメータの勾配を解析することにより、これらのパラメータは解釈可能な物理的意味で動的に更新され、特に高精度検出における我々のアプローチの有効性を説明するのに役立つ。
提案手法を2-Dから3-Dに拡張し,方向推定を行うアルゴリズムを設計し,12の公開データセット(2-D/3-D,空中/テキスト/顔画像)に対して,その優位性を示した。
関連論文リスト
- R3D-AD: Reconstruction via Diffusion for 3D Anomaly Detection [12.207437451118036]
3次元異常検出は、精密製造における局所固有の欠陥のモニタリングにおいて重要な役割を担っている。
埋め込みベースおよび再構築ベースのアプローチは、最も人気があり、成功した方法の一つである。
本稿では, 高精度な3次元異常検出のための拡散モデルにより, 異常点雲を再構成するR3D-ADを提案する。
論文 参考訳(メタデータ) (2024-07-15T16:10:58Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Edge Based Oriented Object Detection [8.075609633483248]
対象物の検出精度を高めるために,エッジ勾配に基づく一意な損失関数を提案する。
DOTAデータセットのmAP増加率は1.3%である。
論文 参考訳(メタデータ) (2023-09-15T09:19:38Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Learning High-Precision Bounding Box for Rotated Object Detection via
Kullback-Leibler Divergence [100.6913091147422]
既存の回転物体検出器は、主に水平検出パラダイムから受け継がれている。
本稿では,回転回帰損失の設計を帰納パラダイムから導出手法に変更することを目的としている。
論文 参考訳(メタデータ) (2021-06-03T14:29:19Z) - Rethinking Rotated Object Detection with Gaussian Wasserstein Distance
Loss [111.8807588392563]
境界不連続性と最終検出基準の不整合性は, 回転検出回帰損失設計のボトルネックとなっている。
本稿では,ガウス・ワッサーシュタイン距離に基づく新しい回帰損失を,この問題に対する基本的なアプローチとして提案する。
論文 参考訳(メタデータ) (2021-01-28T12:04:35Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。