論文の概要: Rethinking IoU-based Optimization for Single-stage 3D Object Detection
- arxiv url: http://arxiv.org/abs/2207.09332v2
- Date: Wed, 20 Jul 2022 06:27:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-21 10:53:09.917707
- Title: Rethinking IoU-based Optimization for Single-stage 3D Object Detection
- Title(参考訳): 単段3次元物体検出のためのIoUに基づく最適化の再考
- Authors: Hualian Sheng, Sijia Cai, Na Zhao, Bing Deng, Jianqiang Huang,
Xian-Sheng Hua, Min-Jian Zhao, Gim Hee Lee
- Abstract要約: 本稿では回転分離型IoU(RDIoU)法を提案する。
我々のRDIoUは、回転変数を独立項として分離することで、回帰パラメータの複雑な相互作用を単純化する。
- 参考スコア(独自算出の注目度): 103.83141677242871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since Intersection-over-Union (IoU) based optimization maintains the
consistency of the final IoU prediction metric and losses, it has been widely
used in both regression and classification branches of single-stage 2D object
detectors. Recently, several 3D object detection methods adopt IoU-based
optimization and directly replace the 2D IoU with 3D IoU. However, such a
direct computation in 3D is very costly due to the complex implementation and
inefficient backward operations. Moreover, 3D IoU-based optimization is
sub-optimal as it is sensitive to rotation and thus can cause training
instability and detection performance deterioration. In this paper, we propose
a novel Rotation-Decoupled IoU (RDIoU) method that can mitigate the
rotation-sensitivity issue, and produce more efficient optimization objectives
compared with 3D IoU during the training stage. Specifically, our RDIoU
simplifies the complex interactions of regression parameters by decoupling the
rotation variable as an independent term, yet preserving the geometry of 3D
IoU. By incorporating RDIoU into both the regression and classification
branches, the network is encouraged to learn more precise bounding boxes and
concurrently overcome the misalignment issue between classification and
regression. Extensive experiments on the benchmark KITTI and Waymo Open Dataset
validate that our RDIoU method can bring substantial improvement for the
single-stage 3D object detection.
- Abstract(参考訳): IoU(Intersection-over-Union)に基づく最適化は、最終的なIoU予測距離と損失の整合性を維持するため、単段2次元物体検出器の回帰と分類の両方に広く用いられている。
近年、いくつかの3Dオブジェクト検出手法がIoUベースの最適化を採用しており、2D IoUを直接3D IoUに置き換えている。
しかし、3Dでのこのような直接計算は、複雑な実装と非効率な後方操作のために非常にコストがかかる。
さらに、3D IoUベースの最適化は回転に敏感であるため準最適であり、トレーニング不安定や検出性能の劣化を引き起こす可能性がある。
本稿では,回転分離型IoU(RDIoU)法を提案する。これは回転感度問題を緩和し,トレーニング段階における3D IoUよりも効率的な最適化目標を実現する。
具体的には、回転変数を独立項として分離し、3次元IoUの幾何学を保存することにより、回帰パラメータの複雑な相互作用を単純化する。
RDIoUを回帰と分類の両方に組み込むことで、ネットワークはより正確な境界ボックスを学習し、分類と回帰のミスアライメント問題を同時に克服することが奨励される。
KITTI と Waymo Open Dataset のベンチマーク実験により、我々の RDIoU 法は、単一ステージの3Dオブジェクト検出に大幅な改善をもたらすことが確認された。
関連論文リスト
- DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - GOOD: General Optimization-based Fusion for 3D Object Detection via
LiDAR-Camera Object Candidates [10.534984939225014]
3次元物体検出は、自律運転における知覚タスクの中核となる基礎となる。
Goodは汎用的な最適化ベースの融合フレームワークで、追加のモデルをトレーニングすることなく、満足度の高い検出を実現できる。
nuScenesとKITTIデータセットの両方の実験を行い、その結果、GOODはPointPillarsと比較してmAPスコアで9.1%上回っていることが示された。
論文 参考訳(メタデータ) (2023-03-17T07:05:04Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - Decoupled IoU Regression for Object Detection [31.9114940121939]
非最大抑圧(NMS)は、重複したバウンディングボックスを削除するためにオブジェクト検出パイプラインで広く使われている。
NMSの信頼性と実位置推定の信頼性の矛盾は検出性能に深刻な影響を及ぼす。
これらの問題に対処する新しいデカップリングIoU回帰モデルを提案する。
論文 参考訳(メタデータ) (2022-02-02T04:01:11Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - ST3D: Self-training for Unsupervised Domain Adaptation on 3D
ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。
当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文 参考訳(メタデータ) (2021-03-09T10:51:24Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - 3D IoU-Net: IoU Guided 3D Object Detector for Point Clouds [68.44740333471792]
正規分類と回帰分岐に3D IoU予測分岐を付加する。
我々は,IoU感度特徴学習とIoUアライメント操作を併用した3次元IoU-Netを提案する。
KITTIカー検出ベンチマークの実験結果から,IoU知覚による3次元IoU-Netが最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2020-04-10T09:24:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。