論文の概要: RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis
- arxiv url: http://arxiv.org/abs/2408.15643v1
- Date: Wed, 28 Aug 2024 08:53:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-29 16:43:13.064134
- Title: RIDE: Boosting 3D Object Detection for LiDAR Point Clouds via Rotation-Invariant Analysis
- Title(参考訳): RIDE:回転不変解析によるLiDAR点雲の3次元物体検出
- Authors: Zhaoxuan Wang, Xu Han, Hongxin Liu, Xianzhi Li,
- Abstract要約: RIDEは3D LiDAR-point-based object DEtectorの回転不変性の先駆的な探索である。
回転に敏感ではあるが幾何をよく保持できる2機能抽出器と、幾何情報をある程度失うが回転に頑健な回転不変特徴を抽出する。
我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
- 参考スコア(独自算出の注目度): 15.42293045246587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rotation robustness property has drawn much attention to point cloud analysis, whereas it still poses a critical challenge in 3D object detection. When subjected to arbitrary rotation, most existing detectors fail to produce expected outputs due to the poor rotation robustness. In this paper, we present RIDE, a pioneering exploration of Rotation-Invariance for the 3D LiDAR-point-based object DEtector, with the key idea of designing rotation-invariant features from LiDAR scenes and then effectively incorporating them into existing 3D detectors. Specifically, we design a bi-feature extractor that extracts (i) object-aware features though sensitive to rotation but preserve geometry well, and (ii) rotation-invariant features, which lose geometric information to a certain extent but are robust to rotation. These two kinds of features complement each other to decode 3D proposals that are robust to arbitrary rotations. Particularly, our RIDE is compatible and easy to plug into the existing one-stage and two-stage 3D detectors, and boosts both detection performance and rotation robustness. Extensive experiments on the standard benchmarks showcase that the mean average precision (mAP) and rotation robustness can be significantly boosted by integrating with our RIDE, with +5.6% mAP and 53% rotation robustness improvement on KITTI, +5.1% and 28% improvement correspondingly on nuScenes. The code will be available soon.
- Abstract(参考訳): 回転ロバスト性は点雲解析に多くの注目を集めているが、それでも3次元物体検出において重要な課題となっている。
任意の回転を受けると、ほとんどの既存の検出器はローテーションのロバスト性が悪いために出力が期待できない。
本稿では,3次元LiDAR-point-based object DEtector の回転不変性の先駆的探索である RIDE について,LiDAR のシーンから回転不変の機能を設計し,既存の3次元検出器に効果的に組み込むというキーアイデアを述べる。
具体的には、抽出する二機能抽出器を設計する。
一 回転に敏感ながら幾何をよく保存する物体認識機能
(II)幾何的情報をある程度失うが、回転に頑健な回転不変特徴。
これらの2種類の機能は互いに補完し、任意の回転に対して堅牢な3D提案をデコードする。
特に、我々のRIDEは互換性があり、既存の1段と2段の3D検出器に簡単に接続でき、検出性能と回転ロバスト性の両方を高めることができる。
標準ベンチマークにおいて、平均平均精度(mAP)と回転ロバスト性(回転ロバスト性)は、我々のRIDEと統合することにより著しく向上し、KITTIでは+5.6% mAPと53%の回転ロバスト性改善、+5.1%と28%がニューセンで改善されている。
コードはまもなく利用可能になる。
関連論文リスト
- VI-Net: Boosting Category-level 6D Object Pose Estimation via Learning
Decoupled Rotations on the Spherical Representations [55.25238503204253]
作業を容易にするために,VI-Netと呼ばれる新しい回転推定ネットワークを提案する。
球面信号を処理するために、SPAtial Spherical Convolutionの新たな設計に基づいて、球面特徴ピラミッドネットワークを構築する。
ベンチマークデータセットの実験により,提案手法の有効性が確認された。
論文 参考訳(メタデータ) (2023-08-19T05:47:53Z) - Self-supervised Learning of Rotation-invariant 3D Point Set Features using Transformer and its Self-distillation [3.1652399282742536]
本稿では,オブジェクトレベルでの高精度かつ回転不変な3次元点集合特徴を取得するための,自己教師付き学習フレームワークを提案する。
トークンを改良し,それを3次元点集合ごとに表現的回転不変の特徴に集約するために,自己認識機構を用いる。
提案アルゴリズムは,既存のアルゴリズムよりも高精度な回転不変の3次元点集合特徴を学習する。
論文 参考訳(メタデータ) (2023-08-09T06:03:07Z) - R2Det: Redemption from Range-view for Accurate 3D Object Detection [16.855672228478074]
Reemption from Range-view Module (R2M) は2次元視野から3次元視点への3次元表面テクスチャ強化のためのプラグアンドプレイアプローチである。
R2Mは、最先端のLiDARベースの3Dオブジェクト検出器を前処理としてシームレスに統合することができる。
論文 参考訳(メタデータ) (2023-07-21T10:36:05Z) - Evaluating 3D Shape Analysis Methods for Robustness to Rotation
Invariance [22.306775502181818]
本稿では,最近の3次元形状記述子のSO(3)回転に対する堅牢性について解析する。
物体が異なる方向で行われる3次元屋内シーンのデータベースを考察する。
論文 参考訳(メタデータ) (2023-05-29T18:39:31Z) - Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - SPE-Net: Boosting Point Cloud Analysis via Rotation Robustness
Enhancement [118.20816888815658]
SPE-Netという名前の3Dポイントクラウドアプリケーションに適した新しいディープアーキテクチャを提案する。
埋め込みSelective Position variant' の手順は、入力の根底にある回転条件に効果的に対応できる注意機構に依存している。
SPE-Netと関連する仮説の利点を4つのベンチマークで示し、SOTA法よりも回転試験データと回転試験データの両方に明らかな改善点を示した。
論文 参考訳(メタデータ) (2022-11-15T15:59:09Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - RSDet++: Point-based Modulated Loss for More Accurate Rotated Object
Detection [53.57176614020894]
我々は、回転感度誤差(RSE)として、5パラメータと8パラメータの回転物体検出法の両方における損失の不連続性を分類する。
問題を軽減するために新しい変調された回転損失を導入し、回転感度検出ネットワーク(RSDet)を提案する。
10ピクセル未満のオブジェクトに対する本手法の精度をさらに向上するため,新しいRSDet++を提案する。
論文 参考訳(メタデータ) (2021-09-24T11:57:53Z) - ReDet: A Rotation-equivariant Detector for Aerial Object Detection [27.419045245853706]
これらの問題に対処するために、回転等変性検出器(ReDet)を提案する。
回転同変ネットワークを検出器に組み込んで回転同変特徴を抽出する。
本手法は,空中物体検出作業における最先端性能を実現する。
論文 参考訳(メタデータ) (2021-03-13T15:37:36Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。