論文の概要: 4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision
- arxiv url: http://arxiv.org/abs/2505.13905v1
- Date: Tue, 20 May 2025 04:12:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:52.731996
- Title: 4D-ROLLS: 4D Radar Occupancy Learning via LiDAR Supervision
- Title(参考訳): 4D-ROLLS:LiDARスーパービジョンによる4Dレーダ職業学習
- Authors: Ruihan Liu, Xiaoyi Wu, Xijun Chen, Liang Hu, Yunjiang Lou,
- Abstract要約: 我々は,LiDAR点雲を監視信号として用いた4Dレーダの4D-ROLLSを提案する。
モデルは、下流タスクのBEVセグメンテーションとポイントクラウド占有率予測にシームレスに転送される。
この軽量ネットワークにより、4D-ROLLSモデルは4060 GPUで約30Hzの高速な推論速度を実現することができる。
- 参考スコア(独自算出の注目度): 7.099012213719072
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A comprehensive understanding of 3D scenes is essential for autonomous vehicles (AVs), and among various perception tasks, occupancy estimation plays a central role by providing a general representation of drivable and occupied space. However, most existing occupancy estimation methods rely on LiDAR or cameras, which perform poorly in degraded environments such as smoke, rain, snow, and fog. In this paper, we propose 4D-ROLLS, the first weakly supervised occupancy estimation method for 4D radar using the LiDAR point cloud as the supervisory signal. Specifically, we introduce a method for generating pseudo-LiDAR labels, including occupancy queries and LiDAR height maps, as multi-stage supervision to train the 4D radar occupancy estimation model. Then the model is aligned with the occupancy map produced by LiDAR, fine-tuning its accuracy in occupancy estimation. Extensive comparative experiments validate the exceptional performance of 4D-ROLLS. Its robustness in degraded environments and effectiveness in cross-dataset training are qualitatively demonstrated. The model is also seamlessly transferred to downstream tasks BEV segmentation and point cloud occupancy prediction, highlighting its potential for broader applications. The lightweight network enables 4D-ROLLS model to achieve fast inference speeds at about 30 Hz on a 4060 GPU. The code of 4D-ROLLS will be made available at https://github.com/CLASS-Lab/4D-ROLLS.
- Abstract(参考訳): 3Dシーンの総合的な理解は、自律走行車(AV)にとって不可欠であり、様々な知覚タスクの中で、占有空間の一般的な表現を提供することによって、占有率の推定が中心的な役割を担っている。
しかし、既存の占有率推定手法のほとんどはLiDARやカメラに依存しており、煙、雨、雪、霧といった劣化した環境では性能が悪くなっている。
本稿では,LiDAR点雲を監視信号として用いた4Dレーダの4D-ROLLSを提案する。
具体的には、4Dレーダの占有率推定モデルを訓練するための多段階監視として、占有率クエリやLiDARの高さマップを含む擬似LiDARラベルを生成する方法を提案する。
次に、モデルは、LiDARが生成した占有マップと整列し、占有率推定の精度を微調整する。
大規模比較実験により、4D-ROLLSの異常な性能が検証された。
劣化環境におけるロバスト性とクロスデータセットトレーニングの有効性は質的に実証されている。
モデルはまた、下流タスクのBEVセグメンテーションとポイントクラウド占有率予測にシームレスに移行され、より広範なアプリケーションの可能性を強調している。
この軽量ネットワークにより、4D-ROLLSモデルは4060 GPUで約30Hzの高速な推論速度を実現することができる。
4D-ROLLSのコードはhttps://github.com/CLASS-Lab/4D-ROLLSで公開される。
関連論文リスト
- Easi3R: Estimating Disentangled Motion from DUSt3R Without Training [48.87063562819018]
Easi3Rは,4次元再構成のための簡易かつ効率的なトレーニングフリー手法である。
提案手法は,事前学習やネットワークファインチューニングの必要性を排除し,推論中の注意適応を適用した。
実世界のダイナミックビデオの実験では、従来の最先端手法よりも軽量な注意適応が著しく優れていたことが示されている。
論文 参考訳(メタデータ) (2025-03-31T17:59:58Z) - A Novel Multi-Teacher Knowledge Distillation for Real-Time Object Detection using 4D Radar [5.038148262901536]
3Dオブジェクト検出は、安全で自律的なナビゲーションに不可欠であり、多様な気象条件にまたがって信頼性の高い性能を必要とする。
従来のレーダーは標高データがないため制限がある。
4Dレーダーは、距離、方位、ドップラー速度とともに高度を測定することでこれを克服し、自動運転車にとって貴重なものとなっている。
論文 参考訳(メタデータ) (2025-02-10T02:48:56Z) - RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar [15.776076554141687]
3D占有に基づく知覚パイプラインは、かなり進歩した自律運転を持つ。
現在の方法では、LiDARやカメラの入力を3D占有率予測に頼っている。
本稿では,4次元イメージングレーダセンサを用いた3次元占有予測手法を提案する。
論文 参考訳(メタデータ) (2024-05-22T21:48:17Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - R4Dyn: Exploring Radar for Self-Supervised Monocular Depth Estimation of
Dynamic Scenes [69.6715406227469]
駆動シナリオにおける自己教師付き単眼深度推定は、教師付きアプローチに匹敵する性能を達成した。
本稿では,自己監督型深度推定フレームワーク上に費用効率の高いレーダデータを利用する新しい手法であるR4Dynを提案する。
論文 参考訳(メタデータ) (2021-08-10T17:57:03Z) - PC-DAN: Point Cloud based Deep Affinity Network for 3D Multi-Object
Tracking (Accepted as an extended abstract in JRDB-ACT Workshop at CVPR21) [68.12101204123422]
点雲は3次元座標における空間データの密集したコンパイルである。
我々は3次元多目的追跡(MOT)のためのPointNetベースのアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-03T05:36:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。