論文の概要: RaLD: Generating High-Resolution 3D Radar Point Clouds with Latent Diffusion
- arxiv url: http://arxiv.org/abs/2511.07067v1
- Date: Mon, 10 Nov 2025 13:03:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.256022
- Title: RaLD: Generating High-Resolution 3D Radar Point Clouds with Latent Diffusion
- Title(参考訳): RaLD: 潜伏拡散を伴う高分解能3次元レーダー点雲の生成
- Authors: Ruijie Zhang, Bixin Zeng, Shengpeng Wang, Fuhui Zhou, Wei Wang,
- Abstract要約: ミリ波レーダーは、悪条件の頑丈さと低コストのおかげで、自律システムに対して有望なセンシングモダリティを提供する。
その実用性はレーダーポイント雲の空間性と低解像度によって著しく制限されており、密集した正確な3D知覚を必要とするタスクに課題をもたらす。
本稿では,このギャップを埋めるフレームワークとして,シーンレベルのフラストラムベースのLiDARオートエンコーディング,順序不変の潜在表現,ダイレクトレーダスペクトルコンディショニングを導入して紹介する。
- 参考スコア(独自算出の注目度): 17.986411213116828
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millimeter-wave radar offers a promising sensing modality for autonomous systems thanks to its robustness in adverse conditions and low cost. However, its utility is significantly limited by the sparsity and low resolution of radar point clouds, which poses challenges for tasks requiring dense and accurate 3D perception. Despite that recent efforts have shown great potential by exploring generative approaches to address this issue, they often rely on dense voxel representations that are inefficient and struggle to preserve structural detail. To fill this gap, we make the key observation that latent diffusion models (LDMs), though successful in other modalities, have not been effectively leveraged for radar-based 3D generation due to a lack of compatible representations and conditioning strategies. We introduce RaLD, a framework that bridges this gap by integrating scene-level frustum-based LiDAR autoencoding, order-invariant latent representations, and direct radar spectrum conditioning. These insights lead to a more compact and expressive generation process. Experiments show that RaLD produces dense and accurate 3D point clouds from raw radar spectrums, offering a promising solution for robust perception in challenging environments.
- Abstract(参考訳): ミリ波レーダーは、悪条件の頑丈さと低コストのおかげで、自律システムに対して有望なセンシングモダリティを提供する。
しかし、その実用性はレーダーポイント雲の空間性と低解像度によって著しく制限されており、密集した正確な3D知覚を必要とするタスクに課題をもたらす。
最近の試みは、この問題に対処するための生成的アプローチを探索する大きな可能性を示しているが、それらはしばしば非効率で構造的な詳細を維持するのに苦労する密度の高いボクセル表現に依存している。
このギャップを埋めるために、他のモダリティで成功した潜在拡散モデル(LDM)が、互換性のある表現や条件付け戦略の欠如により、レーダーベースの3D生成に効果的に活用されていないことを重要視する。
本稿では,このギャップを埋めるフレームワークとして,シーンレベルのフラストラムベースのLiDARオートエンコーディング,順序不変の潜在表現,ダイレクトレーダスペクトルコンディショニングを導入して紹介する。
これらの洞察はよりコンパクトで表現力のある生成プロセスにつながります。
実験により、RaLDは生のレーダースペクトルから密度の高い正確な3D点雲を生成し、挑戦的な環境における堅牢な認識のための有望なソリューションを提供することが示された。
関連論文リスト
- REOcc: Camera-Radar Fusion with Radar Feature Enrichment for 3D Occupancy Prediction [18.57887643050248]
REOccは3次元占有予測のためにレーダー特徴表現を豊かにするために設計されたカメラとレーダーの融合ネットワークである。
提案手法では, 空間情報と文脈情報を統合することにより, レーダ特徴を洗練させるレーダーデンシファイアとレーダ増幅器の2つの主成分を導入する。
論文 参考訳(メタデータ) (2025-11-10T03:23:52Z) - D$^2$GS: Depth-and-Density Guided Gaussian Splatting for Stable and Accurate Sparse-View Reconstruction [73.61056394880733]
3D Gaussian Splatting (3DGS)は、3D表現を明示したリアルタイムかつ高忠実なノベルビュー合成(NVS)を可能にする。
疎視条件下では,カメラ近傍のガウス密度が過大な地域での過度適合と,ガウス範囲が不十分な遠隔地での過度適合の2つの重要な障害モードを同定する。
本稿では,奥行き案内型ドロップアウト戦略と距離認識型フィデリティ拡張モジュールという,2つの主要なコンポーネントからなる統合フレームワークD$2$GSを提案する。
論文 参考訳(メタデータ) (2025-10-09T17:59:49Z) - Real-IAD D3: A Real-World 2D/Pseudo-3D/3D Dataset for Industrial Anomaly Detection [53.2590751089607]
Real-IAD D3は高精度なマルチモーダルデータセットであり、フォトメトリックステレオによって生成された擬似3Dモダリティが組み込まれている。
本稿では,RGB,点雲,擬似3次元深度情報を統合し,各モードの相補的強度を活用する効果的な手法を提案する。
本実験は,検出の堅牢性向上とIAD全体の性能向上におけるこれらのモダリティの重要性を強調した。
論文 参考訳(メタデータ) (2025-04-19T08:05:47Z) - RobuRCDet: Enhancing Robustness of Radar-Camera Fusion in Bird's Eye View for 3D Object Detection [68.99784784185019]
暗い照明や悪天候はカメラの性能を低下させる。
レーダーは騒音と位置のあいまいさに悩まされる。
本稿では,BEVの頑健な物体検出モデルであるRobuRCDetを提案する。
論文 参考訳(メタデータ) (2025-02-18T17:17:38Z) - UniBEVFusion: Unified Radar-Vision BEVFusion for 3D Object Detection [2.123197540438989]
多くのレーダービジョン融合モデルではレーダーを希薄なLiDARとして扱い、レーダー固有の情報を過小評価している。
本稿では,レーダー固有データを深度予測プロセスに統合したRDLモジュールを提案する。
また、異なるモードでBEV機能を抽出するUnified Feature Fusion (UFF)アプローチも導入する。
論文 参考訳(メタデータ) (2024-09-23T06:57:27Z) - RangeLDM: Fast Realistic LiDAR Point Cloud Generation [12.868053836790194]
本研究では,高品質なLiDAR点雲を高速に生成するための新しいアプローチであるRangeLDMを紹介する。
Hough 投票による点雲から範囲画像への正確な投影のために、レンジビューデータ分布を補正することで、これを実現する。
我々は、レンジ誘導型識別器を考案し、3次元構造的忠実性を維持するようモデルに指示する。
論文 参考訳(メタデータ) (2024-03-15T08:19:57Z) - Bi-LRFusion: Bi-Directional LiDAR-Radar Fusion for 3D Dynamic Object
Detection [78.59426158981108]
この課題に対処し、動的オブジェクトの3D検出を改善するために、双方向LiDAR-Radar融合フレームワーク、Bi-LRFusionを導入する。
我々はnuScenesとORRデータセットに関する広範な実験を行い、我々のBi-LRFusionが動的オブジェクトを検出するための最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-06-02T10:57:41Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Pointillism: Accurate 3D bounding box estimation with multi-radars [6.59119432945925]
我々は、複数の空間的に分離されたレーダーからのデータと、これらの問題を緩和するための最適な分離を結合するシステムであるPointillismを紹介する。
本稿では,レーダのスパースデータ分布を明示的に設計した新しいディープラーニングアーキテクチャRP-netの設計を行い,高精度な3次元境界ボックス推定を実現する。
論文 参考訳(メタデータ) (2022-03-08T23:09:58Z) - Reconfigurable Voxels: A New Representation for LiDAR-Based Point Clouds [76.52448276587707]
本稿では,3次元点群から表現を構成する新しい手法であるReconfigurable Voxelsを提案する。
具体的には,各地区を一定数のボクセルで適応的にカバーするランダムウォーク方式を考案する。
この手法は,特に疎水領域において,ボクセル特性の安定性を効果的に向上することがわかった。
論文 参考訳(メタデータ) (2020-04-06T15:07:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。