論文の概要: Not All Points Are Equal: Uncertainty-Aware 4D LiDAR Scene Synthesis
- arxiv url: http://arxiv.org/abs/2606.02510v1
- Date: Mon, 01 Jun 2026 17:24:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.533185
- Title: Not All Points Are Equal: Uncertainty-Aware 4D LiDAR Scene Synthesis
- Title(参考訳): すべての点が等しくない:不確かさを意識した4D LiDARシーン合成
- Authors: Xiang Xu, Alan Liang, Youquan Liu, Xian Sun, Linfeng Li, Lingdong Kong, Ziwei Liu, Qingshan Liu,
- Abstract要約: 我々は,空間不確実性を明確に活用し,LiDARシーン生成をガイドする新しいフレームワークであるU4Dを提案する。
nuScenesとSemantic KITTIの実験は、最先端のシーンの忠実さ、時間的一貫性、下流のパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 63.07333625429548
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Constructing faithful 4D worlds from LiDAR-acquired sequences is crucial for embodied AI, yet current generative frameworks apply uniform modeling capacity across all spatial regions. This ignores that perceptual difficulty varies dramatically within a single scan: distant surfaces, occluded boundaries, and small-scale objects carry far higher uncertainty than well-observed structures. We present U4D, a new framework that explicitly leverages spatial uncertainty to guide LiDAR scene generation in a "hard-to-easy" schedule. U4D derives per-point uncertainty maps via Shannon Entropy from a pretrained segmentor, then applies an unconditional diffusion stage to synthesize high-entropy areas with precise geometry, followed by a conditional completion stage that fills in the remaining regions using these structures as priors. A MoST (Mixture of Spatio-Temporal) block further maintains cross-frame coherence by dynamically balancing spatial detail and temporal continuity. Extensive experiments on nuScenes and SemanticKITTI demonstrate state-of-the-art scene fidelity, temporal consistency, and downstream performance.
- Abstract(参考訳): LiDARが取得したシーケンスから忠実な4D世界を構築することは、AIを具体化する上で重要であるが、現在の生成フレームワークは、すべての空間領域にわたって一様モデリング能力を適用している。
これは、単一のスキャンで知覚上の困難が劇的に変化することを無視する:遠くの表面、隠された境界、そして小さな物体は、よく観察された構造よりもはるかに高い不確実性をもたらす。
我々は,空間的不確実性を明示的に活用した新しいフレームワークであるU4Dを紹介し,LDARシーン生成を「使い勝手の良い」スケジュールでガイドする。
U4Dは、事前訓練されたセグメンタからシャノンエントロピーを経由した点当たりの不確実性写像を導出し、その後、高精度な幾何学で高エントロピー領域を合成するために無条件拡散段階を適用し、その後、これらの構造を先行として残りの領域を埋める条件付き完備段階を導出する。
MoST(Mixture of Spatio-Temporal)ブロックは、空間的詳細と時間的連続性を動的にバランスさせることにより、クロスフレームコヒーレンスをさらに維持する。
nuScenesとSemanticKITTIの大規模な実験は、最先端のシーンの忠実さ、時間的一貫性、下流のパフォーマンスを示している。
関連論文リスト
- Towards Physically Consistent 4D Scene Reconstruction for Closed-loop Autonomous Driving Simulation [19.055975606481635]
高忠実なストリートシーンの再構築は、エンドツーエンドの自動運転シミュレーションにおいて重要である。
既存の3DGSメソッドとその4D拡張は、両方を同時に達成できない。
空間的識別性を回復するための直交射影勾配(OPG)を提案する。
論文 参考訳(メタデータ) (2026-05-20T11:09:53Z) - Ground4D: Spatially-Grounded Feedforward 4D Reconstruction for Unstructured Off-Road Scenes [15.758026389335669]
Ground4Dは、ポーズなしオフロード再構成のための空間的に接地された4Dフィードフォワードフレームワークである。
ORAD-3DとRELLIS-3Dの実験では、グラウンド4Dは復元品質において既存のフィードフォワード法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2026-05-06T02:58:47Z) - PhaseFlow4D: Physically Constrained 4D Beam Reconstruction via Feedback-Guided Latent Diffusion [78.29352305480285]
フェーズFlow4Dは、不完全な2D観測だけで完全な4D位相空間を再構築し、追跡する。
希土類同位体ビーム施設における重イオンビームの多粒子シミュレーションについて検証した。
論文 参考訳(メタデータ) (2026-04-04T22:37:01Z) - SNOW: Spatio-Temporal Scene Understanding with World Knowledge for Open-World Embodied Reasoning [11.93789125154006]
本稿では,VLMから派生したセマンティクスと点雲の幾何と時間的整合性を統合した4次元シーン理解フレームワークを提案する。
SNOWプロセスは、HDBSCANクラスタリングを使用して、同期された3Dポイントクラウドを同期し、セグメンテーション提案を生成する。
多様なベンチマークの実験により、SNOWは正確な4Dシーンの理解と空間的接地推論を可能にした。
論文 参考訳(メタデータ) (2025-12-18T12:27:06Z) - U4D: Uncertainty-Aware 4D World Modeling from LiDAR Sequences [54.77163447282599]
既存の生成フレームワークは、すべての空間領域を均一に扱い、現実世界のシーンで様々な不確実性を見渡せる。
4次元LiDAR世界モデリングのための不確実性認識フレームワークであるU4Dを提案する。
提案手法はまず,事前訓練されたセグメンテーションモデルから空間不確実性マップを推定し,意味論的に困難な領域を局所化する。
次に,(1)高エントロピー領域を微細な幾何学的忠実度で再構成する不確実領域モデリング,(2)学習された構造的先行条件の下で残りの領域を合成する不確実条件完備化という2つの段階を通じて,「ハード・トゥ・イージー」な方法で生成を行う。
論文 参考訳(メタデータ) (2025-12-02T17:59:57Z) - DiST-4D: Disentangled Spatiotemporal Diffusion with Metric Depth for 4D Driving Scene Generation [50.01520547454224]
現在の生成モデルは、時空間外挿と空間新規ビュー合成(NVS)を同時にサポートする4次元駆動シーンの合成に苦慮している
本研究では,2つの拡散過程に分散するDiST-4Dを提案する。DST-Tは過去の観測結果から直接,将来の距離深度と多視点RGBシーケンスを予測し,DST-Sは,既存の視点でのみ空間的NVSを訓練し,サイクル整合性を実現する。
実験により、DiST-4Dは時間的予測とNVSタスクの両方において最先端のパフォーマンスを達成し、同時に計画関連評価において競合性能を提供することが示された。
論文 参考訳(メタデータ) (2025-03-19T13:49:48Z) - Motion2VecSets: 4D Latent Vector Set Diffusion for Non-rigid Shape Reconstruction and Tracking [52.393359791978035]
Motion2VecSetsは点雲列からの動的表面再構成のための4次元拡散モデルである。
グローバルな潜在符号の代わりに、潜在集合で4Dダイナミクスをパラメータ化する。
時間的コヒーレントな物体追跡のために、変形潜在集合を同期的に認知し、複数のフレーム間で情報を交換する。
論文 参考訳(メタデータ) (2024-01-12T15:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。