論文の概要: Towards Physically Consistent 4D Scene Reconstruction for Closed-loop Autonomous Driving Simulation
- arxiv url: http://arxiv.org/abs/2605.21032v1
- Date: Wed, 20 May 2026 11:09:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.637292
- Title: Towards Physically Consistent 4D Scene Reconstruction for Closed-loop Autonomous Driving Simulation
- Title(参考訳): 閉ループ自律運転シミュレーションのための物理的に一貫性のある4次元シーン再構成に向けて
- Authors: Bowyn Tan, Yutong Xie, Bai Huang, Fan Luo, Xiao Li, Naizheng Wang, Yang Guan, Shengbo Eben Li,
- Abstract要約: 高忠実なストリートシーンの再構築は、エンドツーエンドの自動運転シミュレーションにおいて重要である。
既存の3DGSメソッドとその4D拡張は、両方を同時に達成できない。
空間的識別性を回復するための直交射影勾配(OPG)を提案する。
- 参考スコア(独自算出の注目度): 19.055975606481635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-fidelity street scene reconstruction is pivotal for end-to-end autonomous driving simulation, where novel-view synthesis (NVS) and time-varying information modeling are two fundamental capabilities to facilitate closed-loop training. However, existing 3DGS methods and their 4D extensions fail to simultaneously achieve both. To bridge this gap, we establish an information-geometric diagnostic framework, revealing that this limitation stems from a credit assignment dilemma between spatial and temporal parameters. Specifically, the deterministic coupling between viewpoint and time in single-source observation creates a low-rank structure that induces massive null-space ambiguity between static view-dependent and dynamic time-varying components. Temporal information overshadows spatial cues, causing the estimation variance of spatial parameters to diverge. To address this issue, we propose Orthogonal Projected Gradient (OPG), a hierarchical training method designed to restore spatial identifiability. OPG prioritizes the integrity of spatial representations by securing them in an initial stage, then restricts temporal updates to the spatial null space, enabling proactive credit assignment. While OPG isolates temporal updates algebraically, Temporal Regularization Strategy is proposed to further refine the temporal solution space by imposing a smoothness constraint based on the physical prior of consistent appearance evolution, ensuring that the reconstructed scene remains physically consistent in closed-loop simulation. Extensive experiments demonstrate that our method not only maintains stable NVS capabilities but also demonstrates superior performance in traditional observation-reproducing metrics, which indirectly reflect the capability of modeling temporal dynamics.
- Abstract(参考訳): 高忠実度ストリートシーンの再構築は、NVS(Newn-view synthesis)と時間変化情報モデリング(Time-variant information modeling)がクローズドループトレーニングを促進する2つの基本的な機能である、エンドツーエンドの自動運転シミュレーションにおいて重要である。
しかし、既存の3DGSメソッドとその4D拡張は、同時に両方を達成することができない。
このギャップを埋めるため,情報幾何学的診断フレームワークを構築し,空間的パラメータと時間的パラメータ間の信用割当ジレンマに起因することを明らかにした。
具体的には、単一ソース観測における視点と時間間の決定論的結合は、静的なビュー依存と動的時間変化のコンポーネント間の大きなヌル空間のあいまいさを誘導する低ランク構造を生成する。
時間情報は空間的手がかりを覆い、空間的パラメータの推定のばらつきを引き起こす。
この問題に対処するために,空間的識別可能性の回復を目的とした階層的学習手法である直交射影勾配(OPG)を提案する。
OPGは初期状態で確保することで空間表現の整合性を優先し、空間ヌル空間への時間的更新を制限し、アクティブなクレジット割り当てを可能にする。
OPGは時間的更新を代数的に分離するが、時間的正則化戦略は、一貫した外観進化の物理的先行に基づく滑らか性制約を課し、クローズドループシミュレーションにおいて再構成されたシーンが物理的に一貫した状態であることを保証することによって、時間的解空間をさらに洗練することを提案する。
大規模な実験により,本手法は安定なNVS能力を維持できるだけでなく,時間的ダイナミクスのモデル化能力を間接的に反映した従来の観測再生指標でも優れた性能を示すことが示された。
関連論文リスト
- Local Spatiotemporal Convolutional Network for Robust Gait Recognition [7.0676119183443395]
歩行認識は、個人を独自の歩行パターンで識別する有望な生体計測技術である。
既存のアプローチは、個々のシルエットフレームから抽出された静的な外観特徴、複雑なシーケンシャルモデルのいずれかに依存している。
本稿では,従来の2次元畳み込みネットワークに時間的情報を抽出する能力を持たせた,構造的にシンプルで高効率なデュアルブランチアーキテクチャLSTCNを提案する。
論文 参考訳(メタデータ) (2026-05-14T08:28:49Z) - SSR: A Training-Free Approach for Streaming 3D Reconstruction [53.19807901585702]
自己表現型シーケンス規則化(Self Expressive Sequence Regularization、SSR)は、推論中にグラスマン列の正則性を強制するプラグアンドプレイ演算子である。
本研究では,SSRが連続的にドリフトを低減し,複数のストリーミング3D再構成タスクにおける再構成品質を向上させることを示す。
論文 参考訳(メタデータ) (2026-03-16T02:55:14Z) - Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting [79.37674445572462]
時系列予測(TSF)は、周期内変動と周期間トレンドの複雑な絡み合いのため、依然として困難な問題である。
形状変化テンソルを静止画像として扱うと、トポロジカルミスマッチが発生する。
均一な固定サイズの表現に依存することは、モデリング能力を非効率に割り当てる。
TimeGSは、予測パラダイムをレグレッションから2D生成レンダリングに根本的にシフトする、新しいフレームワークである。
論文 参考訳(メタデータ) (2026-02-10T14:13:36Z) - Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics [51.85385061275941]
分子動力学(MD)シミュレーションは、タンパク質動力学研究のゴールドスタンダードのままである。
近年の生成モデルではシミュレーションの加速が期待できるが、長軸生成に苦慮している。
物理的に可塑性なタンパク質軌道をマイクロスケールの時間スケールで生成する拡張拡散モデルSTAR-MDを提案する。
論文 参考訳(メタデータ) (2026-02-02T14:13:28Z) - Learning Multi-Modal Mobility Dynamics for Generalized Next Location Recommendation [51.00494428978262]
位置推薦タスクの移動力学を特徴付けるために,マルチモーダルな時空間知識を利用する。
まず、マルチモーダル表現のための統合時空間関係グラフ(STRG)を構築する。
第二に、異なるモーダルの空間時間グラフ表現を融合するゲーティング機構を設計する。
論文 参考訳(メタデータ) (2025-12-27T14:23:04Z) - ST-GS: Vision-Based 3D Semantic Occupancy Prediction with Spatial-Temporal Gaussian Splatting [21.87807066521776]
3次元占有予測は、視覚中心の自律運転における総合的なシーン理解に不可欠である。
近年, 計算オーバーヘッドを低減しつつ, 3次元意味ガウスモデルを用いて占有率をモデル化する研究が進められている。
本稿では,時空間モデリングと時空間モデリングの両立を図るため,新しい時空間ガウススティング(ST-GS)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-20T06:36:30Z) - Cross Space and Time: A Spatio-Temporal Unitized Model for Traffic Flow Forecasting [16.782154479264126]
時間的要因間の複雑な相互作用により、バックボーン・時間的トラフィックフローを予測することが課題となる。
既存のアプローチでは、これらの次元を分離し、重要な相互依存を無視している。
本稿では,空間的および時間的依存関係の両方をキャプチャする統合フレームワークであるSanonymous-Temporal Unitized Unitized Cell (ASTUC)を紹介する。
論文 参考訳(メタデータ) (2024-11-14T07:34:31Z) - Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition [7.682613953680041]
本稿では,空間時間モデルと冗長性の問題に終末的に対処する手術用トランスフォーマー(サージフォーマー)を提案する。
提案するサージフォーマーは,最先端の手法に対して良好に機能することを示す。
論文 参考訳(メタデータ) (2024-08-07T16:16:31Z) - Triplet Attention Transformer for Spatiotemporal Predictive Learning [9.059462850026216]
本稿では,フレーム間動的特徴とフレーム内静的特徴の両方を捉えるために,革新的な三重項注意変換器を提案する。
このモデルはトリプレット・アテンション・モジュール(TAM)を組み込んだもので、時間、空間、チャネル次元における自己アテンションのメカニズムを探求することで、従来のリカレント・ユニットを置き換える。
論文 参考訳(メタデータ) (2023-10-28T12:49:33Z) - Supporting Optimal Phase Space Reconstructions Using Neural Network
Architecture for Time Series Modeling [68.8204255655161]
位相空間特性を暗黙的に学習する機構を持つ人工ニューラルネットワークを提案する。
私たちのアプローチは、ほとんどの最先端戦略と同じくらいの競争力があるか、あるいは優れているかのどちらかです。
論文 参考訳(メタデータ) (2020-06-19T21:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。