論文の概要: One World, Dual Timeline: Decoupled Spatio-Temporal Gaussian Scene Graph for 4D Cooperative Driving Reconstruction
- arxiv url: http://arxiv.org/abs/2605.07910v1
- Date: Fri, 08 May 2026 15:48:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.176563
- Title: One World, Dual Timeline: Decoupled Spatio-Temporal Gaussian Scene Graph for 4D Cooperative Driving Reconstruction
- Title(参考訳): 4次元協調運転再建のための時空間ガウスシーングラフを分離した2次元タイムライン
- Authors: Yulong Chen, Xiaoyun Dong, Haoyu Zhang, Zongxian Yang, Lewei Xie, Xinke Li, Yifan Zhang, Kai Wang, Jianping Wang,
- Abstract要約: 4次元協調運転再建のためのDust (Deco Upled Spatio-Temporal) Gaussian Scene Graphを提案する。
DUSTは最先端の性能を達成し、最強ベースラインよりも3.2dBのダイナミック領域PSNRを改善する。
DUSTはまた、フレシェビデオ距離を37.7%減らし、時間同期を大きく抑えている。
- 参考スコア(独自算出の注目度): 24.030187603322076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing dynamic scenes from Vehicle-to-Infrastructure Cooperative Autonomous Driving (VICAD) data is fundamentally complicated by temporal asynchrony: vehicle and infrastructure cameras operate on independent clocks, capturing the same dynamic agent such as cars and pedestrians at different physical times. Existing Gaussian Scene Graph methods implicitly assume synchronized observations and assign a single pose per agent per frame, which is an assumption that breaks in cooperative settings, where the resulting gradient conflicts cause severe ghosting on dynamic agents. We identify this as a representation-level failure, not an optimization artifact: we prove that any single-timeline formulation incurs an irreducible photometric loss scaling quadratically with agent velocity and cross-source time offset. To resolve this, we propose Dust (DecoUpled Spatio-Temporal) Gaussian Scene Graph for 4D Cooperative Driving Reconstruction. DUST Gaussian Scene Graph shares a canonical Gaussian set per agent for appearance consistency, while maintaining decouple pose trajectories aligned to each source's true capture timestamps. We prove that this decoupling enables the pose-gradient kernel block-diagonal, eliminating cross-source interference entirely. To make Dust practical, we further introduce a static anchor-based pose correction pipeline that corrects spatio misalignment between vehicle and infrastructure annotations, and a pose-regularized joint optimization scheme that prevents trajectory jitter and drift during early training. On 26 sequences from V2X-Seq, DUST achieves state-of-the-art performance, improving dynamic-area PSNR by 3.2 dB over the strongest baseline and reducing Fréchet Video Distance by 37.7%, with keeping robustness under larger temporal asynchrony. Code is available at https://anonymous.4open.science/r/DUST-6A55.
- Abstract(参考訳): 車両とインフラカメラは独立した時計で動作し、車や歩行者などと同じ動的エージェントを物理的に捉えている。
既存のガウスのシーングラフ法では、同期された観察を暗黙的に仮定し、フレームごとに1つのポーズを割り当てている。
単一時間線の定式化は、エージェント速度とクロスソースタイムオフセットとを2次的に比較して、既約光度損失のスケーリングを引き起こすことを証明します。
そこで我々は,Dust (Deco Upled Spatio-Temporal) Gaussian Scene Graph for 4D Cooperative Driving Reconstructionを提案する。
DUST Gaussian Scene Graphは、各ソースの真のキャプチャタイムスタンプに整合した2重ポーズトラジェクトリを維持しながら、外観整合性のためのエージェント毎の標準ガウスセットを共有する。
この分離により、ポーズ段階のカーネルブロック対角線が実現し、ソース間の干渉を完全に排除できることを示す。
Dustを実用化するために、車両とインフラのアノテーション間の空間的不一致を補正する静的アンカーベースのポーズ補正パイプラインや、軌道ジッタやドリフトを早期訓練中に防止するポーズ規則化された共同最適化スキームも導入する。
V2X-Seqの26のシーケンスにおいて、DUSTは最先端の性能を達成し、最強のベースライン上で3.2dBのダイナミック領域PSNRを改善し、フレシェ・ビデオ距離を37.7%削減し、時間的同期の下で堅牢性を維持する。
コードはhttps://anonymous.4open.science/r/DUST-6A55で公開されている。
関連論文リスト
- ReconDrive: Fast Feed-Forward 4D Gaussian Splatting for Autonomous Driving Scene Reconstruction [32.767300244488645]
ReconDriveはフィードフォワードフレームワークで、3DファウンデーションモデルであるVGGTを利用して高速で高忠実な4DGSを生成する。
nuScenesをベンチマークし、ReconDriveは既存のフィードフォワードベースライン、新しいビュー合成、そして3D知覚を著しく上回っている。
論文 参考訳(メタデータ) (2026-03-08T09:31:15Z) - SparseCoop: Cooperative Perception with Kinematic-Grounded Queries [24.54324085409114]
SparseCoopは3次元検出と追跡のための完全にスパースな協調認識フレームワークである。
2X-SeqとGriffinのデータセットの実験は、SparseCoopが最先端のパフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2025-12-07T13:22:06Z) - DGGT: Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images [36.562825380568384]
ポーズレス動的シーン再構築のための統合フレームワークである textbf driving Gaussian Grounded Transformer (DGGT) を紹介する。
提案手法は,フレームごとの3次元ガウスマップとカメラパラメータを共同で予測し,軽量なダイナミックヘッドでダイナミックスを歪曲する。
拡散ベースのレンダリング改善により、運動・補間アーティファクトがさらに減少し、スパース入力下での新規ビュー品質が向上する。
論文 参考訳(メタデータ) (2025-12-02T18:29:18Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。
複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文 参考訳(メタデータ) (2024-11-18T05:49:16Z) - DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes [57.12439406121721]
我々は動的自律走行シーンを囲む効率的かつ効果的なフレームワークであるDrivingGaussianを提案する。
動くオブジェクトを持つ複雑なシーンでは、まずシーン全体の静的な背景を逐次、段階的にモデル化します。
次に、複合動的ガウスグラフを利用して、複数の移動物体を処理する。
我々はさらに、ガウススプラッティングに先立ってLiDARを使用して、より詳細でシーンを再構築し、パノラマ一貫性を維持する。
論文 参考訳(メタデータ) (2023-12-13T06:30:51Z) - Temporal-Viewpoint Transportation Plan for Skeletal Few-shot Action
Recognition [38.27785891922479]
Joint tEmporalとcAmera viewpoiNt alIgnmEntによる3Dスケルトンに基づく動作認識のためのFew-shot Learning Pipeline
論文 参考訳(メタデータ) (2022-10-30T11:46:38Z) - Spatiotemporal Bundle Adjustment for Dynamic 3D Human Reconstruction in
the Wild [49.672487902268706]
本稿では,カメラの時間的アライメントと3次元点三角測量を共同で推定する枠組みを提案する。
複数の無同期・無同期ビデオカメラで捉えたイベントにおいて、人間の身体の3次元運動軌跡を再構成する。
論文 参考訳(メタデータ) (2020-07-24T23:50:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。