論文の概要: DrivingVoxels: Compositional Sparse Voxel Rasterization for Dynamic Driving Scene Reconstruction
- arxiv url: http://arxiv.org/abs/2606.23031v1
- Date: Mon, 22 Jun 2026 08:42:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:37:17.263884
- Title: DrivingVoxels: Compositional Sparse Voxel Rasterization for Dynamic Driving Scene Reconstruction
- Title(参考訳): ドライビングボクセル:ダイナミックドライビングシーン再構築のための組成スパースボクセルラスタライゼーション
- Authors: Tania Aguirre, Luis Roldão, Moussab Bennehar, Nathan Piasco, Dzmitry Tsishkou, Simone Rossi, Pietro Michiardi,
- Abstract要約: 動的駆動シーンのための合成スパースボクセルレンダリングフレームワークであるドライビングボクセルについて述べる。
本手法は,複数の独立したオクツリーからのスパースボクセルを1つのレンダリングパスで結合する。
我々はPandaSetベンチマークのフレームワークを評価し、DrivingVoxelsが知覚的メトリクスとNVSと再構築のための構造的メトリクスで同等に動作することを示した。
- 参考スコア(独自算出の注目度): 14.8989510421373
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing dynamic urban scenes remains challenging due to the unbounded nature of driving environments and the presence of multiple dynamic objects. Currently, potentially faster sparse voxel methods are mainly designed for static scenarios. On the other hand, dynamic approaches based on 3D Gaussian Splatting, despite their high-fidelity, are often time-consuming for driving scenarios and exhibit uncontrollable memory growth in large scenes. To address these limitations, we present DrivingVoxels, a compositional sparse voxel rendering framework for dynamic driving scenes. Our method jointly rasterizes sparse voxels from multiple independent octrees within a single rendering pass. Each rigid dynamic object is represented by an octree defined in its local coordinate frame, while a separate static octree models the stationary background. DrivingVoxels adopts a fully explicit, neural-free representation together with a LiDAR-guided structural initialization that efficiently captures scene geometry. We evaluate our framework on the PandaSet benchmark, demonstrating that DrivingVoxels performs on par on perceptual metrics and better on structural metrics for NVS and reconstruction while requiring shorter training times than previous 3DGS-base methods to an efficient optimization workflow anchored by a strong LiDAR prior.
- Abstract(参考訳): 動的都市景観の再構築は、運転環境の非有界性や複数の動的物体の存在により、依然として困難である。
現在、潜在的に高速なスパースボクセルメソッドは、主に静的シナリオ用に設計されている。
一方,高忠実度にもかかわらず3次元ガウススプラッティングに基づく動的アプローチは,駆動シナリオに時間を要することが多く,大きなシーンでは制御不能なメモリ成長を示す。
これらの制約に対処するために,動的駆動シーンのための合成スパースボクセルレンダリングフレームワークであるDrivingVoxelsを提案する。
本手法は,複数の独立したオクツリーから1つのレンダリングパス内でスパースボクセルを共同でラスタライズする。
各剛体動的オブジェクトは、その局所座標フレームで定義されたオクツリーで表現され、一方、別の静的オクツリーは静止背景をモデル化する。
DrivingVoxelsは、LiDARで誘導された構造的初期化とともに、完全に明示的で、無神経な表現を採用し、シーンの幾何学を効率的に捉えている。
我々はPandaSetベンチマークのフレームワークを評価し,強力なLiDARに固定された効率的な最適化ワークフローに,従来の3DGSベースの手法よりも短いトレーニング時間を要しながら,DrivingVoxelsが知覚的メトリクスとNVSと再構築のための構造的メトリクスを同等に処理できることを実証した。
関連論文リスト
- PointForward: Feedforward Driving Reconstruction through Point-Aligned Representations [39.816194543559526]
本稿では,ポイントアライン表現によるフィードフォワード駆動型再構築フレームワークであるPointForwardを提案する。
画素アライメント法とは異なり、時空間融合により多視点画像情報を集約する。
本手法は,インスタンスレベルの動き伝搬と時間的に一貫した動的表現を可能にする。
論文 参考訳(メタデータ) (2026-05-12T06:20:59Z) - DGGT: Feedforward 4D Reconstruction of Dynamic Driving Scenes using Unposed Images [36.562825380568384]
ポーズレス動的シーン再構築のための統合フレームワークである textbf driving Gaussian Grounded Transformer (DGGT) を紹介する。
提案手法は,フレームごとの3次元ガウスマップとカメラパラメータを共同で予測し,軽量なダイナミックヘッドでダイナミックスを歪曲する。
拡散ベースのレンダリング改善により、運動・補間アーティファクトがさらに減少し、スパース入力下での新規ビュー品質が向上する。
論文 参考訳(メタデータ) (2025-12-02T18:29:18Z) - IDSplat: Instance-Decomposed 3D Gaussian Splatting for Driving Scenes [25.939318593012484]
動的駆動シーンの再構築は、センサ・リアリスティック・シミュレーションによる自律システム開発に不可欠である。
我々は,動的シーンを明示的なインスタンス分解と学習可能なモーショントラジェクトリで再構成する,自己教師型3次元ガウススティングフレームワークIDSplatを提案する。
本手法は, インスタンスレベルの分解を維持しつつ, 競合する再構成品質を実現し, 再トレーニングを伴わずに, 多様なシーケンスやビュー密度を一般化する。
論文 参考訳(メタデータ) (2025-11-24T15:48:08Z) - DriveSplat: Decoupled Driving Scene Reconstruction with Geometry-enhanced Partitioned Neural Gaussians [16.363638581354305]
運転シナリオの領域では、高速走行車、歩行者の移動、大規模静的背景の存在が、3Dシーンの再構築に重大な課題となっている。
3次元ガウス散乱に基づく最近の手法は、シーン内の動的成分と静的成分を分離することで、動きのぼかし問題に対処する。
本稿では,動的静的デカップリングを用いたニューラルガウス表現に基づくシナリオ駆動のための高品質な再構成手法であるDriveSplatを紹介する。
論文 参考訳(メタデータ) (2025-08-21T09:14:50Z) - Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving [116.10577967146762]
マルチビュー画像シーケンスからフレーム単位のポイントマップを直接回帰するフレームワークであるDriv3Rを提案する。
我々は4次元フロー予測器を用いてシーン内の移動物体を識別し、これらの動的領域の再構築をより重視する。
Driv3Rは4D動的シーン再構築において従来のフレームワークより優れており、推論速度は15倍高速である。
論文 参考訳(メタデータ) (2024-12-09T18:58:03Z) - MonST3R: A Simple Approach for Estimating Geometry in the Presence of Motion [118.74385965694694]
我々は動的シーンから時間ステップごとの幾何を直接推定する新しい幾何学的アプローチであるMotion DUSt3R(MonST3R)を提案する。
各タイムステップのポイントマップを単純に推定することで、静的シーンにのみ使用されるDUST3Rの表現を動的シーンに効果的に適応させることができる。
我々は、問題を微調整タスクとしてポーズし、いくつかの適切なデータセットを特定し、この制限されたデータ上でモデルを戦略的に訓練することで、驚くほどモデルを動的に扱えることを示す。
論文 参考訳(メタデータ) (2024-10-04T18:00:07Z) - DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes [57.12439406121721]
我々は動的自律走行シーンを囲む効率的かつ効果的なフレームワークであるDrivingGaussianを提案する。
動くオブジェクトを持つ複雑なシーンでは、まずシーン全体の静的な背景を逐次、段階的にモデル化します。
次に、複合動的ガウスグラフを利用して、複数の移動物体を処理する。
我々はさらに、ガウススプラッティングに先立ってLiDARを使用して、より詳細でシーンを再構築し、パノラマ一貫性を維持する。
論文 参考訳(メタデータ) (2023-12-13T06:30:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。