論文の概要: PAGS: Priority-Adaptive Gaussian Splatting for Dynamic Driving Scenes
- arxiv url: http://arxiv.org/abs/2510.12282v1
- Date: Tue, 14 Oct 2025 08:36:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.253506
- Title: PAGS: Priority-Adaptive Gaussian Splatting for Dynamic Driving Scenes
- Title(参考訳): PAGS:動的運転シーンのための優先適応型ガウススプレイティング
- Authors: Ying A, Wenzhang Sun, Chang Zeng, Chunfeng Wang, Hao Li, Jianxun Cui,
- Abstract要約: ダイナミックな3D都市シーンの再構築は、自動運転に不可欠である。
現在の手法は、忠実さと計算コストの間の大きなトレードオフに直面している。
本稿では,タスク認識型セマンティック・プライオリティを3次元再構成・レンダリングパイプラインに直接注入するフレームワークであるプライオリティ適応ガウス・スプレイティング(PAGS)を紹介する。
- 参考スコア(独自算出の注目度): 11.532584276783105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reconstructing dynamic 3D urban scenes is crucial for autonomous driving, yet current methods face a stark trade-off between fidelity and computational cost. This inefficiency stems from their semantically agnostic design, which allocates resources uniformly, treating static backgrounds and safety-critical objects with equal importance. To address this, we introduce Priority-Adaptive Gaussian Splatting (PAGS), a framework that injects task-aware semantic priorities directly into the 3D reconstruction and rendering pipeline. PAGS introduces two core contributions: (1) Semantically-Guided Pruning and Regularization strategy, which employs a hybrid importance metric to aggressively simplify non-critical scene elements while preserving fine-grained details on objects vital for navigation. (2) Priority-Driven Rendering pipeline, which employs a priority-based depth pre-pass to aggressively cull occluded primitives and accelerate the final shading computations. Extensive experiments on the Waymo and KITTI datasets demonstrate that PAGS achieves exceptional reconstruction quality, particularly on safety-critical objects, while significantly reducing training time and boosting rendering speeds to over 350 FPS.
- Abstract(参考訳): ダイナミックな3D都市シーンの再構築は自動運転に不可欠だが、現在の手法は忠実さと計算コストの間の大きなトレードオフに直面している。
この非効率性は、静的な背景と安全クリティカルなオブジェクトを同じ重要性で扱い、リソースを均一に割り当てるセマンティックな無知設計に起因している。
そこで我々は,タスク認識型セマンティック・プライオリティを3次元再構成・レンダリング・パイプラインに直接注入するフレームワークであるプライオリティ適応ガウス・スプレイティング(PAGS)を紹介した。
PAGSは2つの中核的なコントリビューションを紹介している: 1) セマンティックにガイドされたプルーニングと正規化戦略は、非クリティカルなシーン要素を積極的に単純化し、ナビゲーションに不可欠なオブジェクトのきめ細かい詳細を保存している。
2)プライオリティ駆動型レンダリングパイプラインは,プリミティブを積極的に取り除き,最終的なシェーディング計算を高速化するために,優先度に基づく深度事前パスを利用する。
WaymoとKITTIデータセットに関する大規模な実験は、PAGSが例外的な再構築品質、特に安全クリティカルなオブジェクトを達成し、トレーニング時間を大幅に短縮し、レンダリング速度を350FPS以上に向上することを示した。
関連論文リスト
- RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.15416002879239]
3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。
既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。
2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文 参考訳(メタデータ) (2025-06-03T11:13:48Z) - OG-Gaussian: Occupancy Based Street Gaussians for Autonomous Driving [12.47557991785691]
我々は,LiDAR点雲をサラウンドビューカメラ画像から生成されたOG(Occupancy Grids)に置き換える新しいアプローチであるOG-Gaussianを提案する。
提案手法は,OGのセマンティック情報を利用して静的道路背景から動的車両を分離し,これらのグリッドを2つの初期点雲に変換し,静的物体と動的物体の両方を再構成する。
Openデータセットの実験では、OG-Gaussianは復元品質とレンダリング速度の点で現在の最先端と同等であり、平均PSNRは35.13、レンダリング速度は143 FPSであることが示された。
論文 参考訳(メタデータ) (2025-02-20T04:00:47Z) - ALOcc: Adaptive Lifting-Based 3D Semantic Occupancy and Cost Volume-Based Flow Predictions [91.55655961014027]
シーン理解には3次元セマンティック占有とフロー予測が不可欠である。
本稿では,3つの改善点を目標とした視覚ベースのフレームワークを提案する。
我々の純粋な畳み込みアーキテクチャは、セマンティック占有率とジョイントセマンティックフロー予測の両方のために、複数のベンチマーク上で新しいSOTA性能を確立する。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - PPEA-Depth: Progressive Parameter-Efficient Adaptation for
Self-Supervised Monocular Depth Estimation [24.68378829544394]
本稿では,自己教師付き深度推定のための事前学習画像モデルを転送するプログレッシブ適応手法であるPPEA-Depthを提案する。
トレーニングは2つのシーケンシャルステージで構成されている: データセット上でトレーニングされた初期フェーズは、主に静的シーンで構成され、より複雑なデータセットへの拡張によって後継される。
実験によると、PPEA-DepthはKITTI、CityScapes、DDADデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-12-20T14:45:57Z) - SEPT: Towards Efficient Scene Representation Learning for Motion
Prediction [19.111948522155004]
本稿では,自己教師付き学習を活用し,複雑な交通シーンのための強力なモデルを開発するためのモデリングフレームワークSEPTを提案する。
実験により、SEPTはアーキテクチャ設計や機能エンジニアリングを伴わず、Argoverse 1 と Argoverse 2 のモーション予測ベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-09-26T21:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。