論文の概要: SceneDiffuser: Efficient and Controllable Driving Simulation Initialization and Rollout
- arxiv url: http://arxiv.org/abs/2412.12129v1
- Date: Thu, 05 Dec 2024 18:06:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-22 08:06:07.368437
- Title: SceneDiffuser: Efficient and Controllable Driving Simulation Initialization and Rollout
- Title(参考訳): SceneDiffuser: 効率的かつ制御可能な運転シミュレーションの初期化とロールアウト
- Authors: Chiyu Max Jiang, Yijing Bai, Andre Cornman, Christopher Davis, Xiukun Huang, Hong Jeon, Sakshum Kulshrestha, John Lambert, Shuangyu Li, Xuanyu Zhou, Carlos Fuertes, Chang Yuan, Mingxing Tan, Yin Zhou, Dragomir Anguelov,
- Abstract要約: 現実的でインタラクティブなシーンシミュレーションは、自動運転車(AV)開発の鍵となる前提条件である。
本稿では,交通シミュレーションに先立って設計されたシーンレベルの拡散であるSceneDiffuserを紹介する。
新たな拡散復調パラダイムは、将来のシミュレーションステップに対して復調する計算コストを補正する。
- 参考スコア(独自算出の注目度): 30.098214039454927
- License:
- Abstract: Realistic and interactive scene simulation is a key prerequisite for autonomous vehicle (AV) development. In this work, we present SceneDiffuser, a scene-level diffusion prior designed for traffic simulation. It offers a unified framework that addresses two key stages of simulation: scene initialization, which involves generating initial traffic layouts, and scene rollout, which encompasses the closed-loop simulation of agent behaviors. While diffusion models have been proven effective in learning realistic and multimodal agent distributions, several challenges remain, including controllability, maintaining realism in closed-loop simulations, and ensuring inference efficiency. To address these issues, we introduce amortized diffusion for simulation. This novel diffusion denoising paradigm amortizes the computational cost of denoising over future simulation steps, significantly reducing the cost per rollout step (16x less inference steps) while also mitigating closed-loop errors. We further enhance controllability through the introduction of generalized hard constraints, a simple yet effective inference-time constraint mechanism, as well as language-based constrained scene generation via few-shot prompting of a large language model (LLM). Our investigations into model scaling reveal that increased computational resources significantly improve overall simulation realism. We demonstrate the effectiveness of our approach on the Waymo Open Sim Agents Challenge, achieving top open-loop performance and the best closed-loop performance among diffusion models.
- Abstract(参考訳): 現実的でインタラクティブなシーンシミュレーションは、自動運転車(AV)開発の鍵となる前提条件である。
本稿では,交通シミュレーションに先立って設計されたシーンレベルの拡散であるSceneDiffuserを紹介する。
このフレームワークは、初期トラフィックレイアウトを生成するシーン初期化と、エージェントの動作をクローズループでシミュレーションするシーンロールアウトという、2つの主要なシミュレーションステージに対処する統合されたフレームワークを提供する。
拡散モデルは現実的およびマルチモーダルなエージェント分布の学習に有効であることが証明されているが、制御可能性、閉ループシミュレーションにおけるリアリズムの維持、推論効率の確保など、いくつかの課題が残っている。
これらの問題に対処するために、シミュレーションのための償却拡散を導入する。
この新しい拡散デノイングパラダイムは、将来のシミュレーションステップをデノイングする計算コストを減らし、ロールアウトステップあたりのコスト(推論ステップの16倍)を大幅に削減し、クローズドループエラーを緩和する。
我々は、一般化されたハード制約、単純で効果的な推論時間制約機構、および大規模言語モデル(LLM)の少数ショットプロンプトによる言語ベースの制約付きシーン生成の導入により、制御性をさらに強化する。
モデルスケーリングに関する調査により,計算資源の増大がシミュレーションリアリズムを著しく改善することが明らかとなった。
Waymo Open Sim Agents Challengeにおいて,提案手法の有効性を実証し,最大オープンループ性能と最大クローズループ性能を実現する。
関連論文リスト
- Rolling Ahead Diffusion for Traffic Scene Simulation [13.900806577888861]
現実的な運転シミュレーションでは、NPCは自然運転の振る舞いを模倣するだけでなく、他の模擬エージェントの挙動に反応する。
拡散に基づくシナリオ生成の最近の発展は、多様で現実的なトラフィックシナリオの作成に焦点を当てている。
両手法の利点を混合した転がり拡散に基づく交通シーン生成モデルを提案する。
論文 参考訳(メタデータ) (2025-02-13T18:45:56Z) - Causal Composition Diffusion Model for Closed-loop Traffic Generation [31.52951126032351]
本稿では,これらの課題に対処するための構造誘導拡散フレームワークであるCausal Compositional Diffusion Model (CCDiff)を紹介する。
まず、制約付き最適化問題として、制御可能で現実的な閉ループシミュレーションの学習を定式化する。
そして、CCDiffは拡散過程に直接因果構造を自動同定し注入することにより、現実主義に固執しながら制御性を最大化する。
論文 参考訳(メタデータ) (2024-12-23T19:20:29Z) - ACDiT: Interpolating Autoregressive Conditional Modeling and Diffusion Transformer [95.80384464922147]
連続的な視覚生成には、フルシーケンスの拡散に基づくアプローチが必要である。
本稿では,自己回帰的ブロックワイド条件拡散変換器ACDiTを提案する。
本稿では,拡散目標を訓練しながら,視覚理解タスクにACDiTをシームレスに使用できることを実証する。
論文 参考訳(メタデータ) (2024-12-10T18:13:20Z) - Efficient Text-driven Motion Generation via Latent Consistency Training [21.348658259929053]
非線形逆拡散軌道を解くための動き潜時整合トレーニングフレームワーク(MLCT)を提案する。
これらの拡張を組み合わせることで、非画素モダリティおよび潜在表現空間における安定かつ一貫性のあるトレーニングを実現する。
論文 参考訳(メタデータ) (2024-05-05T02:11:57Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Layout Sequence Prediction From Noisy Mobile Modality [53.49649231056857]
軌道予測は、自律運転やロボット工学などの応用における歩行者運動を理解する上で重要な役割を担っている。
現在の軌道予測モデルは、視覚的モダリティからの長い、完全な、正確に観察されたシーケンスに依存する。
本稿では,物体の障害物や視界外を,完全に視認できる軌跡を持つものと同等に扱う新しいアプローチであるLTrajDiffを提案する。
論文 参考訳(メタデータ) (2023-10-09T20:32:49Z) - Language-Guided Traffic Simulation via Scene-Level Diffusion [46.47977644226296]
本稿では,シーンレベルの条件拡散モデルであるCTG++について述べる。
まず,現実的で制御可能なトラフィックを生成する時間的バックボーンを備えたシーンレベルの拡散モデルを提案する。
次に、大きな言語モデル(LLM)を用いて、ユーザクエリを、拡散モデルをクエリに準拠した生成に導く損失関数に変換する。
論文 参考訳(メタデータ) (2023-06-10T05:20:30Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。