論文の概要: DriveGen: Towards Infinite Diverse Traffic Scenarios with Large Models
- arxiv url: http://arxiv.org/abs/2503.05808v1
- Date: Tue, 04 Mar 2025 06:14:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:50:38.258229
- Title: DriveGen: Towards Infinite Diverse Traffic Scenarios with Large Models
- Title(参考訳): DriveGen: 大規模モデルによる無限の逆トラフィックシナリオを目指して
- Authors: Shenyu Zhang, Jiaguo Tian, Zhengbang Zhu, Shan Huang, Jucheng Yang, Weinan Zhang,
- Abstract要約: DriveGenは、より多様なトラフィック生成のための大きなモデルを備えた、新しいトラフィックシミュレーションフレームワークである。
DriveGenは、大規模モデルのハイレベルな認識と運転行動の推論を完全に活用する。
生成したシナリオとコーナーケースは、最先端のベースラインよりも優れたパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 22.21497010925769
- License:
- Abstract: Microscopic traffic simulation has become an important tool for autonomous driving training and testing. Although recent data-driven approaches advance realistic behavior generation, their learning still relies primarily on a single real-world dataset, which limits their diversity and thereby hinders downstream algorithm optimization. In this paper, we propose DriveGen, a novel traffic simulation framework with large models for more diverse traffic generation that supports further customized designs. DriveGen consists of two internal stages: the initialization stage uses large language model and retrieval technique to generate map and vehicle assets; the rollout stage outputs trajectories with selected waypoint goals from visual language model and a specific designed diffusion planner. Through this two-staged process, DriveGen fully utilizes large models' high-level cognition and reasoning of driving behavior, obtaining greater diversity beyond datasets while maintaining high realism. To support effective downstream optimization, we additionally develop DriveGen-CS, an automatic corner case generation pipeline that uses failures of the driving algorithm as additional prompt knowledge for large models without the need for retraining or fine-tuning. Experiments show that our generated scenarios and corner cases have a superior performance compared to state-of-the-art baselines. Downstream experiments further verify that the synthesized traffic of DriveGen provides better optimization of the performance of typical driving algorithms, demonstrating the effectiveness of our framework.
- Abstract(参考訳): 微視的交通シミュレーションは、自律走行訓練とテストにとって重要なツールとなっている。
最近のデータ駆動型アプローチは現実的な行動生成を促進するが、学習は主に1つの実世界のデータセットに依存しており、その多様性を制限し、下流アルゴリズムの最適化を妨げている。
本稿では,より多様なトラフィック生成のための大規模モデルを備えた新しいトラフィックシミュレーションフレームワークであるDriveGenを提案する。
DriveGenは2つの内部ステージで構成されており、初期化段階は大きな言語モデルと検索手法を使用して地図と車両の資産を生成する。
この2段階のプロセスを通じて、DriveGenは大規模モデルのハイレベルな認識と運転行動の推論を完全に活用し、高いリアリズムを維持しながらデータセット以上の多様性を得る。
下流の効率的な最適化を支援するために,運転アルゴリズムの故障を利用した自動コーナーケース生成パイプラインであるDriveGen-CSを開発した。
実験により、我々の生成したシナリオとコーナーケースは、最先端のベースラインよりも優れたパフォーマンスを示している。
さらに、ダウンストリーム実験により、DriveGenの合成トラフィックが典型的な駆動アルゴリズムの性能をより良く最適化し、我々のフレームワークの有効性を実証する。
関連論文リスト
- Direct Preference Optimization-Enhanced Multi-Guided Diffusion Model for Traffic Scenario Generation [0.0]
拡散に基づくモデルは、現実的な交通シナリオを生成するために現実世界の運転データを使用することの有効性が認識されている。
これらのモデルは、特定のトラフィック嗜好を取り入れ、シナリオリアリズムを強化するためにガイド付きサンプリングを採用している。
本稿では,新しいトレーニング戦略を利用して,交通前兆に密着した多誘導拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-14T05:29:43Z) - DrivingGPT: Unifying Driving World Modeling and Planning with Multi-modal Autoregressive Transformers [61.92571851411509]
我々は、インターリーブ画像とアクショントークンに基づくマルチモーダル駆動言語を導入し、共同世界モデリングと計画を学ぶためのDrivingGPTを開発した。
我々のDrivingGPTは、アクション条件付きビデオ生成とエンドツーエンドプランニングの両方において強力なパフォーマンスを示し、大規模なnuPlanとNAVSIMベンチマークにおいて強力なベースラインを達成しています。
論文 参考訳(メタデータ) (2024-12-24T18:59:37Z) - High-Order Evolving Graphs for Enhanced Representation of Traffic Dynamics [4.856478623606766]
本稿では,自律運転における表現性の向上を目的とした,高次進化グラフを用いた交通動態解析のための革新的なフレームワークを提案する。
提案手法は,交通シーン内の複雑な相互作用をリアルタイムにモデル化する双方向の時間的二部グラフを構築する。
論文 参考訳(メタデータ) (2024-09-17T14:00:58Z) - DiFSD: Ego-Centric Fully Sparse Paradigm with Uncertainty Denoising and Iterative Refinement for Efficient End-to-End Self-Driving [55.53171248839489]
我々は、エンドツーエンドの自動運転のためのエゴ中心の完全スパースパラダイムであるDiFSDを提案する。
特に、DiFSDは主にスパース知覚、階層的相互作用、反復的な運動プランナーから構成される。
nuScenesとBench2Driveデータセットで実施された実験は、DiFSDの優れた計画性能と優れた効率を実証している。
論文 参考訳(メタデータ) (2024-09-15T15:55:24Z) - GenDDS: Generating Diverse Driving Video Scenarios with Prompt-to-Video Generative Model [6.144680854063938]
GenDDSは、自律運転システムの運転シナリオを生成するための新しいアプローチである。
我々は、実際の運転ビデオを含むKITTIデータセットを使用して、モデルをトレーニングする。
実世界の運転シナリオの複雑さと変動性を密に再現した高品質な運転映像を,我々のモデルで生成できることを実証した。
論文 参考訳(メタデータ) (2024-08-28T15:37:44Z) - DriveDiTFit: Fine-tuning Diffusion Transformers for Autonomous Driving [27.92501884414881]
自律運転では、データセットは悪天候、照明条件、さまざまな移動物体を含む様々な運転シナリオをカバーすることが期待されている。
DriveDiTFitを提案する。Diffusion Transformer(DiT)を微調整することで、自律運転データを効率的に生成する新しい方法である。
具体的には、DriveDiTFitはギャップ駆動変調技術を用いて、事前訓練されたソースデータと目標駆動データとの相違に応じて、DiT内のいくつかのパラメータを慎重に選択し、効率的に微調整する。
論文 参考訳(メタデータ) (2024-07-22T14:18:52Z) - Continual Learning for Adaptable Car-Following in Dynamic Traffic Environments [16.587883982785]
自動運転技術の継続的な進化には、多様なダイナミックな交通環境に適応できる自動車追従モデルが必要である。
従来の学習ベースのモデルは、連続的な学習能力の欠如により、目に見えないトラフィックパターンに遭遇する際のパフォーマンス低下に悩まされることが多い。
本稿では,この制限に対処する連続学習に基づく新しい車追従モデルを提案する。
論文 参考訳(メタデータ) (2024-07-17T06:32:52Z) - SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control [59.20038082523832]
我々は、自動走行アプリケーションの改善を継続的に行う方法で、生成データ生産を拡大することが証明された最初のモデルであるSubjectDriveを提案する。
本研究では, 多様なデータを生成するために, 多様な外部データソースを活用可能な, 主観制御機構を備えた新しいモデルを開発する。
論文 参考訳(メタデータ) (2024-03-28T14:07:13Z) - GenAD: Generalized Predictive Model for Autonomous Driving [75.39517472462089]
本稿では,自動運転分野における最初の大規模ビデオ予測モデルを紹介する。
我々のモデルはGenADと呼ばれ、新しい時間的推論ブロックでシーンを駆動する際の挑戦的なダイナミクスを扱う。
アクション条件付き予測モデルやモーションプランナーに適応することができ、現実世界の運転アプリケーションに大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-03-14T17:58:33Z) - TrafficBots: Towards World Models for Autonomous Driving Simulation and
Motion Prediction [149.5716746789134]
我々は,データ駆動型交通シミュレーションを世界モデルとして定式化できることを示した。
動作予測とエンドツーエンドの運転に基づくマルチエージェントポリシーであるTrafficBotsを紹介する。
オープンモーションデータセットの実験は、TrafficBotsが現実的なマルチエージェント動作をシミュレートできることを示している。
論文 参考訳(メタデータ) (2023-03-07T18:28:41Z) - Bayesian Optimization and Deep Learning forsteering wheel angle
prediction [58.720142291102135]
本研究の目的は,自動走行システムにおける操舵角度予測の精度の高いモデルを得ることである。
BOは限られた試行数で、BOST-LSTMと呼ばれるモデルを特定し、古典的なエンドツーエンド駆動モデルと比較して最も正確な結果を得た。
論文 参考訳(メタデータ) (2021-10-22T15:25:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。