論文の概要: Dream to Drive: Model-Based Vehicle Control Using Analytic World Models
- arxiv url: http://arxiv.org/abs/2502.10012v1
- Date: Fri, 14 Feb 2025 08:46:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 14:44:43.623641
- Title: Dream to Drive: Model-Based Vehicle Control Using Analytic World Models
- Title(参考訳): ドリーム・トゥ・ドライブ:分析世界モデルを用いたモデルベース車両制御
- Authors: Asen Nachkov, Danda Pani Paudel, Jan-Nico Zaech, Davide Scaramuzza, Luc Van Gool,
- Abstract要約: 我々は次の状態予測器、最適プランナー、最適逆状態の学習を可能にする3つの新しいタスク設定を提案する。
現在の動作に関して次のシミュレータ状態の勾配を必要とする分析ポリシ(APG)とは異なり、提案したセットアップは、現在の状態に関して次の状態の勾配に依存する。
- 参考スコア(独自算出の注目度): 67.20720048255362
- License:
- Abstract: Differentiable simulators have recently shown great promise for training autonomous vehicle controllers. Being able to backpropagate through them, they can be placed into an end-to-end training loop where their known dynamics turn into useful priors for the policy to learn, removing the typical black box assumption of the environment. So far, these systems have only been used to train policies. However, this is not the end of the story in terms of what they can offer. Here, for the first time, we use them to train world models. Specifically, we present three new task setups that allow us to learn next state predictors, optimal planners, and optimal inverse states. Unlike analytic policy gradients (APG), which requires the gradient of the next simulator state with respect to the current actions, our proposed setups rely on the gradient of the next state with respect to the current state. We call this approach Analytic World Models (AWMs) and showcase its applications, including how to use it for planning in the Waymax simulator. Apart from pushing the limits of what is possible with such simulators, we offer an improved training recipe that increases performance on the large-scale Waymo Open Motion dataset by up to 12% compared to baselines at essentially no additional cost.
- Abstract(参考訳): 差別化可能なシミュレータは、最近、自動運転車のコントローラーを訓練する大きな可能性を示している。
それらをバックプロパガンダにすることで、既知のダイナミクスが学習する上で有用な先駆者となり、環境の典型的なブラックボックスの仮定が取り除かれる、エンドツーエンドのトレーニングループに配置することができる。
これまでのところ、これらのシステムは政策の訓練にしか使われていない。
しかし、これは彼らが提供できるものの終わりではない。
ここでは、初めて、それらを世界モデルのトレーニングに使用します。
具体的には、次の状態予測器、最適プランナー、最適逆状態の学習を可能にする3つの新しいタスク設定を提案する。
現在の動作に関して次のシミュレータ状態の勾配を必要とする分析的ポリシー勾配(APG)とは異なり、提案した設定は現在の状態に関して次の状態の勾配に依存する。
我々は、このアプローチをAWM(Analytic World Models)と呼び、Waymaxシミュレータのプランニングなど、その応用例を紹介する。
このようなシミュレータでできることの限界を推し進める以外に、大規模なWaymo Open Motionデータセットのパフォーマンスを、基本的に追加コストなしでベースラインと比較して最大12%向上する、改善されたトレーニングレシピを提供しています。
関連論文リスト
- Gradient-based Trajectory Optimization with Parallelized Differentiable Traffic Simulation [24.95575815501035]
インテリジェントドライバモデル(IDM)に基づく並列化微分可能交通シミュレータを提案する。
我々の車両シミュレーターは、車両の動きを効率的にモデル化し、現実世界のデータに合うように教師できる軌道を生成する。
このシミュレータを用いて、入力軌跡の雑音をフィルタリングし(軌道フィルタリング)、スパース軌跡から高密度軌跡を再構成し(軌道再構成)、将来の軌跡を予測する。
論文 参考訳(メタデータ) (2024-12-21T19:53:38Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Solving Motion Planning Tasks with a Scalable Generative Model [15.858076912795621]
本稿では,運転シーンのダイナミクスを学習する生成モデルに基づく効率的な解を提案する。
我々の革新的なデザインは、モデルがフルオートレグレッシブモードとパーシャルオートレグレッシブモードの両方で動作できるようにする。
提案した生成モデルは,様々な動作計画タスクの基盤となる可能性がある。
論文 参考訳(メタデータ) (2024-07-03T03:57:05Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Constraint-based graph network simulator [9.462808515258464]
制約に基づく学習シミュレーションのためのフレームワークを提案する。
本稿では,制約関数としてグラフニューラルネットワークを用い,勾配降下を制約解として実装する。
我々のモデルは、トップラーニングシミュレータよりも優れた、あるいは同等のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2021-12-16T19:15:11Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - SimNet: Learning Reactive Self-driving Simulations from Real-world
Observations [10.035169936164504]
運転体験を現実的にシミュレートできるエンドツーエンドのトレーニング可能な機械学習システムを提案する。
これは、高価で時間を要する道路テストに頼ることなく、自動運転システムのパフォーマンスの検証に使用できる。
論文 参考訳(メタデータ) (2021-05-26T05:14:23Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Testing the Safety of Self-driving Vehicles by Simulating Perception and
Prediction [88.0416857308144]
センサシミュレーションは高価であり,領域ギャップが大きいため,センサシミュレーションに代わる方法を提案する。
我々は、自動運転車の知覚と予測システムの出力を直接シミュレートし、現実的な動き計画テストを可能にする。
論文 参考訳(メタデータ) (2020-08-13T17:20:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。