論文の概要: Hierarchical Model-Based Imitation Learning for Planning in Autonomous
Driving
- arxiv url: http://arxiv.org/abs/2210.09539v1
- Date: Tue, 18 Oct 2022 02:15:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 14:04:33.801937
- Title: Hierarchical Model-Based Imitation Learning for Planning in Autonomous
Driving
- Title(参考訳): 自律運転計画のための階層型モデルに基づく模倣学習
- Authors: Eli Bronstein, Mark Palatucci, Dominik Notz, Brandyn White, Alex
Kuefler, Yiren Lu, Supratik Paul, Payam Nikdel, Paul Mougin, Hongge Chen,
Justin Fu, Austin Abrams, Punit Shah, Evan Racah, Benjamin Frenkel, Shimon
Whiteson, Dragomir Anguelov
- Abstract要約: 都市密集型自動運転の課題に対するモデルベース生成逆相似学習(MGAIL)の大規模適用を実証した。
我々は、任意の目標経路への一般化を可能にする階層モデルを用いて標準MGAILを拡張し、シミュレーションされた対話エージェントを用いたクローズドループ評価フレームワークを用いて性能を測定する。
私たちは、サンフランシスコで10万マイル以上を走行する実車から収集した専門家の軌跡からのポリシーを訓練し、ゼロショット環境でも堅牢にナビゲートできるステアブルなポリシーを実証します。
- 参考スコア(独自算出の注目度): 47.59287162318435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We demonstrate the first large-scale application of model-based generative
adversarial imitation learning (MGAIL) to the task of dense urban self-driving.
We augment standard MGAIL using a hierarchical model to enable generalization
to arbitrary goal routes, and measure performance using a closed-loop
evaluation framework with simulated interactive agents. We train policies from
expert trajectories collected from real vehicles driving over 100,000 miles in
San Francisco, and demonstrate a steerable policy that can navigate robustly
even in a zero-shot setting, generalizing to synthetic scenarios with novel
goals that never occurred in real-world driving. We also demonstrate the
importance of mixing closed-loop MGAIL losses with open-loop behavior cloning
losses, and show our best policy approaches the performance of the expert. We
evaluate our imitative model in both average and challenging scenarios, and
show how it can serve as a useful prior to plan successful trajectories.
- Abstract(参考訳): 都市密集型自動運転の課題に対するモデルベース生成逆相似学習(MGAIL)の大規模適用を実証した。
任意のゴールルートへの一般化を可能にするために階層モデルを用いて標準mgailを拡張し,対話型エージェントを用いたクローズドループ評価フレームワークを用いて性能を測定する。
私たちは、サンフランシスコで10万マイル以上を走行する実車から収集された専門家の軌跡からのポリシーをトレーニングし、ゼロショットでも堅牢に走行できるステアブルなポリシーを示し、現実の運転では起こらなかった新しい目標を持つ合成シナリオに一般化します。
また,クローズドループmgail損失とオープンループ動作クローン損失を混合することの重要性を実証し,専門家のパフォーマンスに対する最善の方針を示す。
私たちは、平均シナリオと挑戦シナリオの両方で模倣モデルを評価し、それが軌道計画に成功する前にどのように役立つかを示します。
関連論文リスト
- Dream to Drive with Predictive Individual World Model [12.05377034777257]
本稿では,自律運転のための予測的個別世界モデル(PIWM)を用いたモデルベース強化学習(MBRL)手法を提案する。
PIWMは、運転環境を個人レベルで記述し、車両の対話的関係と意図を捉える。
PIWMの想像力で訓練され、意図を意識した潜伏状態を活用する都市運転シーンで効果的にナビゲートする。
論文 参考訳(メタデータ) (2025-01-28T06:18:29Z) - Diffusion-Based Planning for Autonomous Driving with Flexible Guidance [19.204115959760788]
閉ループ計画のための新しい変圧器ベース拡散プランナを提案する。
本モデルは,予測タスクと計画タスクの協調モデリングを支援する。
様々な運転スタイルで頑健な伝達性を持つ最先端の閉ループ性能を実現する。
論文 参考訳(メタデータ) (2025-01-26T15:49:50Z) - Tractable Joint Prediction and Planning over Discrete Behavior Modes for
Urban Driving [15.671811785579118]
自己回帰閉ループモデルのパラメータ化は,再学習を伴わずに可能であることを示す。
離散潜在モード上での完全反応性閉ループ計画を提案する。
当社のアプローチは、CARLAにおける従来の最先端技術よりも、高密度なトラフィックシナリオに挑戦する上で優れています。
論文 参考訳(メタデータ) (2024-03-12T01:00:52Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Integration of Reinforcement Learning Based Behavior Planning With
Sampling Based Motion Planning for Automated Driving [0.5801044612920815]
本研究では,高度行動計画のための訓練された深層強化学習ポリシーを用いる方法を提案する。
私たちの知る限りでは、この研究は、この方法で深層強化学習を適用した最初のものである。
論文 参考訳(メタデータ) (2023-04-17T13:49:55Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Distribution-aware Goal Prediction and Conformant Model-based Planning
for Safe Autonomous Driving [16.654299927694716]
本研究では,学習から学習までのタスクを,障害物認識と接地,分布認識の目標予測,モデルベース計画として再構築する。
CARLAシミュレータでは,CARNOVELベンチマークの最先端結果を報告する。
論文 参考訳(メタデータ) (2022-12-16T21:51:51Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。