論文の概要: LEAD: Minimizing Learner-Expert Asymmetry in End-to-End Driving
- arxiv url: http://arxiv.org/abs/2512.20563v1
- Date: Tue, 23 Dec 2025 18:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.960982
- Title: LEAD: Minimizing Learner-Expert Asymmetry in End-to-End Driving
- Title(参考訳): LEAD:エンド・ツー・エンド運転における学習者の非対称性の最小化
- Authors: Long Nguyen, Micha Fauth, Bernhard Jaeger, Daniel Dauner, Maximilian Igl, Andreas Geiger, Kashyap Chitta,
- Abstract要約: 本研究では,有能な専門家による実演とセンサを用いた学生観察の誤調整が,模倣学習の有効性を抑えるかを検討した。
TransFuser v6 (TFv6) の学生ポリシーは、すべての主要なCARLAクローズドループベンチマークにおいて、新しい技術状態を達成する。
- 参考スコア(独自算出の注目度): 29.34610793694948
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Simulators can generate virtually unlimited driving data, yet imitation learning policies in simulation still struggle to achieve robust closed-loop performance. Motivated by this gap, we empirically study how misalignment between privileged expert demonstrations and sensor-based student observations can limit the effectiveness of imitation learning. More precisely, experts have significantly higher visibility (e.g., ignoring occlusions) and far lower uncertainty (e.g., knowing other vehicles' actions), making them difficult to imitate reliably. Furthermore, navigational intent (i.e., the route to follow) is under-specified in student models at test time via only a single target point. We demonstrate that these asymmetries can measurably limit driving performance in CARLA and offer practical interventions to address them. After careful modifications to narrow the gaps between expert and student, our TransFuser v6 (TFv6) student policy achieves a new state of the art on all major publicly available CARLA closed-loop benchmarks, reaching 95 DS on Bench2Drive and more than doubling prior performances on Longest6~v2 and Town13. Additionally, by integrating perception supervision from our dataset into a shared sim-to-real pipeline, we show consistent gains on the NAVSIM and Waymo Vision-Based End-to-End driving benchmarks. Our code, data, and models are publicly available at https://github.com/autonomousvision/lead.
- Abstract(参考訳): シミュレータは、ほぼ無制限に駆動データを生成することができるが、シミュレーションにおける模倣学習ポリシーは、堅牢な閉ループ性能を達成するのに依然として苦労している。
このギャップに触発された我々は、特権を持つ専門家によるデモンストレーションとセンサーを用いた学生の観察が、模倣学習の有効性をいかに制限するかを実証的に研究した。
より正確には、専門家は極めて高い視認性(例えば、閉塞を無視するなど)とはるかに低い不確実性(例えば、他の車両の行動を知るなど)を持っているため、確実に模倣することは困難である。
さらに、ナビゲーション意図(すなわち、従うべきルート)は、1つの目標点のみを介して、試験時間における学生モデルにおいて過小評価される。
これらの対称性はCARLAにおける運転性能を測定可能限度に制限し、それに対応するための実践的な介入を提供することを示す。
専門家と学生のギャップを狭めるため、慎重に修正を行った結果、TransFuser v6 (TFv6) の学生ポリシーは、すべての主要なCARLAクローズドループベンチマークに対して、新しい最先端の達成を実現した。
さらに、データセットからの知覚の監視を共有シミュレート・トゥ・リアルパイプラインに統合することにより、NAVSIMとWaymo Vision-based End-to-End駆動ベンチマークに一貫した利得を示す。
私たちのコード、データ、モデルはhttps://github.com/autonomousvision/lead.comで公開されています。
関連論文リスト
- MetaFollower: Adaptable Personalized Autonomous Car Following [63.90050686330677]
適応型パーソナライズされた自動車追従フレームワークであるMetaFollowerを提案する。
まず,モデルに依存しないメタラーニング(MAML)を用いて,様々なCFイベントから共通運転知識を抽出する。
さらに、Long Short-Term Memory (LSTM) と Intelligent Driver Model (IDM) を組み合わせて、時間的不均一性を高い解釈性で反映する。
論文 参考訳(メタデータ) (2024-06-23T15:30:40Z) - NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking [65.24988062003096]
我々は,視覚に基づく運転ポリシーをベンチマークするフレームワークであるNAVSIMを提案する。
我々のシミュレーションは非反応性であり、評価された政策と環境は互いに影響を与えない。
NAVSIMはCVPR 2024で開催され、143チームが433のエントリーを提出し、いくつかの新たな洞察を得た。
論文 参考訳(メタデータ) (2024-06-21T17:59:02Z) - Enhancing End-to-End Autonomous Driving with Latent World Model [78.22157677787239]
本稿では,LAW(Latent World Model)を用いたエンドツーエンド運転のための自己教師型学習手法を提案する。
LAWは、現在の特徴とエゴ軌道に基づいて将来のシーン機能を予測する。
この自己監督タスクは、知覚のない、知覚に基づくフレームワークにシームレスに統合することができる。
論文 参考訳(メタデータ) (2024-06-12T17:59:21Z) - Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement
Learning [13.699336307578488]
深層模倣強化学習(DIRL)は、視覚入力を使用してアジャイルな自律レースを実現する。
我々は,高忠実性運転シミュレーションと実世界の1/20スケールRC-car上での車載計算の制限により,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-18T00:00:48Z) - PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for
Reinforcement Learning [84.30765628008207]
本稿では,RL特徴表現学習におけるデータ効率を向上させるために,サイクル一貫性のある仮想トラジェクトリを付加するPlayVirtualという新しい手法を提案する。
本手法は,両ベンチマークにおいて,最先端の手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2021-06-08T07:37:37Z) - Multi-task Learning with Attention for End-to-end Autonomous Driving [5.612688040565424]
条件模倣学習フレームワークにおける新しいマルチタスク注意認識ネットワークを提案する。
これにより、標準ベンチマークの成功率を向上させるだけでなく、トラフィックライトに反応する能力も向上します。
論文 参考訳(メタデータ) (2021-04-21T20:34:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。