論文の概要: End-to-End Urban Driving by Imitating a Reinforcement Learning Coach
- arxiv url: http://arxiv.org/abs/2108.08265v1
- Date: Wed, 18 Aug 2021 17:36:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:28:09.962159
- Title: End-to-End Urban Driving by Imitating a Reinforcement Learning Coach
- Title(参考訳): 強化学習コーチの派遣による都市走行の終末化
- Authors: Zhejun Zhang, Alexander Liniger, Dengxin Dai, Fisher Yu, Luc Van Gool
- Abstract要約: 人間は良いドライバーだが、エンドツーエンドのアルゴリズムにとって良いコーチではない。
我々は、鳥の目視画像を連続的な低レベル行動にマッピングする強化学習専門家を訓練する。
我々の強化学習コーチによって監督され、単眼カメラ入力のベースラインエンドツーエンドエージェントは、専門家レベルのパフォーマンスを達成する。
- 参考スコア(独自算出の注目度): 148.2683592850329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: End-to-end approaches to autonomous driving commonly rely on expert
demonstrations. Although humans are good drivers, they are not good coaches for
end-to-end algorithms that demand dense on-policy supervision. On the contrary,
automated experts that leverage privileged information can efficiently generate
large scale on-policy and off-policy demonstrations. However, existing
automated experts for urban driving make heavy use of hand-crafted rules and
perform suboptimally even on driving simulators, where ground-truth information
is available. To address these issues, we train a reinforcement learning expert
that maps bird's-eye view images to continuous low-level actions. While setting
a new performance upper-bound on CARLA, our expert is also a better coach that
provides informative supervision signals for imitation learning agents to learn
from. Supervised by our reinforcement learning coach, a baseline end-to-end
agent with monocular camera-input achieves expert-level performance. Our
end-to-end agent achieves a 78% success rate while generalizing to a new town
and new weather on the NoCrash-dense benchmark and state-of-the-art performance
on the more challenging CARLA LeaderBoard.
- Abstract(参考訳): エンドツーエンドの自動運転アプローチは、一般的に専門家によるデモンストレーションに依存している。
人間は良いドライバーだが、警察の監督を強く要求するエンドツーエンドのアルゴリズムのコーチには向いていない。
それとは対照的に、特権情報を活用する自動化専門家は、政治や政治外の大規模なデモを効率的に生成することができる。
しかし、既存の都市運転自動化の専門家は、手作りのルールを多用し、地味な情報を利用できる運転シミュレータでも最適に実行している。
これらの課題に対処するため,鳥眼視画像を低レベルの連続的な行動にマッピングする強化学習専門家を訓練した。
CARLAに新たなパフォーマンスをアップバウンドに設定する一方で、私たちの専門家は、模倣学習エージェントから学ぶための情報的監視信号を提供する優れたコーチです。
我々の強化学習コーチによって監督され、単眼カメラ入力のベースラインエンドツーエンドエージェントは、専門家レベルのパフォーマンスを達成する。
我々のエンドツーエンドエージェントは、新しい町に一般化しながら78%の成功率を獲得し、NoCrash-denseベンチマークで新しい天気と、より困難なCARLA LeaderBoard上での最先端のパフォーマンスを実現しています。
関連論文リスト
- GPT-Augmented Reinforcement Learning with Intelligent Control for Vehicle Dispatching [82.19172267487998]
GARLIC: GPT拡張強化学習のフレームワーク。
本稿では,GPT強化強化学習とインテリジェント制御のフレームワークであるGARLICについて紹介する。
論文 参考訳(メタデータ) (2024-08-19T08:23:38Z) - Guiding Attention in End-to-End Driving Models [49.762868784033785]
模倣学習によって訓練された視覚ベースのエンドツーエンドの運転モデルは、自動運転のための安価なソリューションにつながる可能性がある。
トレーニング中に損失項を追加することにより、これらのモデルの注意を誘導し、運転品質を向上させる方法について検討する。
従来の研究とは対照的に,本手法では,テスト期間中にこれらの有意義なセマンティックマップを利用できない。
論文 参考訳(メタデータ) (2024-04-30T23:18:51Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - CADRE: A Cascade Deep Reinforcement Learning Framework for Vision-based
Autonomous Urban Driving [43.269130988225605]
複雑な都市環境と運転行動のダイナミクスのため、高密度交通における視覚に基づく自律走行は極めて困難である。
本稿では,モデルフリーな視覚に基づく自律型都市走行を実現するために,新しいCAscade Deep Reinforcement LearningフレームワークCADREを提案する。
論文 参考訳(メタデータ) (2022-02-17T10:07:16Z) - Urban Driver: Learning to Drive from Real-world Demonstrations Using
Policy Gradients [7.58363583085932]
本研究では,実世界における大規模な実証実験から,複雑な都市交通の模倣政策を学習するためのオフラインポリシー手法を提案する。
これは、知覚出力と高忠実度HDマップの上に、微分可能なデータ駆動シミュレータを構築することで実現される。
提案手法は,都市道路における100時間にわたる専門家による実証実験に基づいて学習し,複雑な運転方針を学習し,多種多様な運転操作を行えることを示す。
論文 参考訳(メタデータ) (2021-09-27T20:19:18Z) - Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement
Learning [13.699336307578488]
深層模倣強化学習(DIRL)は、視覚入力を使用してアジャイルな自律レースを実現する。
我々は,高忠実性運転シミュレーションと実世界の1/20スケールRC-car上での車載計算の制限により,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-18T00:00:48Z) - Autonomous Overtaking in Gran Turismo Sport Using Curriculum
Reinforcement Learning [39.757652701917166]
本研究では,自律オーバーテイク問題に対する新たな学習手法を提案する。
カーレースシミュレーターであるGran Turismo Sportによるアプローチの評価を行った。
論文 参考訳(メタデータ) (2021-03-26T18:06:50Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - Learning by Cheating [72.9701333689606]
この難解な学習問題を2段階に分解することで単純化できることを示す。
提案手法を用いて、視覚に基づく自律運転システムの訓練を行い、芸術の状況を大幅に上回っている。
提案手法は,従来のCARLAベンチマークのすべてのタスクにおける100%の成功率を初めて達成し,NoCrashベンチマークに新しい記録を樹立し,従来の技術と比較すると,屈折率を桁違いに低減する。
論文 参考訳(メタデータ) (2019-12-27T18:59:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。