論文の概要: Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2001.08726v3
- Date: Tue, 7 Jul 2020 06:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-07 12:56:04.705160
- Title: Interpretable End-to-end Urban Autonomous Driving with Latent Deep
Reinforcement Learning
- Title(参考訳): 潜時深度強化学習による終末都市自律走行の解釈
- Authors: Jianyu Chen, Shengbo Eben Li, Masayoshi Tomizuka
- Abstract要約: 本稿では,エンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
本手法は,自動車が運転環境にどう影響するかを,よりよく説明することができる。
- 参考スコア(独自算出の注目度): 32.97789225998642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike popular modularized framework, end-to-end autonomous driving seeks to
solve the perception, decision and control problems in an integrated way, which
can be more adapting to new scenarios and easier to generalize at scale.
However, existing end-to-end approaches are often lack of interpretability, and
can only deal with simple driving tasks like lane keeping. In this paper, we
propose an interpretable deep reinforcement learning method for end-to-end
autonomous driving, which is able to handle complex urban scenarios. A
sequential latent environment model is introduced and learned jointly with the
reinforcement learning process. With this latent model, a semantic birdeye mask
can be generated, which is enforced to connect with a certain intermediate
property in today's modularized framework for the purpose of explaining the
behaviors of learned policy. The latent space also significantly reduces the
sample complexity of reinforcement learning. Comparison tests with a simulated
autonomous car in CARLA show that the performance of our method in urban
scenarios with crowded surrounding vehicles dominates many baselines including
DQN, DDPG, TD3 and SAC. Moreover, through masked outputs, the learned policy is
able to provide a better explanation of how the car reasons about the driving
environment. The codes and videos of this work are available at our github repo
and project website.
- Abstract(参考訳): 一般的なモジュール化フレームワークとは異なり、エンドツーエンドの自律運転は、新しいシナリオに適応し、大規模に一般化しやすい、統合された方法で認識、決定、制御の問題を解決する。
しかし、既存のエンドツーエンドアプローチは解釈可能性に欠けることが多く、車線維持のような単純な運転タスクにしか対処できない。
本稿では,複雑な都市シナリオを処理可能なエンドツーエンド自動運転のための解釈可能な深部強化学習手法を提案する。
逐次潜在環境モデルを導入し、強化学習プロセスと共同で学習する。
この潜在モデルでは、セマンティックバードアイマスクが生成され、学習されたポリシーの振る舞いを説明する目的で、今日のモジュール化フレームワークの特定の中間プロパティと接続するように強制される。
潜在空間は強化学習のサンプル複雑性を大幅に減少させる。
carlaのシミュレートされた自動運転車との比較テストでは,dqn,ddpg,td3,sacなど,周辺車両の混み合った都市シナリオにおいて,提案手法の性能が多数を占めることが示された。
さらに、マスクされたアウトプットによって、学習されたポリシーは、運転環境に対する自動車の理由をよりよく説明することができる。
この作業のコードとビデオは、githubリポジトリおよびプロジェクトのwebサイトから入手できます。
関連論文リスト
- LLM4Drive: A Survey of Large Language Models for Autonomous Driving [62.10344445241105]
大規模言語モデル(LLM)は、文脈理解、論理的推論、回答生成などの能力を示した。
本稿では,自動走行のための大規模言語モデル (LLM4AD) に関する研究ラインを体系的にレビューする。
論文 参考訳(メタデータ) (2023-11-02T07:23:33Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - Autonomous Driving with Deep Reinforcement Learning in CARLA Simulation [0.0]
我々は、Deep Q-Learningを使用して、自動運転車が他の車両を避けながら、最高速度で車線を維持できるポリシーを学ぶ。
その後、我々はCARLAシミュレーション環境を使用して、新たに取得したポリシーをテストし、検証した。
論文 参考訳(メタデータ) (2023-06-20T00:54:20Z) - GINK: Graph-based Interaction-aware Kinodynamic Planning via
Reinforcement Learning for Autonomous Driving [10.782043595405831]
都市部などの構造環境下での自律運転に深部強化学習(D)を適用するには,多くの課題がある。
本稿では,グラフに基づく意図表現と動的計画のための強化学習を効果的に組み合わせた新しいフレームワークを提案する。
この実験は,既存のベースラインと比較して,我々のアプローチの最先端性能を示すものである。
論文 参考訳(メタデータ) (2022-06-03T10:37:25Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - Reinforcement Learning for Autonomous Driving with Latent State
Inference and Spatial-Temporal Relationships [46.965260791099986]
強化学習フレームワークにおける潜伏状態の明示的に推測と空間的時間的関係の符号化は,この課題に対処する上で有効であることを示す。
我々は、強化学習者と教師付き学習者を組み合わせた枠組みにより、他の運転者の潜伏状態に関する事前知識を符号化する。
提案手法は,最先端のベースラインアプローチと比較して,T区間のナビゲーションにおける性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-11-09T08:55:12Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。