論文の概要: Sim-to-real reinforcement learning applied to end-to-end vehicle control
- arxiv url: http://arxiv.org/abs/2012.07461v1
- Date: Mon, 14 Dec 2020 12:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 14:17:52.206143
- Title: Sim-to-real reinforcement learning applied to end-to-end vehicle control
- Title(参考訳): 車両のエンドツーエンド制御への適用
- Authors: Andr\'as Kalapos, Csaba G\'or, R\'obert Moni, Istv\'an Harmati
- Abstract要約: 本研究では車線追従や衝突回避といった車両制御問題のエンドツーエンド強化学習について検討する。
我々の制御ポリシーでは、実際の2車線の道路の右車線を追従するために小型ロボットを制御できますが、その訓練はシミュレーションでのみ行われました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we study vision-based end-to-end reinforcement learning on
vehicle control problems, such as lane following and collision avoidance. Our
controller policy is able to control a small-scale robot to follow the
right-hand lane of a real two-lane road, while its training was solely carried
out in a simulation. Our model, realized by a simple, convolutional network,
only relies on images of a forward-facing monocular camera and generates
continuous actions that directly control the vehicle. To train this policy we
used Proximal Policy Optimization, and to achieve the generalization capability
required for real performance we used domain randomization. We carried out
thorough analysis of the trained policy, by measuring multiple performance
metrics and comparing these to baselines that rely on other methods. To assess
the quality of the simulation-to-reality transfer learning process and the
performance of the controller in the real world, we measured simple metrics on
a real track and compared these with results from a matching simulation.
Further analysis was carried out by visualizing salient object maps.
- Abstract(参考訳): 本研究では,車線追従や衝突回避といった車両制御問題に対する視覚に基づくエンドツーエンド強化学習について検討する。
我々の制御ポリシーでは、実際の2車線の道路の右車線を追従するために小型ロボットを制御できますが、その訓練はシミュレーションでのみ行われました。
我々のモデルは、単純な畳み込みネットワークによって実現され、前方の単眼カメラの画像にのみ依存し、車両を直接制御する連続的な動作を生成する。
このポリシーをトレーニングするために、近似ポリシー最適化を使い、実際のパフォーマンスに必要な一般化能力を達成するためにドメインランダム化を使いました。
複数のパフォーマンスメトリクスを計測し、他のメソッドに依存するベースラインと比較することにより、トレーニングされたポリシーを徹底的に分析した。
実世界でのシミュレーションから現実への伝達学習プロセスの品質とコントローラの性能を評価するために,実軌道上での簡単な測定値を測定し,マッチングシミュレーションの結果と比較した。
さらに,サルエントオブジェクトマップの可視化により解析を行った。
関連論文リスト
- Autonomous vehicle decision and control through reinforcement learning with traffic flow randomization [5.217416662464762]
本研究では, 車両追従モデルのパラメータとルールに基づく微視的交通流の車線変化モデルのパラメータをランダム化することにより, 周囲の車両の運転形態と挙動をランダム化する手法を提案する。
提案手法は, 領域ランダム化されたルールベース微視的トラフィックフローとマージシーンを併用し, ルールベース微視的トラフィックフローと高忠実性微視的トラフィックフローで個別にテストした。
論文 参考訳(メタデータ) (2024-03-05T11:41:43Z) - Reinforcement Learning with Human Feedback for Realistic Traffic
Simulation [53.85002640149283]
効果的なシミュレーションの鍵となる要素は、人間の知識と整合した現実的な交通モデルの導入である。
本研究では,現実主義に対する人間の嗜好のニュアンスを捉えることと,多様な交通シミュレーションモデルを統合することの2つの主な課題を明らかにする。
論文 参考訳(メタデータ) (2023-09-01T19:29:53Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - CARLA Real Traffic Scenarios -- novel training ground and benchmark for
autonomous driving [8.287331387095545]
本研究では,実世界のトラフィックに基づくCARLAシミュレータにおけるインタラクティブな交通シナリオについて紹介する。
我々は数秒間続く戦術的タスクに集中しており、これは現在の制御方法では特に困難である。
CARLA Real Traffic Scenarios(CRTS)は、自動運転システムのトレーニングとテストの場になることを意図しています。
論文 参考訳(メタデータ) (2020-12-16T13:20:39Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z) - Simulation-based reinforcement learning for real-world autonomous driving [9.773015744446067]
実物大の車両を制御する駆動システムを実現するために,シミュレーションにおいて強化学習を用いる。
駆動ポリシは、単一のカメラからのRGBイメージと、それらのセマンティックセグメンテーションを入力として取り込む。
主に合成データを使用し、ラベル付き実世界のデータはセグメンテーションネットワークのトレーニングにのみ現れる。
論文 参考訳(メタデータ) (2019-11-29T00:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。