論文の概要: ApolloRL: a Reinforcement Learning Platform for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2201.12609v1
- Date: Sat, 29 Jan 2022 15:46:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 16:17:36.128028
- Title: ApolloRL: a Reinforcement Learning Platform for Autonomous Driving
- Title(参考訳): ApolloRL: 自動運転のための強化学習プラットフォーム
- Authors: Fei Gao, Peng Geng, Jiaqi Guo, Yuan Liu, Dingfeng Guo, Yabo Su, Jie
Zhou, Xiao Wei, Jin Li, Xu Liu
- Abstract要約: 本稿では,自律運転のための強化学習研究のためのオープンプラットフォームであるApolloRLを紹介する。
このプラットフォームは、トレーニング、シミュレーション、評価コンポーネントを備えた完全なクローズドループパイプラインを提供する。
- 参考スコア(独自算出の注目度): 23.89583996570305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ApolloRL, an open platform for research in reinforcement
learning for autonomous driving. The platform provides a complete closed-loop
pipeline with training, simulation, and evaluation components. It comes with
300 hours of real-world data in driving scenarios and popular baselines such as
Proximal Policy Optimization (PPO) and Soft Actor-Critic (SAC) agents. We
elaborate in this paper on the architecture and the environment defined in the
platform. In addition, we discuss the performance of the baseline agents in the
ApolloRL environment.
- Abstract(参考訳): 自動運転のための強化学習研究のためのオープンプラットフォームであるapollorlを紹介する。
このプラットフォームは、トレーニング、シミュレーション、評価コンポーネントを備えた完全なクローズドループパイプラインを提供する。
運転シナリオやPPO(Proximal Policy Optimization)やSAC(Soft Actor-Critic)エージェントなどの一般的なベースラインでは,300時間のリアルタイムデータが提供されている。
本論文では,プラットフォームで定義されたアーキテクチャと環境について詳述する。
また,ApolloRL環境におけるベースラインエージェントの性能についても検討した。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Deep Reinforcement Learning for Local Path Following of an Autonomous
Formula SAE Vehicle [0.36868085124383626]
本稿では, ディープ強化学習(DRL)と逆強化学習(IRL)を用いて, ローカルに観測されたコーンの位置を, レーストラック追従のための所望の操舵角度にマッピングする。
シミュレーションと実世界で行われたテストでは、両方のアルゴリズムがローカルパスのモデルトレーニングに成功していることを示唆している。
論文 参考訳(メタデータ) (2024-01-05T17:04:43Z) - DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms Trajectories [18.420795137038677]
フローティングプラットフォームは、地球上の微小重力環境をエミュレートするための多用途テストベッドとして機能する。
私たちのスイートは、シミュレーションから現実への堅牢性、適応性、優れた転送性を実現します。
論文 参考訳(メタデータ) (2023-10-06T14:11:35Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - DriverGym: Democratising Reinforcement Learning for Autonomous Driving [75.91049219123899]
本稿では,自律運転のための強化学習アルゴリズムを開発するオープンソース環境であるDeadGymを提案する。
DriverGymは1000時間以上の専門家ログデータへのアクセスを提供し、リアクティブおよびデータ駆動エージェントの動作をサポートする。
広範かつフレキシブルなクローズループ評価プロトコルを用いて,実世界のデータ上でRLポリシーの性能を容易に検証できる。
論文 参考訳(メタデータ) (2021-11-12T11:47:08Z) - Vision-Based Autonomous Car Racing Using Deep Imitative Reinforcement
Learning [13.699336307578488]
深層模倣強化学習(DIRL)は、視覚入力を使用してアジャイルな自律レースを実現する。
我々は,高忠実性運転シミュレーションと実世界の1/20スケールRC-car上での車載計算の制限により,本アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2021-07-18T00:00:48Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Fast Approximate Solutions using Reinforcement Learning for Dynamic
Capacitated Vehicle Routing with Time Windows [3.5232085374661284]
本稿では, CVRP-TWDR (Capacitated Vehicle Routing with Time Windows and Dynamic Routing) の一般クラスに対する, 本質的に並列化, 高速, 近似学習に基づくソリューションを開発する。
艦隊内の車両を分散エージェントとして考えると、強化学習(RL)ベースの適応は動的環境におけるリアルタイムルート形成の鍵となると仮定する。
論文 参考訳(メタデータ) (2021-02-24T06:30:16Z) - CARLA Real Traffic Scenarios -- novel training ground and benchmark for
autonomous driving [8.287331387095545]
本研究では,実世界のトラフィックに基づくCARLAシミュレータにおけるインタラクティブな交通シナリオについて紹介する。
我々は数秒間続く戦術的タスクに集中しており、これは現在の制御方法では特に困難である。
CARLA Real Traffic Scenarios(CRTS)は、自動運転システムのトレーニングとテストの場になることを意図しています。
論文 参考訳(メタデータ) (2020-12-16T13:20:39Z) - Learning from Simulation, Racing in Reality [126.56346065780895]
ミニチュアレースカープラットフォーム上で自律的なレースを行うための強化学習ベースのソリューションを提案する。
シミュレーションで純粋に訓練されたポリシーは、実際のロボットのセットアップにうまく移行できることを示す。
論文 参考訳(メタデータ) (2020-11-26T14:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。