論文の概要: Driving in Real Life with Inverse Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2206.03004v1
- Date: Tue, 7 Jun 2022 04:36:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-09 04:53:39.181424
- Title: Driving in Real Life with Inverse Reinforcement Learning
- Title(参考訳): 逆強化学習による実生活の運転
- Authors: Tung Phan-Minh and Forbes Howington and Ting-Sheng Chu and Sang Uk Lee
and Momchil S. Tomov and Nanxiang Li and Caglayan Dicle and Samuel Findler
and Francisco Suarez-Ruiz and Robert Beaudoin and Bo Yang and Sammy Omari and
Eric M. Wolff
- Abstract要約: Inverse Reinforcement Learning (IRL) を用いた密集都市交通における自動車運転のための学習ベースプランナーについて紹介する。
DriveIRLは多種多様な軌道提案を生成し、これらを軽量で解釈可能な安全フィルタでフィルタし、学習モデルを使用して各軌道をスコアする。
ラスベガス・ストリップ(Las Vegas Strip)でDriveIRLを検証し,大量の交通量で完全自律運転を実証した。
- 参考スコア(独自算出の注目度): 4.366642479205039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce the first learning-based planner to drive a car
in dense, urban traffic using Inverse Reinforcement Learning (IRL). Our
planner, DriveIRL, generates a diverse set of trajectory proposals, filters
these trajectories with a lightweight and interpretable safety filter, and then
uses a learned model to score each remaining trajectory. The best trajectory is
then tracked by the low-level controller of our self-driving vehicle. We train
our trajectory scoring model on a 500+ hour real-world dataset of expert
driving demonstrations in Las Vegas within the maximum entropy IRL framework.
DriveIRL's benefits include: a simple design due to only learning the
trajectory scoring function, relatively interpretable features, and strong
real-world performance. We validated DriveIRL on the Las Vegas Strip and
demonstrated fully autonomous driving in heavy traffic, including scenarios
involving cut-ins, abrupt braking by the lead vehicle, and hotel pickup/dropoff
zones. Our dataset will be made public to help further research in this area.
- Abstract(参考訳): 本稿では,Inverse Reinforcement Learning (IRL) を用いて,都市交通量の多い自動車を駆動する最初の学習プランナを提案する。
私たちのプランナーであるDriveIRLは、様々なトラジェクトリの提案を生成し、これらのトラジェクトリを軽量で解釈可能な安全フィルタでフィルタリングし、学習モデルを用いて各トラジェクトリをスコアリングする。
最善の軌道は、自動運転車の低レベルコントローラによって追跡される。
我々は、ラスベガスの最大エントロピーIRLフレームワーク内で、500時間以上の専門家駆動デモのリアルタイムデータセットで軌道スコアモデルをトレーニングする。
DriveIRLの利点は以下のとおりである: 軌道スコアリング関数、比較的解釈可能な機能、強力な実世界のパフォーマンスを学習することによる単純な設計。
ラスベガス・ストリップでDriveIRLを検証し、カットイン、リード車による突然のブレーキ、ホテルのピックアップ/ドロップオフゾーンを含むシナリオを含む、交通量の多い完全自律運転を実演した。
私たちのデータセットは、この分野のさらなる研究を支援するために公開されます。
関連論文リスト
- Reference-Free Formula Drift with Reinforcement Learning: From Driving Data to Tire Energy-Inspired, Real-World Policies [1.3499500088995464]
リアルタイムドリフト戦略は、高価な軌道最適化を回避しながら、必要な場所に車を配置した。
本研究では,タイヤエネルギー吸収の概念に基づく強化学習エージェントを設計する。
トヨタ GR Supra と Lexus LC 500 の実験では、車体を63degのサイドスリップ角度まで安定して押しながら、追跡誤差を最大10cmに抑えながら、様々なウェイポイント構成でスムーズにドリフトできることが示されている。
論文 参考訳(メタデータ) (2024-10-28T13:10:15Z) - HE-Drive: Human-Like End-to-End Driving with Vision Language Models [11.845309076856365]
HE-Driveは,人類初のエンドツーエンド自動運転システムである。
HE-Driveは、データセット上での最先端性能(すなわち、平均衝突速度をVADより71%削減)と効率(SparseDriveより1.9倍高速)を達成することを示す。
論文 参考訳(メタデータ) (2024-10-07T14:06:16Z) - Traffic Smoothing Controllers for Autonomous Vehicles Using Deep
Reinforcement Learning and Real-World Trajectory Data [45.13152172664334]
我々は、自動運転車に展開できる交通平滑なクルーズコントローラーを設計する。
我々はテネシー州のI-24ハイウェイの実際の軌跡データを活用している。
その結果、低4%の自律走行車侵入速度で、多くの停止・停止波を示す軌道上で15%以上の燃料を節約できることが判明した。
論文 参考訳(メタデータ) (2024-01-18T00:50:41Z) - FastRLAP: A System for Learning High-Speed Driving via Deep RL and
Autonomous Practicing [71.76084256567599]
本稿では、自律型小型RCカーを強化学習(RL)を用いた視覚的観察から積極的に駆動するシステムを提案する。
我々のシステムであるFastRLAP (faster lap)は、人間の介入なしに、シミュレーションや専門家によるデモンストレーションを必要とせず、現実世界で自律的に訓練する。
結果として得られたポリシーは、タイミングブレーキや回転の加速度などの突発的な運転スキルを示し、ロボットの動きを妨げる領域を避け、トレーニングの途中で同様の1対1のインタフェースを使用して人間のドライバーのパフォーマンスにアプローチする。
論文 参考訳(メタデータ) (2023-04-19T17:33:47Z) - Safe Real-World Autonomous Driving by Learning to Predict and Plan with
a Mixture of Experts [3.2230833657560503]
我々は、自動運転車と他の道路エージェントの両方の将来の軌道にまたがる分布について提案する。
推論中は、安全性と予測確率を考慮したコストを最小限に抑える計画軌道を選択する。
都市部の公道上での自動運転車の展開に成功し、快適さを損なうことなく安全に運転できることを確認しました。
論文 参考訳(メタデータ) (2022-11-03T20:16:24Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - PlayVirtual: Augmenting Cycle-Consistent Virtual Trajectories for
Reinforcement Learning [84.30765628008207]
本稿では,RL特徴表現学習におけるデータ効率を向上させるために,サイクル一貫性のある仮想トラジェクトリを付加するPlayVirtualという新しい手法を提案する。
本手法は,両ベンチマークにおいて,最先端の手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2021-06-08T07:37:37Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Learn-to-Race: A Multimodal Control Environment for Autonomous Racing [23.798765519590734]
模擬フォーミュラ-Eスタイルのレースにおいて、L2R(Learn-to-Race)が活躍する新しい環境を紹介します。
シミュレーターと対面トレーニングフレームワークを含む我々の環境は、車両のダイナミックスとレース条件を正確にモデル化する。
次に,学習からドライブへの挑戦,フォーミュラeレース,および自動運転のためのマルチモーダル軌道予測に着想を得たl2rタスクを提案する。
論文 参考訳(メタデータ) (2021-03-22T04:03:06Z) - End-to-end Interpretable Neural Motion Planner [78.69295676456085]
複雑な都市環境での自律走行学習のためのニューラルモーションプランナー(NMP)を提案する。
我々は,生lidarデータとhdマップを入力とし,解釈可能な中間表現を生成する全体モデルを設計した。
北米のいくつかの都市で収集された実世界の運転データにおける我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-01-17T14:16:12Z) - LiDARsim: Realistic LiDAR Simulation by Leveraging the Real World [84.57894492587053]
物理に基づくシミュレーションと学習に基づくシミュレーションの両方のパワーをキャプチャする新しいシミュレータを開発した。
まず3Dシーン上でレイキャストを行い、次にディープニューラルネットワークを用いて物理シミュレーションから偏差を生成する。
本稿では,LiDARsimが長距離イベントにおける認識アルゴリズムのテストに有用であること,および安全クリティカルシナリオにおけるエンドツーエンドのクローズループ評価について紹介する。
論文 参考訳(メタデータ) (2020-06-16T17:44:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。