論文の概要: Hierarchical Learning with Unsupervised Skill Discovery for Highway
Merging Applications
- arxiv url: http://arxiv.org/abs/2302.02179v1
- Date: Sat, 4 Feb 2023 15:09:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 19:48:24.623275
- Title: Hierarchical Learning with Unsupervised Skill Discovery for Highway
Merging Applications
- Title(参考訳): ハイウェイマージのための教師なしスキル発見による階層学習
- Authors: Yigit Gurses, Kaan Buyukdemirci, and Yildiray Yildiz
- Abstract要約: 本稿では,学習した動作プリミティブを行動として利用する階層的学習手法を提案する。
モーションプリミティブは、所定の報酬関数なしで教師なしのスキル発見を使用して取得され、異なるシナリオで再利用することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driving in dense traffic with human and autonomous drivers is a challenging
task that requires high level planning and reasoning along with the ability to
react quickly to changes in a dynamic environment. In this study, we propose a
hierarchical learning approach that uses learned motion primitives as actions.
Motion primitives are obtained using unsupervised skill discovery without a
predetermined reward function, allowing them to be reused in different
scenarios. This can reduce the total training time for applications that need
to obtain multiple models with varying behavior. Simulation results demonstrate
that the proposed approach yields driver models that achieve higher performance
with less training compared to baseline reinforcement learning methods.
- Abstract(参考訳): 人間や自律的なドライバーとの密集したトラフィックの運転は、ダイナミックな環境の変化に素早く反応する能力とともに、高いレベルの計画と推論を必要とする課題である。
本研究では,学習動作プリミティブを動作として利用する階層的学習手法を提案する。
モーションプリミティブは、所定の報酬関数なしで教師なしスキル発見を使用して取得され、異なるシナリオで再利用することができる。
これにより、さまざまな振る舞いを持つ複数のモデルを取得する必要のあるアプリケーション全体のトレーニング時間を短縮できる。
シミュレーションの結果,提案手法は,ベースライン強化学習法と比較して,トレーニングの少ないドライバモデルで高い性能が得られることが示された。
関連論文リスト
- Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Imitation Is Not Enough: Robustifying Imitation with Reinforcement
Learning for Challenging Driving Scenarios [147.16925581385576]
シミュレーション学習と強化学習を組み合わせることで,運転方針の安全性と信頼性が大幅に向上することを示す。
都会の運転データ100万マイル以上でポリシーを訓練し、異なるレベルの衝突確率でグループ化されたテストシナリオにおける有効性を測定する。
論文 参考訳(メタデータ) (2022-12-21T23:59:33Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。
本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。
現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文 参考訳(メタデータ) (2022-04-14T17:46:26Z) - Learning Interactive Driving Policies via Data-driven Simulation [125.97811179463542]
データ駆動シミュレータは、ポリシー学習の駆動に高いデータ効率を約束する。
小さな基盤となるデータセットは、インタラクティブな運転を学ぶための興味深い、挑戦的なエッジケースを欠いていることが多い。
本研究では,ロバストな運転方針の学習に塗装されたアドカーを用いたシミュレーション手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T20:14:02Z) - DQ-GAT: Towards Safe and Efficient Autonomous Driving with Deep
Q-Learning and Graph Attention Networks [12.714551756377265]
従来の計画手法は概ねルールベースであり、複雑な動的シナリオではスケールが不十分である。
スケーラブルでプロアクティブな自動運転を実現するためにDQ-GATを提案する。
我々の手法は、見知らぬシナリオと見えないシナリオの両方において、安全と効率のトレードオフを改善することができる。
論文 参考訳(メタデータ) (2021-08-11T04:55:23Z) - Learning to drive from a world on rails [78.28647825246472]
モデルベースアプローチによって,事前記録された運転ログからインタラクティブな視覚ベースの運転方針を学習する。
世界の前方モデルは、あらゆる潜在的な運転経路の結果を予測する運転政策を監督する。
提案手法は,carla リーダボードにまずランク付けし,40 倍少ないデータを用いて25%高い運転スコアを得た。
論文 参考訳(メタデータ) (2021-05-03T05:55:30Z) - Autonomous Overtaking in Gran Turismo Sport Using Curriculum
Reinforcement Learning [39.757652701917166]
本研究では,自律オーバーテイク問題に対する新たな学習手法を提案する。
カーレースシミュレーターであるGran Turismo Sportによるアプローチの評価を行った。
論文 参考訳(メタデータ) (2021-03-26T18:06:50Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - Action-Based Representation Learning for Autonomous Driving [8.296684637620551]
本稿では,行動に基づく運転データを学習表現に用いることを提案する。
提案手法を用いて事前学習した空き時間に基づく運転モデルでは,比較的少量の弱注釈画像が有効であることを示す。
論文 参考訳(メタデータ) (2020-08-21T10:49:13Z) - Driver Modeling through Deep Reinforcement Learning and Behavioral Game
Theory [0.0]
自動運転車がドライバーと同一の安全レベルに達するためには、数百万マイルの走行テストが必要であると推定されている。
本稿では、複数の人的意思決定者からなる高忠実度交通シミュレータにおいて、安全かつ迅速な自動運転アルゴリズムの評価を可能にすることにより、テストに費やした時間と労力を削減するために利用することができる。
論文 参考訳(メタデータ) (2020-03-24T18:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。