論文の概要: State Dropout-Based Curriculum Reinforcement Learning for Self-Driving
at Unsignalized Intersections
- arxiv url: http://arxiv.org/abs/2207.04361v1
- Date: Sun, 10 Jul 2022 01:33:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 08:22:08.209656
- Title: State Dropout-Based Curriculum Reinforcement Learning for Self-Driving
at Unsignalized Intersections
- Title(参考訳): 非信号交差点での自動運転のための州立ドロップアウト型カリキュラム強化学習
- Authors: Shivesh Khaitan and John M. Dolan
- Abstract要約: 本研究では, 深層強化学習のための新しいカリキュラムを用いて, 符号のない交差点を横断する問題に対処する。
提案するカリキュラムは,1)強化学習エージェントの学習過程を高速化し,2)カリキュラムなしで学習するエージェントと比較して,性能が向上する。
我々は,T区間と4方向交差点におけるCommonRoad動作計画シミュレータで本手法を検証した。
- 参考スコア(独自算出の注目度): 22.332617868412814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traversing intersections is a challenging problem for autonomous vehicles,
especially when the intersections do not have traffic control. Recently deep
reinforcement learning has received massive attention due to its success in
dealing with autonomous driving tasks. In this work, we address the problem of
traversing unsignalized intersections using a novel curriculum for deep
reinforcement learning. The proposed curriculum leads to: 1) A faster training
process for the reinforcement learning agent, and 2) Better performance
compared to an agent trained without curriculum. Our main contribution is
two-fold: 1) Presenting a unique curriculum for training deep reinforcement
learning agents, and 2) showing the application of the proposed curriculum for
the unsignalized intersection traversal task. The framework expects processed
observations of the surroundings from the perception system of the autonomous
vehicle. We test our method in the CommonRoad motion planning simulator on
T-intersections and four-way intersections.
- Abstract(参考訳): 交差点を横断することは、特に交差点に交通制御がない場合、自動運転車にとって難しい問題である。
近年,自律走行作業の成功により,深層強化学習に大きな注目を集めている。
本研究では, 深層強化学習のための新しいカリキュラムを用いて, 不特定交差点を横断する問題に対処する。
提案されたカリキュラムは
1)強化学習エージェントの学習過程の高速化、及び
2)カリキュラムなしで訓練したエージェントに比べ,パフォーマンスが向上した。
私たちの主な貢献は2つあります。
1)深層強化学習エージェント育成のためのユニークなカリキュラムの提示、及び
2) 未署名の交差点横断作業に対する提案カリキュラムの適用性を示す。
この枠組みは、自動運転車の知覚システムから周囲の処理された観察を期待する。
我々は,T区間と4方向交差点におけるCommonRoad運動計画シミュレータで本手法をテストする。
関連論文リスト
- Efficient Mitigation of Bus Bunching through Setter-Based Curriculum Learning [0.47518865271427785]
本稿では,セッターモデルを用いて,行動空間,対向強み,集団強みを自動生成するカリキュラム学習手法を提案する。
自動カリキュラム学習の手法は、動的に選択され、敵対するネットワークによって学習されるカリキュラムを含む。
論文 参考訳(メタデータ) (2024-05-23T18:26:55Z) - Rethinking Closed-loop Training for Autonomous Driving [82.61418945804544]
本研究は,学習エージェントの成功に対する異なるトレーニングベンチマーク設計の影響を分析した最初の実証的研究である。
複数ステップのルックアヘッドで計画を行うRLベースの駆動エージェントであるtrajectory value learning (TRAVL)を提案する。
実験の結果,TRAVLはすべてのベースラインと比較してより速く学習でき,安全な操作が可能であることがわかった。
論文 参考訳(メタデータ) (2023-06-27T17:58:39Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Multi-Task Conditional Imitation Learning for Autonomous Navigation at
Crowded Intersections [4.961474432432092]
歩行者との対話を必要とする混雑した交差点での自律ナビゲーションに重点を置いている。
横方向と縦方向の両方の制御タスクに適応するために,マルチタスク条件付き模倣学習フレームワークを提案する。
IntersectNavと呼ばれる新しいベンチマークが開発され、人間のデモが提供されている。
論文 参考訳(メタデータ) (2022-02-21T11:13:59Z) - Reinforcement Learning for Mixed Autonomy Intersections [4.771833920251869]
シミュレーショントラフィックネットワークにおける混合自律性トラフィックを制御するためのモデルフリー強化学習手法を提案する。
本手法は,任意の数の制御車両に対して,局所的な観測に基づく分散制御が可能なマルチエージェントポリシー分解を利用する。
論文 参考訳(メタデータ) (2021-11-08T18:03:18Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Affordance-based Reinforcement Learning for Urban Driving [3.507764811554557]
経路点と低次元視覚表現を用いた最適制御ポリシーを学習するための深層強化学習フレームワークを提案する。
スクラッチから訓練されたエージェントは、車線追従のタスクを学習し、区間間を走り回り、密集した交通状況でも他のアクターや信号機の前で立ち止まることを実証する。
論文 参考訳(メタデータ) (2021-01-15T05:21:25Z) - Language-guided Navigation via Cross-Modal Grounding and Alternate
Adversarial Learning [66.9937776799536]
新たなビジョン・アンド・ランゲージナビゲーション(VLN)問題は、見えない写真リアリスティック環境において、エージェントがターゲットの場所に向かうことを学習することを目的としている。
VLNの主な課題は、主に2つの側面から生じている: まず、エージェントは動的に変化する視覚環境に対応する言語命令の有意義な段落に出席する必要がある。
そこで本稿では,エージェントにテキストと視覚の対応性を追跡する機能を持たせるために,クロスモーダルグラウンドモジュールを提案する。
論文 参考訳(メタデータ) (2020-11-22T09:13:46Z) - Reinforcement Learning for Autonomous Driving with Latent State
Inference and Spatial-Temporal Relationships [46.965260791099986]
強化学習フレームワークにおける潜伏状態の明示的に推測と空間的時間的関係の符号化は,この課題に対処する上で有効であることを示す。
我々は、強化学習者と教師付き学習者を組み合わせた枠組みにより、他の運転者の潜伏状態に関する事前知識を符号化する。
提案手法は,最先端のベースラインアプローチと比較して,T区間のナビゲーションにおける性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-11-09T08:55:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。