論文の概要: Multi-task Safe Reinforcement Learning for Navigating Intersections in
Dense Traffic
- arxiv url: http://arxiv.org/abs/2202.09644v1
- Date: Sat, 19 Feb 2022 17:09:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-23 09:51:14.594071
- Title: Multi-task Safe Reinforcement Learning for Navigating Intersections in
Dense Traffic
- Title(参考訳): 密集した交通の交差点をナビゲートするマルチタスク安全強化学習
- Authors: Yuqi Liu, Qichao Zhang, Dongbin Zhao
- Abstract要約: マルチタスク交差点ナビゲーションは、自動運転にとって依然として困難な課題である。
人間ドライバーにとって、他の対話型車両との交渉スキルは、安全性と効率性を保証する鍵となる。
我々は、他の交通機関の参加者と対話する際の安全性と効率を改善するために、社会的な注意を伴うマルチタスク安全な強化学習を定式化する。
- 参考スコア(独自算出の注目度): 10.085223486314929
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task intersection navigation including the unprotected turning left,
turning right, and going straight in dense traffic is still a challenging task
for autonomous driving. For the human driver, the negotiation skill with other
interactive vehicles is the key to guarantee safety and efficiency. However, it
is hard to balance the safety and efficiency of the autonomous vehicle for
multi-task intersection navigation. In this paper, we formulate a multi-task
safe reinforcement learning with social attention to improve the safety and
efficiency when interacting with other traffic participants. Specifically, the
social attention module is used to focus on the states of negotiation vehicles.
In addition, a safety layer is added to the multi-task reinforcement learning
framework to guarantee safe negotiation. We compare the experiments in the
simulator SUMO with abundant traffic flows and CARLA with high-fidelity vehicle
models, which both show that the proposed algorithm can improve safety with
consistent traffic efficiency for multi-task intersection navigation.
- Abstract(参考訳): 未保護の左折、右折、そして密集した交通の直行を含むマルチタスクの交差点ナビゲーションは、自動運転にとって依然として難しい課題である。
人間のドライバーにとって、他のインタラクティブな車両との交渉スキルは安全性と効率を保証する鍵となる。
しかし、マルチタスク交差点ナビゲーションにおける自動運転車の安全性と効率のバランスをとることは困難である。
本稿では,他のトラヒック参加者と対話する場合の安全性と効率を向上させるため,社会的注意を伴うマルチタスク安全強化学習を定式化する。
特に、ソーシャルアテンションモジュールは、交渉車両の状態に焦点を合わせるために使用される。
さらに、安全ネゴシエーションを保証するために、マルチタスク強化学習フレームワークにセーフティレイヤが追加されている。
シミュレータSUMOと豊富な交通流とCARLAとを高忠実度車両モデルと比較することにより,提案アルゴリズムがマルチタスク交差点ナビゲーションにおいて一貫した交通効率で安全性を向上できることを示す。
関連論文リスト
- A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [17.434924472015812]
本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。
その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - Evaluation of Safety Constraints in Autonomous Navigation with Deep
Reinforcement Learning [62.997667081978825]
学習可能なナビゲーションポリシとして,セーフとアンセーフの2つを比較します。
安全なポリシは、制約をアカウントに含めますが、もう一方はそうではありません。
安全政策は、よりクリアランスの高い軌道を生成することができ(障害物によらず)、全体的な性能を犠牲にすることなく、トレーニング中に衝突を減らすことができることを示す。
論文 参考訳(メタデータ) (2023-07-27T01:04:57Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Multi-Task Conditional Imitation Learning for Autonomous Navigation at
Crowded Intersections [4.961474432432092]
歩行者との対話を必要とする混雑した交差点での自律ナビゲーションに重点を置いている。
横方向と縦方向の両方の制御タスクに適応するために,マルチタスク条件付き模倣学習フレームワークを提案する。
IntersectNavと呼ばれる新しいベンチマークが開発され、人間のデモが提供されている。
論文 参考訳(メタデータ) (2022-02-21T11:13:59Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - L2B: Learning to Balance the Safety-Efficiency Trade-off in Interactive
Crowd-aware Robot Navigation [11.893324664457548]
Learning to Balance(L2B)フレームワークにより、モバイルロボットエージェントは、群衆との衝突を避けることにより、目的地に向かって安全に操縦することができる。
観衆を意識したナビゲーションにおける安全性と効率の要件は,エージェントと観衆の間での社会的ジレンマの存在においてトレードオフがあることを観察する。
我々は,我々のL2Bフレームワークを挑戦的な群集シミュレーションで評価し,航法成功率と衝突速度の両方の観点から,最先端の航法アプローチよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-20T11:40:29Z) - A Multi-Agent Reinforcement Learning Approach For Safe and Efficient
Behavior Planning Of Connected Autonomous Vehicles [21.132777568170702]
我々は、コネクテッド・自動運転車のための情報共有型強化学習フレームワークを設計する。
提案手法は, 平均速度と快適性の観点から, CAV システムの効率性を向上させることができることを示す。
我々は,共用視覚が早期に障害物を観測し,交通渋滞を避けるために行動を起こすのに役立つことを示すために,障害物回避シナリオを構築した。
論文 参考訳(メタデータ) (2020-03-09T19:15:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。