論文の概要: Multi-agent Reinforcement Learning for Cooperative Lane Changing of
Connected and Autonomous Vehicles in Mixed Traffic
- arxiv url: http://arxiv.org/abs/2111.06318v1
- Date: Thu, 11 Nov 2021 17:17:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-12 17:12:26.994537
- Title: Multi-agent Reinforcement Learning for Cooperative Lane Changing of
Connected and Autonomous Vehicles in Mixed Traffic
- Title(参考訳): 混合交通における連結車両と自律車両の協調車線変更のためのマルチエージェント強化学習
- Authors: Wei Zhou, Dong Chen, Jun Yan, Zhaojian Li, Huilin Yin, Wanchen Ge
- Abstract要約: レーン変更は、混合および動的交通シナリオにおける自動運転車(AV)にとって大きな課題である。
本稿では,マルチエージェント強化学習(MARL)問題として,混在高速道路環境における複数のAVの車線変更決定を定式化する。
提案するMARLフレームワークは,効率,安全性,ドライバの快適性という点で,最先端のベンチマークを一貫して上回っている。
- 参考スコア(独自算出の注目度): 12.350367650610295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous driving has attracted significant research interests in the past
two decades as it offers many potential benefits, including releasing drivers
from exhausting driving and mitigating traffic congestion, among others.
Despite promising progress, lane-changing remains a great challenge for
autonomous vehicles (AV), especially in mixed and dynamic traffic scenarios.
Recently, reinforcement learning (RL), a powerful data-driven control method,
has been widely explored for lane-changing decision makings in AVs with
encouraging results demonstrated. However, the majority of those studies are
focused on a single-vehicle setting, and lane-changing in the context of
multiple AVs coexisting with human-driven vehicles (HDVs) have received scarce
attention. In this paper, we formulate the lane-changing decision making of
multiple AVs in a mixed-traffic highway environment as a multi-agent
reinforcement learning (MARL) problem, where each AV makes lane-changing
decisions based on the motions of both neighboring AVs and HDVs. Specifically,
a multi-agent advantage actor-critic network (MA2C) is developed with a novel
local reward design and a parameter sharing scheme. In particular, a
multi-objective reward function is proposed to incorporate fuel efficiency,
driving comfort, and safety of autonomous driving. Comprehensive experimental
results, conducted under three different traffic densities and various levels
of human driver aggressiveness, show that our proposed MARL framework
consistently outperforms several state-of-the-art benchmarks in terms of
efficiency, safety and driver comfort.
- Abstract(参考訳): 自動運転は過去20年で大きな研究関心を集めており、運転者の運転不足や交通渋滞の緩和など、多くの潜在的な利益を提供している。
将来性はあるものの、車線変更は自動運転車(AV)にとって大きな課題であり、特に混合および動的交通シナリオにおいてである。
近年,データ駆動型強力な制御手法である強化学習 (RL) が, AV の車線変更意思決定のために広く研究されている。
しかし、これらの研究の大半は単車種に焦点を合わせており、人間駆動車(HDV)と共存する複数のAVの文脈での車線変更は、ほとんど注目されていない。
本稿では,混在高速道路環境における複数のAVの車線変更決定をマルチエージェント強化学習(MARL)問題として定式化し,各AVが隣接するAVとHDVの両方の動きに基づいて車線変更決定を行う。
具体的には,新しい局所報酬設計とパラメータ共有方式を用いて,マルチエージェント・アドバンテージ・アクタ-クリティックネットワーク(ma2c)を開発した。
特に, 燃料効率, 運転快適性, 自律運転の安全性を考慮した多目的報酬関数を提案する。
3つの異なる交通密度と様々なレベルの人間ドライバー攻撃性の下で実施した総合的な実験結果から,提案手法は,効率,安全性,快適性において,最先端のベンチマークを一貫して上回っていることが示された。
関連論文リスト
- Characterizing Behavioral Differences and Adaptations of Automated Vehicles and Human Drivers at Unsignalized Intersections: Insights from Waymo and Lyft Open Datasets [9.080817016043769]
自動運転車(AV)の交通システムへの統合は、道路の安全性と効率を高める前例のない機会である。
本研究では,無人交差点におけるAVと人間駆動車(HV)の行動差と適応性を調べることにより,ギャップを埋めることを目的とする。
この研究は、系統的な手法を用いて、重要な安全性と効率の指標を計算することによって、衝突の合併と交差を識別し分析する。
論文 参考訳(メタデータ) (2024-10-16T13:19:32Z) - Comprehensive Autonomous Vehicle Optimal Routing With Dynamic Heuristics [0.0]
AVユーザエクスペリエンスを改善するために提案されたモデルは、複数の連結自動運転車のハイブリッドAVネットワークを使用する。
この問題の真の最適解決策は、AVネットワークにおける車両の自動誘導システムを開発することである。
結果は分析され、解の有効性を評価し、ギャップと将来の拡張を識別するために比較される。
論文 参考訳(メタデータ) (2024-03-17T18:21:56Z) - Development and Assessment of Autonomous Vehicles in Both Fully
Automated and Mixed Traffic Conditions [0.0]
本稿では,単一AVの開発から始まり,接続型AVへと進展する多段階アプローチを提案する。
AVの運転性能を検証するために調査を行い、混合交通事例研究に活用する。
その結果, 深部強化学習を用いて, AVは人間の運転性能に到達した運転行動を得た。
AVネットワークにおける共有とケアに基づくV2Vコミュニケーションの採用は、その運転行動を高め、より効果的な行動計画を支援し、AV間の協調行動を促進する。
論文 参考訳(メタデータ) (2023-12-08T02:40:11Z) - DRUformer: Enhancing the driving scene Important object detection with
driving relationship self-understanding [50.81809690183755]
交通事故はしばしば致命傷を負い、2023年まで5000万人以上の死者を出した。
従来の研究は、主に個々の参加者の重要性を評価し、それらを独立した存在として扱うものであった。
本稿では、重要な物体検出タスクを強化するために、運転シーン関連自己理解変換器(DRUformer)を紹介する。
論文 参考訳(メタデータ) (2023-11-11T07:26:47Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement
Learning [9.48157144651867]
本稿では,CAVのマルチモーダル強化学習によるロバスト・オン・ランプ・マージに対する新しいアプローチを提案する。
具体的には、運転安全性、快適運転行動、交通効率を考慮に入れ、マークフ決定プロセス(MDP)としてオンランプマージ問題を定式化する。
信頼性の高い統合操作を実現するため,BSMと監視画像を同時に活用してマルチモーダル観測を行う。
論文 参考訳(メタデータ) (2022-07-21T16:34:57Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - A Cooperation-Aware Lane Change Method for Autonomous Vehicles [16.937363492078426]
本稿では,車両間の相互作用を利用した協調型車線変更手法を提案する。
まず,AVと他者間の協調の可能性を探るため,対話的な軌道予測手法を提案する。
次に,モデル予測制御(MPC)に基づく動作計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-01-26T04:45:45Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - Divide-and-Conquer for Lane-Aware Diverse Trajectory Prediction [71.97877759413272]
軌道予測は、自動運転車が行動を計画し実行するための安全クリティカルなツールです。
近年の手法は,WTAやベスト・オブ・マニーといったマルチコース学習の目標を用いて,強力なパフォーマンスを実現している。
我々の研究は、軌道予測、学習出力、そして運転知識を使って制約を課すことによるより良い予測における2つの重要な課題に対処する。
論文 参考訳(メタデータ) (2021-04-16T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。