論文の概要: Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using
Multi-Agent Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2110.08124v1
- Date: Tue, 5 Oct 2021 18:29:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-24 04:28:16.515456
- Title: Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using
Multi-Agent Deep Reinforcement Learning
- Title(参考訳): 多エージェント深部補強学習を用いた高速道路舗装地区における分散型協調車線変更
- Authors: Yi Hou, Peter Graf
- Abstract要約: マージやウィービングエリアなどの高速道路ボトルネックにおける渋滞時の車線変化は、さらに道路の容量を減少させる。
ディープ・リテンション・ラーニング(RL)とコネクテッド・アンド・オートマチック・カー・テクノロジーの出現は、協調車線変更による高速道路のボトルネックにおけるモビリティとエネルギー効率を改善するための解決策となる。
本研究では,多エージェント深部RLパラダイムを用いた分散協調車線切替制御器を開発した。
本研究では, 交通量, 車両速度, 車両当たりの停止数, 燃料効率, 排出エミッションの観点から, 多エージェント深部RLによる協調車線変更は, 運転者にとって優れた性能を示すことを示した。
- 参考スコア(独自算出の注目度): 1.6752182911522522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Frequent lane changes during congestion at freeway bottlenecks such as merge
and weaving areas further reduce roadway capacity. The emergence of deep
reinforcement learning (RL) and connected and automated vehicle technology
provides a possible solution to improve mobility and energy efficiency at
freeway bottlenecks through cooperative lane changing. Deep RL is a collection
of machine-learning methods that enables an agent to improve its performance by
learning from the environment. In this study, a decentralized cooperative
lane-changing controller was developed using proximal policy optimization by
adopting a multi-agent deep RL paradigm. In the decentralized control strategy,
policy learning and action reward are evaluated locally, with each agent
(vehicle) getting access to global state information. Multi-agent deep RL
requires lower computational resources and is more scalable than single-agent
deep RL, making it a powerful tool for time-sensitive applications such as
cooperative lane changing. The results of this study show that cooperative lane
changing enabled by multi-agent deep RL yields superior performance to human
drivers in term of traffic throughput, vehicle speed, number of stops per
vehicle, vehicle fuel efficiency, and emissions. The trained RL policy is
transferable and can be generalized to uncongested, moderately congested, and
extremely congested traffic conditions.
- Abstract(参考訳): マージやウィービングエリアなどの高速道路ボトルネックにおける渋滞時の車線変化は、さらに道路の容量を減少させる。
ディープ強化学習(RL)とコネクテッド・自動車両技術の出現は、協調車線変更による高速道路のボトルネックにおける移動性とエネルギー効率向上の可能なソリューションを提供する。
Deep RLは、エージェントが環境から学習することでパフォーマンスを向上させることができる機械学習手法のコレクションである。
本研究では,マルチエージェントのディープrlパラダイムを適用し,近位政策最適化を用いた分散協調型レーンチェンジコントローラを開発した。
分散制御戦略では、政策学習と行動報酬をローカルに評価し、各エージェント(車両)がグローバルな状態情報にアクセスできるようにする。
マルチエージェントディープRLは計算資源が低く、シングルエージェントディープRLよりもスケーラビリティが高いため、協調レーン変更のような時間に敏感なアプリケーションのための強力なツールである。
本研究では, 交通量, 車両速度, 車両当たりの停止数, 燃費, 排ガス量の観点から, 多エージェント深部RLによる協調車線変更は, 運転者にとって優れた性能を示すことを示した。
訓練されたRLポリシーは転送可能であり、非混雑で、適度に混雑し、非常に混雑した交通条件に一般化することができる。
関連論文リスト
- Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。
マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文 参考訳(メタデータ) (2024-03-18T16:13:02Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - LCS-TF: Multi-Agent Deep Reinforcement Learning-Based Intelligent
Lane-Change System for Improving Traffic Flow [16.34175752810212]
既存のインテリジェントレーン変更ソリューションは主に、エゴ車の性能を最適化することに焦点を当てている。
近年、マルチエージェント強化学習(MARL)に基づくアプローチへの関心が高まっている。
本稿では,エゴ車両の局部性能を両立させるために設計したAV用ハイブリッドMARLを用いたインテリジェントレーン交換システムを提案する。
論文 参考訳(メタデータ) (2023-03-16T04:03:17Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Cooperative Reinforcement Learning on Traffic Signal Control [3.759936323189418]
交通信号の制御は、道路交差点での車両の移動を調整することで、全体の走行時間を最小化することを目的とした、現実的な課題である。
既存の信号制御システムは、過度に単純化された情報とルールベースの方法に大きく依存している。
本稿では,交通信号制御最適化のための複数の報酬項をより正確に推定するために,年齢遅延重み付き協調型多目的アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-23T13:25:15Z) - Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected
and Automated Vehicles at Signalized Intersections [3.401874022426856]
視覚知覚法は車間通信(V2I)と統合され、より高モビリティとエネルギー効率を実現する。
HRLフレームワークには3つのコンポーネントがある。ルールベースのドライビングマネージャで、ルールベースのポリシーとRLポリシーの協調を運用する。
実験により, HRL法によりエネルギー消費量を12.70%削減し, 11.75%の移動時間を省くことができた。
論文 参考訳(メタデータ) (2022-01-19T19:31:12Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Vehicular Cooperative Perception Through Action Branching and Federated
Reinforcement Learning [101.64598586454571]
強化学習に基づく車両関連、リソースブロック(RB)割り当て、協調認識メッセージ(CPM)のコンテンツ選択を可能にする新しいフレームワークが提案されている。
車両全体のトレーニングプロセスをスピードアップするために、フェデレーションRLアプローチが導入されます。
その結果、フェデレーションRLはトレーニングプロセスを改善し、非フェデレーションアプローチと同じ時間内により良いポリシーを達成できることが示された。
論文 参考訳(メタデータ) (2020-12-07T02:09:15Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。