論文の概要: MARVEL: Multi-Agent Reinforcement-Learning for Large-Scale Variable Speed Limits
- arxiv url: http://arxiv.org/abs/2310.12359v2
- Date: Mon, 18 Mar 2024 01:04:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 03:22:50.621074
- Title: MARVEL: Multi-Agent Reinforcement-Learning for Large-Scale Variable Speed Limits
- Title(参考訳): MARVEL:大規模可変速度限界に対するマルチエージェント強化学習
- Authors: Yuhang Zhang, Marcos Quinones-Grueiro, Zhiyao Zhang, Yanbing Wang, William Barbour, Gautam Biswas, Daniel Work,
- Abstract要約: 可変速度制限(VSL)制御は、世界展開において有望な高速道路交通管理戦略として機能する。
これまでのVSL制御アルゴリズムの多くはルールベースであり、様々な複雑なトラフィックシナリオ下での一般化性に欠けていた。
実環境に配置したハイウェイ廊下における大規模VSL制御のための新しいフレームワークであるMARVELを提案する。
- 参考スコア(独自算出の注目度): 3.470712974836622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variable Speed Limit (VSL) control acts as a promising highway traffic management strategy with worldwide deployment, which can enhance traffic safety by dynamically adjusting speed limits according to real-time traffic conditions. Most of the deployed VSL control algorithms so far are rule-based, lacking generalizability under varying and complex traffic scenarios. In this work, we propose MARVEL (Multi-Agent Reinforcement-learning for large-scale Variable spEed Limits), a novel framework for large-scale VSL control on highway corridors with real-world deployment settings. MARVEL utilizes only sensing information observable in the real world as state input and learns through a reward structure that incorporates adaptability to traffic conditions, safety, and mobility, thereby enabling multi-agent coordination. With parameter sharing among all VSL agents, the proposed framework scales to cover corridors with many agents. The policies are trained in a microscopic traffic simulation environment, focusing on a short freeway stretch with 8 VSL agents spanning 7 miles. For testing, these policies are applied to a more extensive network with 34 VSL agents spanning 17 miles of I-24 near Nashville, TN, USA. MARVEL-based method improves traffic safety by 63.4% compared to the no control scenario and enhances traffic mobility by 58.6% compared to a state-of-the-practice algorithm that has been deployed on I-24. Besides, we conduct an explainability analysis to examine the decision-making process of the agents and explore the learned policy under different traffic conditions. Finally, we test the response of the policy learned from the simulation-based experiments with real-world data collected from I-24 and illustrate its deployment capability.
- Abstract(参考訳): 可変速度制限 (VSL) 制御は, リアルタイム交通条件に応じて速度制限を動的に調整することにより, 交通安全を向上し, 世界展開に期待できる高速道路交通管理戦略として機能する。
これまでのVSL制御アルゴリズムの多くはルールベースであり、様々な複雑なトラフィックシナリオ下での一般化性に欠けていた。
そこで本研究では,実環境に配置したハイウェイ廊下における大規模VSL制御のための新しいフレームワークであるMARVEL(Multi-Agent Reinforcement-learning for large-scale Variable spEed Limits)を提案する。
MARVELは、現実世界で観測可能な感覚情報のみを状態入力として利用し、交通条件、安全性、移動性への適応性を組み込んだ報酬構造を通して学習することにより、マルチエージェント協調を可能にする。
全てのVSLエージェント間のパラメータ共有により、提案するフレームワークは、多くのエージェントで廊下をカバーするためにスケールする。
ポリシーは、顕微鏡的な交通シミュレーション環境で訓練され、高速道路の短い伸びに焦点が当てられ、8つのVSLエージェントが7マイルにわたっている。
テストのために、これらのポリシーは、アメリカTNのナッシュビル近郊17マイルのI-24に34のVSLエージェントを配置した、より広範なネットワークに適用される。
MARVELをベースとした手法は、制御不能なシナリオと比較して交通安全を63.4%改善し、I-24にデプロイされた最先端のアルゴリズムと比較して58.6%の交通移動率向上を実現している。
さらに,エージェントの意思決定過程を検証し,異なる交通条件下での学習方針を検討するために,説明可能性分析を行う。
最後に、I-24から収集した実世界のデータを用いたシミュレーションに基づく実験から得られたポリシーの応答を検証し、その展開能力について説明する。
関連論文リスト
- Large Language Models (LLMs) as Traffic Control Systems at Urban Intersections: A New Paradigm [5.233512464561313]
本研究では,Large Language Models (LLM) をトラヒックコントローラとして利用することで,トラヒック制御システムに新たなアプローチを提案する。
この研究は、論理的推論、シーン理解、意思決定能力を利用してスループットを最適化し、リアルタイムで交通状況に基づいたフィードバックを提供する。
論文 参考訳(メタデータ) (2024-11-16T19:23:52Z) - Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Learning a Robust Multiagent Driving Policy for Traffic Congestion
Reduction [35.10619995365986]
本稿では,様々なオープンネットワーク交通条件に頑健な学習型マルチエージェント駆動方式を提案する。
その結果,AV導入率を2%に抑えつつも,シミュレーションされた人為的政策よりも大きな改善が達成された。
論文 参考訳(メタデータ) (2021-12-03T18:53:34Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Scalable Multiagent Driving Policies For Reducing Traffic Congestion [32.08636346620938]
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
論文 参考訳(メタデータ) (2021-02-26T21:29:55Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。