論文の概要: MARVEL: Multi-Agent Reinforcement-Learning for Large-Scale Variable
Speed Limits
- arxiv url: http://arxiv.org/abs/2310.12359v1
- Date: Wed, 18 Oct 2023 22:09:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-20 17:34:45.593405
- Title: MARVEL: Multi-Agent Reinforcement-Learning for Large-Scale Variable
Speed Limits
- Title(参考訳): MARVEL:大規模可変速度限界に対するマルチエージェント強化学習
- Authors: Yuhang Zhang, Marcos Quinones-Grueiro, Zhiyao Zhang, Yanbing Wang,
William Barbour, Gautam Biswas and Daniel Work
- Abstract要約: 可変速度制限(VSL)制御は、安全と移動性を高めるための交通管理戦略として有望である。
本研究は,高速道路回廊における大規模VSL制御を実現するためのマルチエージェント強化学習フレームワークであるMARVELを紹介する。
- 参考スコア(独自算出の注目度): 3.6447543781135754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Variable speed limit (VSL) control is a promising traffic management strategy
for enhancing safety and mobility. This work introduces MARVEL, a multi-agent
reinforcement learning (MARL) framework for implementing large-scale VSL
control on freeway corridors using only commonly available data. The agents
learn through a reward structure that incorporates adaptability to traffic
conditions, safety, and mobility; enabling coordination among the agents. The
proposed framework scales to cover corridors with many gantries thanks to a
parameter sharing among all VSL agents. The agents are trained in a
microsimulation environment based on a short freeway stretch with 8 gantries
spanning 7 miles and tested with 34 gantries spanning 17 miles of I-24 near
Nashville, TN. MARVEL improves traffic safety by 63.4% compared to the no
control scenario and enhances traffic mobility by 14.6% compared to a
state-of-the-practice algorithm that has been deployed on I-24. An
explainability analysis is undertaken to explore the learned policy under
different traffic conditions and the results provide insights into the
decision-making process of agents. Finally, we test the policy learned from the
simulation-based experiments on real input data from I-24 to illustrate the
potential deployment capability of the learned policy.
- Abstract(参考訳): 可変速度制限(VSL)制御は、安全と移動性を高めるための交通管理戦略として有望である。
本稿では,一般利用可能データのみを使用して,高速道路廊下で大規模vsl制御を実現するマルチエージェント強化学習(marl)フレームワークであるmarvelを紹介する。
エージェントは、交通条件、安全、モビリティへの適応性を取り入れた報酬構造を通じて学習し、エージェント間の協調を可能にする。
提案するフレームワークは,VSLエージェント間のパラメータ共有により,多数のガテリーを持つ廊下をカバーする。
エージェントは、TNのナッシュビル近郊17マイルのI-24にまたがる8ガントリと34ガントリからなる短い高速道路のストレッチに基づいて、マイクロシミュレーション環境で訓練される。
MARVELは制御不能なシナリオと比較して交通安全を63.4%改善し、I-24にデプロイされた最先端のアルゴリズムと比較して14.6%の交通移動率向上を実現している。
異なる交通条件下で学習した政策を探索するために説明可能性分析を行い,エージェントの意思決定過程に関する洞察を与える。
最後に、I-24からの実際の入力データに関するシミュレーションに基づく実験から得られたポリシーを検証し、学習されたポリシーの潜在的展開能力を示す。
関連論文リスト
- Large Language Models (LLMs) as Traffic Control Systems at Urban Intersections: A New Paradigm [5.233512464561313]
本研究では,Large Language Models (LLM) をトラヒックコントローラとして利用することで,トラヒック制御システムに新たなアプローチを提案する。
この研究は、論理的推論、シーン理解、意思決定能力を利用してスループットを最適化し、リアルタイムで交通状況に基づいたフィードバックを提供する。
論文 参考訳(メタデータ) (2024-11-16T19:23:52Z) - Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Learning a Robust Multiagent Driving Policy for Traffic Congestion
Reduction [35.10619995365986]
本稿では,様々なオープンネットワーク交通条件に頑健な学習型マルチエージェント駆動方式を提案する。
その結果,AV導入率を2%に抑えつつも,シミュレーションされた人為的政策よりも大きな改善が達成された。
論文 参考訳(メタデータ) (2021-12-03T18:53:34Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Scalable Multiagent Driving Policies For Reducing Traffic Congestion [32.08636346620938]
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
論文 参考訳(メタデータ) (2021-02-26T21:29:55Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。