論文の概要: CoordLight: Learning Decentralized Coordination for Network-Wide Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2603.24366v1
- Date: Wed, 25 Mar 2026 14:46:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.338459
- Title: CoordLight: Learning Decentralized Coordination for Network-Wide Traffic Signal Control
- Title(参考訳): CoordLight: ネットワーク側信号制御のための分散コーディネート学習
- Authors: Yifeng Zhang, Harsh Goel, Peizhuo Li, Mehul Damani, Sandeep Chinchali, Guillaume Sartoretti,
- Abstract要約: CoordLightは、個々のジャンクション(エージェント)における意思決定を強化することによって、近隣のトラフィックを改善するために設計されたフレームワークである。
我々は,隣接エージェント間の状態と行動依存性を識別するアテンション機構を統合した,Neighbor-aware Policy Optimization (NAPO) という高度なMARLアルゴリズムを提案する。
我々は、CoordLightが、様々なトラフィックフローを持つ多様なトラフィックネットワークにおいて、一貫して優れた性能を示すことを実証的に示す。
- 参考スコア(独自算出の注目度): 15.468107943726617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive traffic signal control (ATSC) is crucial in alleviating congestion, maximizing throughput and promoting sustainable mobility in ever-expanding cities. Multi-Agent Reinforcement Learning (MARL) has recently shown significant potential in addressing complex traffic dynamics, but the intricacies of partial observability and coordination in decentralized environments still remain key challenges in formulating scalable and efficient control strategies. To address these challenges, we present CoordLight, a MARL-based framework designed to improve intra-neighborhood traffic by enhancing decision-making at individual junctions (agents), as well as coordination with neighboring agents, thereby scaling up to network-level traffic optimization. Specifically, we introduce the Queue Dynamic State Encoding (QDSE), a novel state representation based on vehicle queuing models, which strengthens the agents' capability to analyze, predict, and respond to local traffic dynamics. We further propose an advanced MARL algorithm, named Neighbor-aware Policy Optimization (NAPO). It integrates an attention mechanism that discerns the state and action dependencies among adjacent agents, aiming to facilitate more coordinated decision-making, and to improve policy learning updates through robust advantage calculation. This enables agents to identify and prioritize crucial interactions with influential neighbors, thus enhancing the targeted coordination and collaboration among agents. Through comprehensive evaluations against state-of-the-art traffic signal control methods over three real-world traffic datasets composed of up to 196 intersections, we empirically show that CoordLight consistently exhibits superior performance across diverse traffic networks with varying traffic flows. The code is available at https://github.com/marmotlab/CoordLight
- Abstract(参考訳): 適応交通信号制御 (ATSC) は, 渋滞の緩和, スループットの最大化, 持続可能モビリティの促進に不可欠である。
MARL(Multi-Agent Reinforcement Learning)は、最近、複雑なトラフィックダイナミクスに対処する大きな可能性を示しているが、分散環境における部分観測可能性と調整の複雑さは、スケーラブルで効率的な制御戦略を定式化する上で依然として重要な課題である。
これらの課題に対処するため,MARL ベースのフレームワークであるCoordLight を提案する。このフレームワークは,個々のジャンクション(エージェント)における意思決定を向上し,近隣エージェントとの連携を強化し,ネットワークレベルのトラフィック最適化にスケールアップする。
具体的には、車両キューモデルに基づく新しい状態表現であるQuue Dynamic State Encoding (QDSE)を導入し、ローカルトラフィックのダイナミクスを分析し、予測し、応答するエージェントの能力を強化する。
さらに,Nighbor-aware Policy Optimization (NAPO) と呼ばれる高度なMARLアルゴリズムを提案する。
これは、隣接するエージェント間の状態と行動の依存関係を識別するアテンションメカニズムを統合し、より協調的な意思決定を促進し、堅牢な優位性計算を通じてポリシー学習更新を改善することを目的としている。
これにより、エージェントは、影響力のある隣人との重要な相互作用を識別し、優先順位付けし、エージェント間の協調や協調を促進することができる。
最大196の交差点からなる3つの実世界の交通データセットに対する最先端の交通信号制御手法に対する総合的な評価を通じて、CoordLightは、トラフィックフローの異なる多様な交通ネットワークにおいて、一貫して優れた性能を示すことを示す。
コードはhttps://github.com/marmotlab/CoordLightで入手できる。
関連論文リスト
- Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations [5.784337914162491]
交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
論文 参考訳(メタデータ) (2025-11-01T13:18:50Z) - Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文 参考訳(メタデータ) (2025-10-21T02:14:11Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control [13.106167353085878]
適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
論文 参考訳(メタデータ) (2025-03-14T15:13:42Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - AgentsCoMerge: Large Language Model Empowered Collaborative Decision Making for Ramp Merging [46.69777653051523]
ランプの合流は交通システムのボトルネックの1つであり、交通渋滞、事故、深刻な二酸化炭素排出を引き起こすのが普通である。
我々は,大規模言語モデル(LLM)を活用するための新しい協調的意思決定フレームワーク,AgentsCoMergeを提案する。
論文 参考訳(メタデータ) (2024-08-07T08:34:48Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - SocialLight: Distributed Cooperation Learning towards Network-Wide
Traffic Signal Control [7.387226437589183]
SocialLightは交通信号制御のための新しいマルチエージェント強化学習手法である。
地元におけるエージェントの個人的限界貢献を推定することにより、協力的な交通規制政策を学習する。
我々は,2つの交通シミュレータの標準ベンチマークにおける最先端の交通信号制御手法に対して,トレーニングネットワークをベンチマークした。
論文 参考訳(メタデータ) (2023-04-20T12:41:25Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。