論文の概要: A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2603.12096v1
- Date: Thu, 12 Mar 2026 16:02:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.201173
- Title: A Robust and Efficient Multi-Agent Reinforcement Learning Framework for Traffic Signal Control
- Title(参考訳): 交通信号制御のためのロバストかつ効率的なマルチエージェント強化学習フレームワーク
- Authors: Sheng-You Huang, Hsiao-Chuan Chang, Yen-Chi Chen, Ting-Han Wei, I-Hau Yeh, Sheng-Yao Kuan, Chien-Yao Wang, Hsuan-Han Lee, I-Chen Wu,
- Abstract要約: 本稿では,ビシム交通シミュレータで検証された頑健なマルチエージェント強化学習フレームワークを提案する。
実験の結果,我々のフレームワークは標準のRLベースラインを上回る性能を示し,平均待ち時間を10%以上削減した。
- 参考スコア(独自算出の注目度): 14.135215838687207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement Learning (RL) in Traffic Signal Control (TSC) faces significant hurdles in real-world deployment due to limited generalization to dynamic traffic flow variations. Existing approaches often overfit static patterns and use action spaces incompatible with driver expectations. This paper proposes a robust Multi-Agent Reinforcement Learning (MARL) framework validated in the Vissim traffic simulator. The framework integrates three mechanisms: (1) Turning Ratio Randomization, a training strategy that exposes agents to dynamic turning probabilities to enhance robustness against unseen scenarios; (2) a stability-oriented Exponential Phase Duration Adjustment action space, which balances responsiveness and precision through cyclical, exponential phase adjustments; and (3) a Neighbor-Based Observation scheme utilizing the MAPPO algorithm with Centralized Training with Decentralized Execution (CTDE). By leveraging centralized updates, this approach approximates the efficacy of global observations while maintaining scalable local communication. Experimental results demonstrate that our framework outperforms standard RL baselines, reducing average waiting time by over 10%. The proposed model exhibits superior generalization in unseen traffic scenarios and maintains high control stability, offering a practical solution for adaptive signal control.
- Abstract(参考訳): 交通信号制御 (TSC) における強化学習 (Reinforcement Learning, RL) は, 動的交通流の変動に限定した一般化のため, 現実の展開において大きな障害に直面している。
既存のアプローチは、しばしば静的パターンに適合し、ドライバの期待と互換性のないアクションスペースを使用する。
本稿では,ビシム交通シミュレータで検証された頑健なマルチエージェント強化学習(MARL)フレームワークを提案する。
この枠組みは,(1) エージェントを動的旋回確率に曝露して不審なシナリオに対して堅牢性を高める訓練戦略である旋回ランダム化,(2) 周期的,指数的位相調整による応答性と精度のバランスをとる安定指向の指数位相継続調整行動空間,(3) MAPPOアルゴリズムと分散実行による集中的トレーニング(CTDE)を用いた近隣観測スキームの3つのメカニズムを統合した。
集中的な更新を活用することで、スケーラブルなローカル通信を維持しながら、グローバルな観測の有効性を近似する。
実験の結果,我々のフレームワークは標準のRLベースラインを上回る性能を示し,平均待ち時間を10%以上削減した。
提案モデルでは, 交通シナリオの一般化に優れ, 高い制御安定性を保ち, 適応的な信号制御のための実用的なソリューションを提供する。
関連論文リスト
- Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - Quantifying Distribution Shift in Traffic Signal Control with Histogram-Based GEH Distance [0.6961253535504978]
本稿では,交通シナリオを需要ヒストグラムとして表現し,分散シフトを定量化する手法を提案する。
NEMAアクティベートコントローラと強化学習コントローラの両方を用いて,20のシミュレーションシナリオに対するアプローチを検証する。
全体として、この手法は、以前公表した手法よりも分散シフトによる性能劣化を予測できる。
論文 参考訳(メタデータ) (2025-11-16T11:05:02Z) - Robust Single-Agent Reinforcement Learning for Regional Traffic Signal Control Under Demand Fluctuations [5.784337914162491]
交通渋滞は、主に交差点の待ち行列によって引き起こされ、都市生活水準、安全性、環境品質、経済効率に大きな影響を及ぼす。
本研究では,地域適応型TSCのための新しい単エージェント強化学習フレームワークを提案する。
このフレームワークは堅牢な反ゆらぎ能力を示し、待ち時間を大幅に短縮する。
論文 参考訳(メタデータ) (2025-11-01T13:18:50Z) - Reinforcement Learning Based Traffic Signal Design to Minimize Queue Lengths [15.439906983758808]
本稿では、RL(Reinforcement Learning)を活用して全信号位相の待ち行列長を最小化する適応型TSCフレームワークを提案する。
提案アルゴリズムは,都市交通シミュレータ(SUMO)を用いて実装されている。
最も優れた構成は、従来のWebster法と比較して平均キュー長を約29%削減する。
論文 参考訳(メタデータ) (2025-09-26T01:23:30Z) - Robustness of Reinforcement Learning-Based Traffic Signal Control under Incidents: A Comparative Study [4.731967623788092]
強化学習に基づく交通信号制御 (RL-TSC) が都市移動性向上のための有望なアプローチとして浮上している。
本研究では,動的インシデントシナリオ下でのRL-TSC手法のトレーニングと評価を行うオープンソースSUMOベースのシミュレーションフレームワークであるT-REXを紹介する。
論文 参考訳(メタデータ) (2025-06-16T08:15:29Z) - Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0]
都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文 参考訳(メタデータ) (2025-05-20T15:59:44Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。