論文の概要: HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2506.14391v1
- Date: Tue, 17 Jun 2025 10:39:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.433403
- Title: HiLight: A Hierarchical Reinforcement Learning Framework with Global Adversarial Guidance for Large-Scale Traffic Signal Control
- Title(参考訳): HiLight: 大規模信号制御のためのグローバルアドバイザリガイダンスを備えた階層型強化学習フレームワーク
- Authors: Yaqiao Zhu, Hongkai Wen, Geyong Min, Man Luo,
- Abstract要約: HiLightは大規模信号制御のためのグローバルな逆方向誘導を備えた階層型強化学習フレームワークである。
合成および実世界のベンチマークでHiLightを評価し,交通条件の異なる大規模マンハッタンネットワークを構築した。
- 参考スコア(独自算出の注目度): 22.185954207474907
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient traffic signal control (TSC) is essential for mitigating urban congestion, yet existing reinforcement learning (RL) methods face challenges in scaling to large networks while maintaining global coordination. Centralized RL suffers from scalability issues, while decentralized approaches often lack unified objectives, resulting in limited network-level efficiency. In this paper, we propose HiLight, a hierarchical reinforcement learning framework with global adversarial guidance for large-scale TSC. HiLight consists of a high-level Meta-Policy, which partitions the traffic network into subregions and generates sub-goals using a Transformer-LSTM architecture, and a low-level Sub-Policy, which controls individual intersections with global awareness. To improve the alignment between global planning and local execution, we introduce an adversarial training mechanism, where the Meta-Policy generates challenging yet informative sub-goals, and the Sub-Policy learns to surpass these targets, leading to more effective coordination. We evaluate HiLight across both synthetic and real-world benchmarks, and additionally construct a large-scale Manhattan network with diverse traffic conditions, including peak transitions, adverse weather, and holiday surges. Experimental results show that HiLight exhibits significant advantages in large-scale scenarios and remains competitive across standard benchmarks of varying sizes.
- Abstract(参考訳): 交通信号の効率的な制御(TSC)は都市交通渋滞の緩和に不可欠であるが、既存の強化学習(RL)手法は、グローバルな調整を維持しながら大規模ネットワークへのスケーリングにおいて課題に直面している。
集中型RLはスケーラビリティの問題に悩まされる一方、分散型アプローチは統合された目的を欠くことが多く、ネットワークレベルの効率が制限される。
本稿では,大規模TSCのためのグローバルな逆方向ガイダンスを備えた階層型強化学習フレームワークであるHiLightを提案する。
HiLightは、トラフィックネットワークをサブリージョンに分割し、Transformer-LSTMアーキテクチャを使ってサブゴールを生成する高レベルなMeta-Policyと、グローバルな認識と個別の交差点を制御する低レベルなSub-Policyで構成されている。
グローバルな計画とローカルな実行の整合性を改善するために,メタ・ポリシーが挑戦的かつ情報に富むサブゴールを生成し,サブ・ポリシーがこれらの目標を超えることを学習し,より効果的なコーディネーションを実現するための対向的なトレーニング機構を導入する。
合成および実世界のベンチマークでHiLightを評価し,ピーク遷移,悪天候,ホリデーサージなど多様な交通条件を持つ大規模マンハッタンネットワークを構築した。
実験の結果、HiLightは大規模シナリオにおいて大きな利点を示し、さまざまなサイズの標準ベンチマークで競争力を維持していることがわかった。
関連論文リスト
- Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control [5.570882985800125]
マルチエージェント強化学習(MARL)は、適応的な交通信号制御(ATSC)を約束している。
MARLは広範なデータ共有と通信要求のために制約に直面している。
我々はATSCのための階層型統合強化学習(HFRL)を提案する。
論文 参考訳(メタデータ) (2025-04-07T23:02:59Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - CityLight: A Universal Model for Coordinated Traffic Signal Control in City-scale Heterogeneous Intersections [23.5766158697276]
CityLightは、交差点の状態表現を整列し、狭い相対的な交通関係型を符号化して、近隣の交差点を均一な相対的な交通影響空間に投影する普遍的な表現モジュールである。
数百から数万の交差点での実験では、CityLightの驚くべき有効性と一般化性が確認され、全体的なパフォーマンスは11.68%、スループットにおける転送シナリオは22.59%向上した。
論文 参考訳(メタデータ) (2024-06-04T09:10:14Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Cross-receptive Focused Inference Network for Lightweight Image
Super-Resolution [64.25751738088015]
トランスフォーマーに基づく手法は、単一画像超解像(SISR)タスクにおいて顕著な性能を示した。
動的に特徴を抽出するために文脈情報を組み込む必要がある変換器は無視される。
我々は,CNNとTransformerを混合したCTブロックのカスケードで構成される,軽量なクロスレセプティブ・フォーカスド・推論・ネットワーク(CFIN)を提案する。
論文 参考訳(メタデータ) (2022-07-06T16:32:29Z) - Locality Matters: A Scalable Value Decomposition Approach for
Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。
本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文 参考訳(メタデータ) (2021-09-22T10:08:15Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。