論文の概要: CROSS: A Mixture-of-Experts Reinforcement Learning Framework for Generalizable Large-Scale Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2603.24930v1
- Date: Thu, 26 Mar 2026 01:48:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.041254
- Title: CROSS: A Mixture-of-Experts Reinforcement Learning Framework for Generalizable Large-Scale Traffic Signal Control
- Title(参考訳): CROSS: 大規模交通信号制御の汎用化のためのMixture-of-Experts Reinforcement Learning Framework
- Authors: Xibei Chen, Yifeng Zhang, Yuxiang Xiao, Mingfeng Fan, Maonan Wang, Guillaume Sartoretti,
- Abstract要約: 汎用適応型信号制御(ATSC)のための新しいMixture-of-Experts(MoE)ベースの分散RLフレームワークであるCROSSを提案する。
まず、予測コントラストクラスタリング(PCC)モジュールを導入し、短期状態遷移を予測して潜在トラフィックパターンを特定し、続いてクラスタリングとコントラスト学習を行い、パターンレベルの表現を強化する。
さらに、複数の専門家と共有ポリシーを強化するScenario-Adaptive MoEモジュールを設計し、適応的な特殊化とより柔軟なシナリオ固有の戦略を可能にします。
- 参考スコア(独自算出の注目度): 11.628278541732513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in robotics, automation, and artificial intelligence have enabled urban traffic systems to operate with increasing autonomy towards future smart cities, powered in part by the development of adaptive traffic signal control (ATSC), which dynamically optimizes signal phases to mitigate congestion and optimize traffic. However, achieving effective and generalizable large-scale ATSC remains a significant challenge due to the diverse intersection topologies and highly dynamic, complex traffic demand patterns across the network. Existing RL-based methods typically use a single shared policy for all scenarios, whose limited representational capacity makes it difficult to capture diverse traffic dynamics and generalize to unseen environments. To address these challenges, we propose CROSS, a novel Mixture-of-Experts (MoE)-based decentralized RL framework for generalizable ATSC. We first introduce a Predictive Contrastive Clustering (PCC) module that forecasts short-term state transitions to identify latent traffic patterns, followed by clustering and contrastive learning to enhance pattern-level representation. We further design a Scenario-Adaptive MoE module that augments a shared policy with multiple experts, thus enabling adaptive specialization and more flexible scenario-specific strategies. We conduct extensive experiments in the SUMO simulator on both synthetic and real-world traffic datasets. Compared with state-of-the-art baselines, CROSS achieves superior performance and generalization through improved representation of diverse traffic scenarios.
- Abstract(参考訳): 近年のロボティクス、自動化、人工知能の進歩により、都市交通システムは、交通渋滞を緩和し、交通を最適化するために信号の位相を動的に最適化する適応交通信号制御(ATSC)の開発によって、将来のスマートシティに向けて自律性を高めることができるようになった。
しかし,ネットワーク全体にわたる多様な交叉トポロジと,非常にダイナミックで複雑な交通需要パターンのため,効果的で一般化可能な大規模ATSCの実現は依然として大きな課題である。
既存のRLベースのメソッドは通常、すべてのシナリオに対して単一の共有ポリシを使用するが、表現能力の制限により、多様なトラフィックのダイナミクスを捕捉し、目に見えない環境に一般化することは困難である。
これらの課題に対処するため、我々は、一般化可能なATSCのための新しいMixture-of-Experts (MoE)ベースの分散RLフレームワークであるCROSSを提案する。
まず、予測コントラストクラスタリング(PCC)モジュールを導入し、短期状態遷移を予測して潜在トラフィックパターンを特定し、続いてクラスタリングとコントラスト学習を行い、パターンレベルの表現を強化する。
さらに、複数の専門家と共有ポリシーを強化するScenario-Adaptive MoEモジュールを設計し、適応的な特殊化とより柔軟なシナリオ固有の戦略を可能にします。
我々は,SUMOシミュレータにおいて,合成および実世界のトラフィックデータセットについて広範な実験を行った。
最先端のベースラインと比較して、CROSSは多様なトラフィックシナリオの表現を改善することにより、優れたパフォーマンスと一般化を実現している。
関連論文リスト
- Wireless Traffic Prediction with Large Language Model [54.07581399989292]
TIDESは、無線トラフィック予測のための空間時間相関をキャプチャする新しいフレームワークである。
TIDESは過剰なトレーニングオーバーヘッドを発生させることなく、ドメイン固有のパターンへの効率的な適応を実現する。
この結果から,将来の6Gシステムにおいて,空間認識をLCMベースの予測器に統合することが,スケーラブルでインテリジェントなネットワーク管理の鍵であることが示唆された。
論文 参考訳(メタデータ) (2025-12-19T04:47:40Z) - Multi-residual Mixture of Experts Learning for Cooperative Control in Multi-vehicle Systems [5.5597941107270215]
ラグランジアン交通制御のためのMRMEL(Multi-Residual Mixture of Expert Learning)を提案する。
MRMELは、残留補正を学習することで、最適でない名目AV制御ポリシーを強化する。
アトランタ, ダラスフォートワース, ソルトレイクシティの信号化交差点における協調的エコドライブのケーススタディを用いて, MRMELの検証を行った。
論文 参考訳(メタデータ) (2025-07-14T00:17:12Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control [13.106167353085878]
適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
論文 参考訳(メタデータ) (2025-03-14T15:13:42Z) - TransferLight: Zero-Shot Traffic Signal Control on any Road-Network [0.6274767633959003]
TransferLightは、ロードネットワーク全体の堅牢な一般化のために設計された新しいフレームワークである。
階層的で、異質で、有向的なグラフニューラルネットワークアーキテクチャは、トラフィックの粒度の動態を効果的に捉えます。
我々は、ゼロショットを任意の道路ネットワークに再トレーニングせずにスケールする、単一の重み付けポリシーを開発した。
論文 参考訳(メタデータ) (2024-12-12T20:52:12Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。
AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。
2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-06-15T14:50:27Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。