論文の概要: Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2503.11488v1
- Date: Fri, 14 Mar 2025 15:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:08:19.052406
- Title: Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control
- Title(参考訳): Unicorn: 一般化可能なネットワーク側信号制御に向けたユニバーサルかつ協調的強化学習アプローチ
- Authors: Yifeng Zhang, Yilin Liu, Ping Gong, Peizhuo Li, Mingfeng Fan, Guillaume Sartoretti,
- Abstract要約: 適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
- 参考スコア(独自算出の注目度): 13.106167353085878
- License:
- Abstract: Adaptive traffic signal control (ATSC) is crucial in reducing congestion, maximizing throughput, and improving mobility in rapidly growing urban areas. Recent advancements in parameter-sharing multi-agent reinforcement learning (MARL) have greatly enhanced the scalable and adaptive optimization of complex, dynamic flows in large-scale homogeneous networks. However, the inherent heterogeneity of real-world traffic networks, with their varied intersection topologies and interaction dynamics, poses substantial challenges to achieving scalable and effective ATSC across different traffic scenarios. To address these challenges, we present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC. Specifically, we first propose a unified approach to map the states and actions of intersections with varying topologies into a common structure based on traffic movements. Next, we design a Universal Traffic Representation (UTR) module with a decoder-only network for general feature extraction, enhancing the model's adaptability to diverse traffic scenarios. Additionally, we incorporate an Intersection Specifics Representation (ISR) module, designed to identify key latent vectors that represent the unique intersection's topology and traffic dynamics through variational inference techniques. To further refine these latent representations, we employ a contrastive learning approach in a self-supervised manner, which enables better differentiation of intersection-specific features. Moreover, we integrate the state-action dependencies of neighboring agents into policy optimization, which effectively captures dynamic agent interactions and facilitates efficient regional collaboration. Our results show that Unicorn outperforms other methods across various evaluation metrics, highlighting its potential in complex, dynamic traffic networks.
- Abstract(参考訳): 適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
しかし、現実世界の交通ネットワークの本質的な異質性は、その様々な交叉トポロジと相互作用のダイナミクスによって、様々な交通シナリオにおいてスケーラブルで効果的なATSCを実現する上で大きな課題を提起している。
これらの課題に対処するために、ネットワーク全体の効率よく適応可能なATSC用に設計された、普遍的で協調的なMARLフレームワークUnicornを提案する。
具体的には、まず、様々なトポロジを持つ交差点の状態と動作を、交通運動に基づく共通構造にマッピングする統一的なアプローチを提案する。
次に,一般的な特徴抽出のためのデコーダのみのネットワークを備えたUTR(Universal Traffic Representation)モジュールを設計し,多様な交通シナリオに対するモデルの適応性を向上する。
さらに,異種交点のトポロジやトラフィックダイナミクスを表す重要な潜在ベクトルを,変分推論手法により識別するインターセクション特化表現(ISR)モジュールを組み込んだ。
これらの潜伏表現をさらに洗練するために、自己教師付き方式でコントラスト学習アプローチを採用し、交叉特化特徴のより良い識別を可能にした。
さらに、近隣エージェントの状態-作用依存性をポリシー最適化に統合し、動的エージェントの相互作用を効果的に捉え、効率的な地域協力を促進する。
この結果から、Unicornは様々な評価指標で他の手法よりも優れており、複雑な動的トラフィックネットワークにおけるその可能性を強調している。
関連論文リスト
- Neighbor-Aware Reinforcement Learning for Mixed Traffic Optimization in Large-scale Networks [1.9413548770753521]
本稿では,交差する交差点を横断する混在トラフィックを調整するための強化学習フレームワークを提案する。
我々の重要な貢献は、RVがネットワーク間のバランスの取れた分散を維持することができる隣り合わせの報酬メカニズムである。
その結果,最先端の単一断面制御方式と比較して平均待ち時間を39.2%削減できることがわかった。
論文 参考訳(メタデータ) (2024-12-17T07:35:56Z) - TransferLight: Zero-Shot Traffic Signal Control on any Road-Network [0.6274767633959003]
TransferLightは、ロードネットワーク全体の堅牢な一般化のために設計された新しいフレームワークである。
階層的で、異質で、有向的なグラフニューラルネットワークアーキテクチャは、トラフィックの粒度の動態を効果的に捉えます。
我々は、ゼロショットを任意の道路ネットワークに再トレーニングせずにスケールする、単一の重み付けポリシーを開発した。
論文 参考訳(メタデータ) (2024-12-12T20:52:12Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - CityLight: A Universal Model for Coordinated Traffic Signal Control in City-scale Heterogeneous Intersections [23.5766158697276]
CityLightは、交差点の状態表現を整列し、狭い相対的な交通関係型を符号化して、近隣の交差点を均一な相対的な交通影響空間に投影する普遍的な表現モジュールである。
数百から数万の交差点での実験では、CityLightの驚くべき有効性と一般化性が確認され、全体的なパフォーマンスは11.68%、スループットにおける転送シナリオは22.59%向上した。
論文 参考訳(メタデータ) (2024-06-04T09:10:14Z) - Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。
AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。
2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2023-06-15T14:50:27Z) - Feudal Multi-Agent Reinforcement Learning with Adaptive Network
Partition for Traffic Signal Control [44.09601435685123]
マルチエージェント強化学習 (MARL) を応用し, 交通信号制御に大きな可能性を示した。
以前の作業では、トラフィックネットワークを複数のリージョンに分割し、封建的構造におけるエージェントのポリシーを学ぶ。
適応型ネットワーク分割を用いた新しい封建的MARL手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T09:02:10Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Multi-Agent Routing Value Iteration Network [88.38796921838203]
疎結合グラフの学習値に基づいてマルチエージェントルーティングを行うことができるグラフニューラルネットワークに基づくモデルを提案する。
最大25ノードのグラフ上で2つのエージェントでトレーニングしたモデルでは,より多くのエージェントやノードを持つ状況に容易に一般化できることが示されている。
論文 参考訳(メタデータ) (2020-07-09T22:16:45Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。