論文の概要: Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control
- arxiv url: http://arxiv.org/abs/2506.12453v1
- Date: Sat, 14 Jun 2025 11:18:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.20681
- Title: Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control
- Title(参考訳): 大規模自律交通制御における拡張型MARLのためのトポロジ支援時空間パターン分離
- Authors: Rongpeng Li, Jianhang Zhu, Jiahao Huang, Zhifeng Zhao, Honggang Zhang,
- Abstract要約: 本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。
大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て, 位相支援型空間パターンアンタングリング (TSD) 強化型MoEを提案する。
実世界の交通シナリオにおいて行われた大規模な実験は、包括的な理論的分析とともに、提案フレームワークの優れた性能を検証した。
- 参考スコア(独自算出の注目度): 14.929720580977152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent Transportation Systems (ITSs) have emerged as a promising solution towards ameliorating urban traffic congestion, with Traffic Signal Control (TSC) identified as a critical component. Although Multi-Agent Reinforcement Learning (MARL) algorithms have shown potential in optimizing TSC through real-time decision-making, their scalability and effectiveness often suffer from large-scale and complex environments. Typically, these limitations primarily stem from a fundamental mismatch between the exponential growth of the state space driven by the environmental heterogeneities and the limited modeling capacity of current solutions. To address these issues, this paper introduces a novel MARL framework that integrates Dynamic Graph Neural Networks (DGNNs) and Topological Data Analysis (TDA), aiming to enhance the expressiveness of environmental representations and improve agent coordination. Furthermore, inspired by the Mixture of Experts (MoE) architecture in Large Language Models (LLMs), a topology-assisted spatial pattern disentangling (TSD)-enhanced MoE is proposed, which leverages topological signatures to decouple graph features for specialized processing, thus improving the model's ability to characterize dynamic and heterogeneous local observations. The TSD module is also integrated into the policy and value networks of the Multi-agent Proximal Policy Optimization (MAPPO) algorithm, further improving decision-making efficiency and robustness. Extensive experiments conducted on real-world traffic scenarios, together with comprehensive theoretical analysis, validate the superior performance of the proposed framework, highlighting the model's scalability and effectiveness in addressing the complexities of large-scale TSC tasks.
- Abstract(参考訳): インテリジェントトランスポーテーションシステム(ITS)は、交通信号制御(TSC)を重要コンポーネントとして、都市交通渋滞を改善するための有望なソリューションとして登場した。
MARL(Multi-Agent Reinforcement Learning)アルゴリズムは、リアルタイム意思決定を通じてTSCを最適化する可能性を示しているが、そのスケーラビリティと有効性は大規模で複雑な環境に悩まされることが多い。
通常、これらの制限は主に、環境の不均一性によって引き起こされる状態空間の指数的成長と、現在の解の限られたモデリング能力の基本的なミスマッチに由来する。
本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。
さらに,大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て,トポロジ支援空間パターンアンタングリング (TSD) 強化 MoE を提案する。
TSDモジュールはまた、MAPPO(Multi-Adnt Proximal Policy Optimization)アルゴリズムのポリシーと価値ネットワークに統合され、意思決定効率と堅牢性をさらに向上する。
実世界の交通シナリオにおける大規模な実験と包括的な理論的解析により,提案手法の優れた性能を検証し,大規模TSCタスクの複雑さに対処する上でのモデルのスケーラビリティと有効性を強調した。
関連論文リスト
- Topological Adaptive Least Mean Squares Algorithms over Simplicial Complexes [13.291627429657416]
本稿では, 単体錯体上での動的流れ信号を処理するための新しい適応フレームワークを提案する。
本稿では,時間変化のあるエッジサブセット上で観測されたストリーミング信号を効率的に処理するトポロジカルLMSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-05-29T06:55:19Z) - PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文 参考訳(メタデータ) (2025-05-06T15:18:38Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control [13.106167353085878]
適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。
パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。
We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
論文 参考訳(メタデータ) (2025-03-14T15:13:42Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Optimization of geological carbon storage operations with multimodal latent dynamic model and deep reinforcement learning [1.8549313085249324]
本稿では,高速フロー予測とGCSの制御最適化のためのディープラーニングフレームワークであるMLDモデルを紹介する。
既存のモデルとは異なり、MDDは多様な入力モダリティをサポートし、包括的なデータインタラクションを可能にする。
この手法は従来の手法よりも優れており、計算資源を60%以上削減し、最も高いNPVを達成する。
論文 参考訳(メタデータ) (2024-06-07T01:30:21Z) - Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。
本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。
我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文 参考訳(メタデータ) (2024-02-09T07:45:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。