Fugu-MT 論文翻訳(概要): Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control

論文の概要: Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control

arxiv url: http://arxiv.org/abs/2506.12453v1
Date: Sat, 14 Jun 2025 11:18:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 17:28:46.20681
Title: Topology-Assisted Spatio-Temporal Pattern Disentangling for Scalable MARL in Large-scale Autonomous Traffic Control
Title（参考訳）: 大規模自律交通制御における拡張型MARLのためのトポロジ支援時空間パターン分離
Authors: Rongpeng Li, Jianhang Zhu, Jiahao Huang, Zhifeng Zhao, Honggang Zhang,
Abstract要約: 本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て, 位相支援型空間パターンアンタングリング (TSD) 強化型MoEを提案する。実世界の交通シナリオにおいて行われた大規模な実験は、包括的な理論的分析とともに、提案フレームワークの優れた性能を検証した。
参考スコア（独自算出の注目度）: 14.929720580977152
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Intelligent Transportation Systems (ITSs) have emerged as a promising solution towards ameliorating urban traffic congestion, with Traffic Signal Control (TSC) identified as a critical component. Although Multi-Agent Reinforcement Learning (MARL) algorithms have shown potential in optimizing TSC through real-time decision-making, their scalability and effectiveness often suffer from large-scale and complex environments. Typically, these limitations primarily stem from a fundamental mismatch between the exponential growth of the state space driven by the environmental heterogeneities and the limited modeling capacity of current solutions. To address these issues, this paper introduces a novel MARL framework that integrates Dynamic Graph Neural Networks (DGNNs) and Topological Data Analysis (TDA), aiming to enhance the expressiveness of environmental representations and improve agent coordination. Furthermore, inspired by the Mixture of Experts (MoE) architecture in Large Language Models (LLMs), a topology-assisted spatial pattern disentangling (TSD)-enhanced MoE is proposed, which leverages topological signatures to decouple graph features for specialized processing, thus improving the model's ability to characterize dynamic and heterogeneous local observations. The TSD module is also integrated into the policy and value networks of the Multi-agent Proximal Policy Optimization (MAPPO) algorithm, further improving decision-making efficiency and robustness. Extensive experiments conducted on real-world traffic scenarios, together with comprehensive theoretical analysis, validate the superior performance of the proposed framework, highlighting the model's scalability and effectiveness in addressing the complexities of large-scale TSC tasks.
Abstract（参考訳）: インテリジェントトランスポーテーションシステム(ITS)は、交通信号制御(TSC)を重要コンポーネントとして、都市交通渋滞を改善するための有望なソリューションとして登場した。 MARL(Multi-Agent Reinforcement Learning)アルゴリズムは、リアルタイム意思決定を通じてTSCを最適化する可能性を示しているが、そのスケーラビリティと有効性は大規模で複雑な環境に悩まされることが多い。通常、これらの制限は主に、環境の不均一性によって引き起こされる状態空間の指数的成長と、現在の解の限られたモデリング能力の基本的なミスマッチに由来する。本稿では,動的グラフニューラルネットワーク(DGNN)とトポロジカルデータ解析(TDA)を統合した新しいMARLフレームワークを提案する。さらに,大規模言語モデル (LLMs) におけるMixture of Experts (MoE) アーキテクチャに着想を得て,トポロジ支援空間パターンアンタングリング (TSD) 強化 MoE を提案する。 TSDモジュールはまた、MAPPO(Multi-Adnt Proximal Policy Optimization)アルゴリズムのポリシーと価値ネットワークに統合され、意思決定効率と堅牢性をさらに向上する。実世界の交通シナリオにおける大規模な実験と包括的な理論的解析により,提案手法の優れた性能を検証し,大規模TSCタスクの複雑さに対処する上でのモデルのスケーラビリティと有効性を強調した。

関連論文リスト

Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文参考訳（メタデータ） (2025-07-12T17:11:06Z)
Joint Task Offloading and Resource Allocation in Low-Altitude MEC via Graph Attention Diffusion [38.35874485444821]
エアグラウンド統合マルチアクセスエッジコンピューティング(MEC)システムは、リアルタイムおよびインテリジェントなタスクスケジューリングに対する需要が高まっている。本稿では、低高度経済ネットワークのための3層ヘテロジニアスMECシステムアーキテクチャを構築する。
論文参考訳（メタデータ） (2025-06-27T06:03:48Z)
Topological Adaptive Least Mean Squares Algorithms over Simplicial Complexes [13.291627429657416]
本稿では, 単体錯体上での動的流れ信号を処理するための新しい適応フレームワークを提案する。本稿では,時間変化のあるエッジサブセット上で観測されたストリーミング信号を効率的に処理するトポロジカルLMSアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-05-29T06:55:19Z)
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.243031514520794]
LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。 PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文参考訳（メタデータ） (2025-05-06T15:18:38Z)
CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。 TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文参考訳（メタデータ） (2025-03-14T15:40:39Z)
Unicorn: A Universal and Collaborative Reinforcement Learning Approach Towards Generalizable Network-Wide Traffic Signal Control [13.106167353085878]
適応交通信号制御 (ATSC) は, 混雑の低減, スループットの最大化, 都市部における移動性の向上に不可欠である。パラメータ共有型マルチエージェント強化学習(MARL)の最近の進歩により、大規模同種ネットワークにおける複雑な動的流れのスケーラブルで適応的な最適化が大幅に向上した。 We present Unicorn, a universal and collaborative MARL framework designed for efficient and adaptable network-wide ATSC。
論文参考訳（メタデータ） (2025-03-14T15:13:42Z)
Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。 PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文参考訳（メタデータ） (2024-11-01T00:37:00Z)
Optimization of geological carbon storage operations with multimodal latent dynamic model and deep reinforcement learning [1.8549313085249324]
本稿では,高速フロー予測とGCSの制御最適化のためのディープラーニングフレームワークであるMLDモデルを紹介する。既存のモデルとは異なり、MDDは多様な入力モダリティをサポートし、包括的なデータインタラクションを可能にする。この手法は従来の手法よりも優れており、計算資源を60%以上削減し、最も高いNPVを達成する。
論文参考訳（メタデータ） (2024-06-07T01:30:21Z)
Generative AI Agents with Large Language Model for Satellite Networks via a Mixture of Experts Transmission [74.10928850232717]
本稿では、モデル定式化のための生成人工知能(AI)エージェントを開発し、送信戦略の設計に専門家(MoE)の混合を適用した。具体的には,大規模言語モデル(LLM)を活用して対話型モデリングパラダイムを構築する。定式化問題の解法として, MoE-proximal Policy Optimization (PPO) アプローチを提案する。
論文参考訳（メタデータ） (2024-04-14T03:44:54Z)
Entropy-Regularized Token-Level Policy Optimization for Language Agent Reinforcement [67.1393112206885]
大規模言語モデル(LLM)は、対話的な意思決定タスクにおいてインテリジェントなエージェントとして期待されている。本稿では,トークンレベルでのLLMの最適化に適したエントロピー拡張RL法である,エントロピー正規化トークンレベル最適化(ETPO)を導入する。我々は,データサイエンスコード生成を多段階対話型タスクのシリーズとしてモデル化したシミュレーション環境におけるETPOの有効性を評価する。
論文参考訳（メタデータ） (2024-02-09T07:45:26Z)
Adaptive Hierarchical SpatioTemporal Network for Traffic Forecasting [70.66710698485745]
本稿では,AHSTN(Adaptive Hierarchical SpatioTemporal Network)を提案する。 AHSTNは空間階層を利用し、マルチスケール空間相関をモデル化する。 2つの実世界のデータセットの実験により、AHSTNはいくつかの強いベースラインよりも優れたパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2023-06-15T14:50:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。