論文の概要: Joint-Local Grounded Action Transformation for Sim-to-Real Transfer in Multi-Agent Traffic Control
- arxiv url: http://arxiv.org/abs/2507.15174v1
- Date: Mon, 21 Jul 2025 01:33:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 20:51:32.225909
- Title: Joint-Local Grounded Action Transformation for Sim-to-Real Transfer in Multi-Agent Traffic Control
- Title(参考訳): マルチエージェント交通制御におけるSim-to-Real転送のための局所的共同動作変換
- Authors: Justin Turnau, Longchao Da, Khoa Vo, Ferdous Al Rafi, Shreyas Bachiraju, Tiejin Chen, Hua Wei,
- Abstract要約: 交通信号制御(TSC)は,都市交通の流れの管理と混雑軽減に不可欠である。強化学習(RL)は,動的な交通パターンに対応することで,TSCの適応的手法を提供する。
MARLベースのTSCポリシーを現実世界で実装することは、しばしばsim-to-realギャップとして知られる大きなパフォーマンス低下につながる。
本稿では,隣接するエージェントからの情報を組み込んで,拡張基盤能力とスケーラビリティのバランスをとるため,GAT を MARL ベースの TSC に適用した JL-GAT を提案する。
- 参考スコア(独自算出の注目度): 3.472517229547992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic Signal Control (TSC) is essential for managing urban traffic flow and reducing congestion. Reinforcement Learning (RL) offers an adaptive method for TSC by responding to dynamic traffic patterns, with multi-agent RL (MARL) gaining traction as intersections naturally function as coordinated agents. However, due to shifts in environmental dynamics, implementing MARL-based TSC policies in the real world often leads to a significant performance drop, known as the sim-to-real gap. Grounded Action Transformation (GAT) has successfully mitigated this gap in single-agent RL for TSC, but real-world traffic networks, which involve numerous interacting intersections, are better suited to a MARL framework. In this work, we introduce JL-GAT, an application of GAT to MARL-based TSC that balances scalability with enhanced grounding capability by incorporating information from neighboring agents. JL-GAT adopts a decentralized approach to GAT, allowing for the scalability often required in real-world traffic networks while still capturing key interactions between agents. Comprehensive experiments on various road networks under simulated adverse weather conditions, along with ablation studies, demonstrate the effectiveness of JL-GAT. The code is publicly available at https://github.com/DaRL-LibSignal/JL-GAT/.
- Abstract(参考訳): 交通信号制御 (TSC) は, 都市交通流の管理と渋滞低減に不可欠である。
強化学習 (Reinforcement Learning, RL) は, 動的トラフィックパターンに応答してTSCの適応的手法を提供する。
しかし、環境力学の変化により、MARLベースのTSCポリシーを現実の世界で実装することは、sim-to-real gapとして知られる大きなパフォーマンス低下につながることが多い。
グラウンドド・アクション・トランスフォーメーション(GAT)は、TSCのための単一エージェントRLにおいて、このギャップを緩和することに成功しているが、多くの対話的交差点を含む現実世界のトラフィックネットワークは、MARLフレームワークにより適している。
本稿では,隣接するエージェントからの情報を組み込んで,拡張基盤能力とスケーラビリティのバランスをとるため,GAT を MARL ベースの TSC に適用した JL-GAT を提案する。
JL-GATは、GATへの分散アプローチを採用しており、エージェント間のキーインタラクションをキャプチャしながら、現実世界のトラフィックネットワークでしばしば必要とされるスケーラビリティを実現する。
気象条件を模擬した道路網の総合的な実験とアブレーション実験により,JL-GATの有効性が示された。
コードはhttps://github.com/DaRL-LibSignal/JL-GAT/で公開されている。
関連論文リスト
- Smart Traffic Signals: Comparing MARL and Fixed-Time Strategies [0.0]
都市交通渋滞、特に交差点での交通渋滞は、旅行時間、燃料消費および排出に大きな影響を及ぼす。
従来の固定時間信号制御システムは、動的トラフィックパターンを効果的に管理する適応性に欠けることが多い。
本研究では,複数交差点間の交通信号調整を最適化するためのマルチエージェント強化学習の適用について検討する。
論文 参考訳(メタデータ) (2025-05-20T15:59:44Z) - Federated Hierarchical Reinforcement Learning for Adaptive Traffic Signal Control [5.570882985800125]
マルチエージェント強化学習(MARL)は、適応的な交通信号制御(ATSC)を約束している。
MARLは広範なデータ共有と通信要求のために制約に直面している。
我々はATSCのための階層型統合強化学習(HFRL)を提案する。
論文 参考訳(メタデータ) (2025-04-07T23:02:59Z) - CoLLMLight: Cooperative Large Language Model Agents for Network-Wide Traffic Signal Control [7.0964925117958515]
交通信号制御(TSC)は,交通流の最適化と混雑緩和によって都市交通管理において重要な役割を担っている。
既存のアプローチでは、エージェント間の調整に必要な問題に対処できない。
TSCのための協調LLMエージェントフレームワークであるCoLLMLightを提案する。
論文 参考訳(メタデータ) (2025-03-14T15:40:39Z) - Toward Dependency Dynamics in Multi-Agent Reinforcement Learning for Traffic Signal Control [8.312659530314937]
適応的な信号制御のためのデータ駆動型アプローチとして強化学習(RL)が出現する。
本稿では,DQN-DPUS(Deep Q-Network)のための動的強化更新戦略を提案する。
提案手法は最適探索を犠牲にすることなく収束速度を向上できることを示す。
論文 参考訳(メタデータ) (2025-02-23T15:29:12Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。
LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。
シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文 参考訳(メタデータ) (2024-03-13T08:41:55Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。