論文の概要: Integrating Transit Signal Priority into Multi-Agent Reinforcement Learning based Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2411.19359v1
- Date: Thu, 28 Nov 2024 20:09:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-02 15:18:48.194457
- Title: Integrating Transit Signal Priority into Multi-Agent Reinforcement Learning based Traffic Signal Control
- Title(参考訳): マルチエージェント強化学習に基づく交通信号制御への交通信号優先性の統合
- Authors: Dickness Kakitahi Kwesiga, Suyash Chandra Vishnoi, Angshuman Guin, Michael Hunter,
- Abstract要約: 本研究では,交通信号優先性(TSP)をマルチエージェント強化学習(MARL)に基づく交通信号制御に統合する。
2つのエージェントは、各交差点毎に、価値分解ネットワーク(VDN)アーキテクチャを用いて集中的に訓練される。
訓練されたエージェントは、0.95のv/cでの全体的な交差点遅延に基づいて、調整された作動信号制御よりも若干性能が向上した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This study integrates Transit Signal Priority (TSP) into multi-agent reinforcement learning (MARL) based traffic signal control. The first part of the study develops adaptive signal control based on MARL for a pair of coordinated intersections in a microscopic simulation environment. The two agents, one for each intersection, are centrally trained using a value decomposition network (VDN) architecture. The trained agents show slightly better performance compared to coordinated actuated signal control based on overall intersection delay at v/c of 0.95. In the second part of the study the trained signal control agents are used as background signal controllers while developing event-based TSP agents. In one variation, independent TSP agents are formulated and trained under a decentralized training and decentralized execution (DTDE) framework to implement TSP at each intersection. In the second variation, the two TSP agents are centrally trained under a centralized training and decentralized execution (CTDE) framework and VDN architecture to select and implement coordinated TSP strategies across the two intersections. In both cases the agents converge to the same bus delay value, but independent agents show high instability throughout the training process. For the test runs, the two independent agents reduce bus delay across the two intersections by 22% compared to the no TSP case while the coordinated TSP agents achieve 27% delay reduction. In both cases, there is only a slight increase in delay for a majority of the side street movements.
- Abstract(参考訳): 本研究では,交通信号優先性(TSP)をマルチエージェント強化学習(MARL)に基づく交通信号制御に統合する。
本研究の第1部では、顕微鏡シミュレーション環境における一対の座標交点に対するMARLに基づく適応信号制御を開発した。
2つのエージェントは、各交差点毎に、価値分解ネットワーク(VDN)アーキテクチャを用いて集中的に訓練される。
訓練されたエージェントは、0.95のv/cでの全体的な交差点遅延に基づいて、調整された作動信号制御よりも若干性能が向上した。
研究の第2部では、訓練された信号制御エージェントが背景信号制御装置として使用され、イベントベースのTSPエージェントが開発されている。
1つのバリエーションでは、独立したTSPエージェントを、各交差点でTSPを実装するために、分散トレーニングおよび分散実行(DTDE)フレームワークで定式化し、訓練する。
第2のバリエーションでは、2つのTSPエージェントは、集中的なトレーニングと分散実行(CTDE)フレームワークとVDNアーキテクチャの下で集中的にトレーニングされ、2つの交差点をまたいだ調整されたTSP戦略を選択し、実装する。
どちらの場合もエージェントは同じ遅延値に収束するが、独立したエージェントはトレーニングプロセスを通して高い不安定性を示す。
テスト走行では、2つの独立したエージェントが2つの交差点を横断するバス遅延を22%削減し、調整されたTSPエージェントは27%の遅延遅延を達成した。
いずれの場合も、サイドストリート運動の大部分が遅れているのはわずかである。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Adaptive Transit Signal Priority based on Deep Reinforcement Learning and Connected Vehicles in a Traffic Microsimulation Environment [0.0]
本研究は、適応トランジット信号優先(TSP)アルゴリズムを含むRLベースのトラフィック制御を拡張した。
このエージェントは、バスの走行時間を約21%短縮し、飽和率0.95で一般交通に悪影響を及ぼすことを示した。
論文 参考訳(メタデータ) (2024-07-31T18:17:22Z) - Joint Optimization of Traffic Signal Control and Vehicle Routing in
Signalized Road Networks using Multi-Agent Deep Reinforcement Learning [19.024527400852968]
信号化道路網における交通信号制御と車両ルーティングの協調最適化手法を提案する。
マルチエージェントディープ強化学習(MADRL)を用いた信号タイミングと経路選択を同時に制御することでネットワーク性能を向上させることを目的とする。
本研究は,MADRLを用いて信号制御と車両経路の最適結合ポリシーを導出する最初の試みである。
論文 参考訳(メタデータ) (2023-10-16T22:10:47Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - COOR-PLT: A hierarchical control model for coordinating adaptive
platoons of connected and autonomous vehicles at signal-free intersections
based on deep reinforcement learning [0.0]
本研究では,信号のない交差点で適応型CAVプラトンを協調するための階層制御モデルであるCOOR-PLTを提案する。
都市移動シミュレータ(SUMO)のモデル検証と検証を行った。
論文 参考訳(メタデータ) (2022-07-01T02:22:31Z) - Effects of Smart Traffic Signal Control on Air Quality [0.0]
マルチエージェント深部強化学習(MARL)は交通システムにおいて実験的に研究されている。
MA2Cと呼ばれる、確立されたアドバンテージアクター・クリティカル(A2C)アルゴリズムのマルチエージェント版が最近開発され、エージェント間の通信の有望なアイデアを活用している。
この観点から、エージェントは他のエージェントと戦略を共有し、エージェントの数や多様性が増大しても学習プロセスを安定化させる。
論文 参考訳(メタデータ) (2021-07-06T02:48:42Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - Decentralized Deep Reinforcement Learning for Network Level Traffic
Signal Control [0.8838408191955874]
本稿では,交通信号制御における高速かつリアルタイムな性能を実現するために,完全分散型深層マルチエージェント強化学習(MARL)アルゴリズムのファミリーを提案する。
各交差点は、他の交差点ノードに対してマルコフゲームを行うエージェントとしてモデル化される。
実験結果から,S2R2Lはトレーニング過程において,IDQLやS2RLよりも高速に収束し,収束性能が向上していることがわかった。
論文 参考訳(メタデータ) (2020-07-02T06:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。