論文の概要: Perimeter Control with Heterogeneous Metering Rates for Cordon Signals: A Physics-Regularized Multi-Agent Reinforcement Learning Approach
- arxiv url: http://arxiv.org/abs/2308.12985v2
- Date: Fri, 31 May 2024 15:44:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-03 20:41:23.191575
- Title: Perimeter Control with Heterogeneous Metering Rates for Cordon Signals: A Physics-Regularized Multi-Agent Reinforcement Learning Approach
- Title(参考訳): 角膜信号の不均一測定率を用いた周辺制御:物理規則化多エージェント強化学習アプローチ
- Authors: Jiajie Yu, Pierre-Antoine Laharotte, Yu Han, Wei Ma, Ludovic Leclercq,
- Abstract要約: 過飽和環境下での都市道路網の制御に対処するための周辺制御(PC)戦略が提案されている。
本稿では,MARL(Multi-Agent Reinforcement Learning)に基づく交通信号制御フレームワークを活用し,PC問題を分解する。
MARLフレームワークの物理正則化手法は,分散コードン信号制御装置がグローバルネットワークの状態を認識していることを確実にするために提案される。
- 参考スコア(独自算出の注目度): 12.86346901414289
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perimeter Control (PC) strategies have been proposed to address urban road network control in oversaturated situations by regulating the transfer flow of the Protected Network (PN) based on the Macroscopic Fundamental Diagram (MFD). The uniform metering rate for cordon signals in most existing studies overlooks the variance of local traffic states at the intersection level, which may cause severe local traffic congestion and degradation of the network stability. PC strategies with heterogeneous metering rates for cordon signals allow precise control for the perimeter but the complexity of the problem increases exponentially with the scale of the PN. This paper leverages a Multi-Agent Reinforcement Learning (MARL)-based traffic signal control framework to decompose this PC problem, which considers heterogeneous metering rates for cordon signals, into multi-agent cooperation tasks. Each agent controls an individual signal located in the cordon, decreasing the dimension of action space for the controller compared to centralized methods. A physics regularization approach for the MARL framework is proposed to ensure the distributed cordon signal controllers are aware of the global network state by encoding MFD-based knowledge into the action-value functions of the local agents. The proposed PC strategy is operated as a two-stage system, with a feedback PC strategy detecting the overall traffic state within the PN and then distributing local instructions to cordon signals controllers in the MARL framework via the physics regularization. Through numerical tests with different demand patterns in a microscopic traffic environment, the proposed PC strategy shows promising robustness and transferability. It outperforms state-of-the-art feedback PC strategies in increasing network throughput, decreasing distributed delay for gate links, and reducing carbon emissions.
- Abstract(参考訳): マクロ基盤図 (MFD) に基づく保護ネットワーク (PN) の移動流を制御し, 過飽和状況下での都市道路網の制御に対処するための周辺制御 (PC) 戦略が提案されている。
コードン信号の均一測定速度は, 交差点レベルでの局部交通状態のばらつきを考慮し, 激しい局部交通渋滞とネットワーク安定性の低下を引き起こす可能性がある。
コードン信号の不均一な測定速度を持つPC戦略は、周辺を正確に制御できるが、この問題の複雑さはPNのスケールとともに指数関数的に増加する。
本稿では,マルチエージェント強化学習(MARL)に基づく交通信号制御フレームワークを活用し,コードン信号の不均一な計測率を考慮したPC問題をマルチエージェント協調タスクに分解する。
各エージェントは、コードンに位置する個々の信号を制御し、集中的な方法と比較してコントローラのアクション空間の次元を減少させる。
MARLフレームワークの物理正則化手法を提案し、MFDに基づく知識を局所エージェントのアクション値関数に符号化することにより、分散コードン信号制御装置がグローバルネットワーク状態を認識することを保証する。
提案したPCストラテジーは,PN内の全トラフィック状態を検出し,物理正則化を介してMARLフレームワーク内のコードン信号制御装置にローカル命令を配信するフィードバックPCストラテジーを備えた2段階システムとして運用されている。
微視的交通環境における需要パターンの異なる数値実験を通じて,提案したPC戦略は有望な堅牢性と伝達性を示す。
ネットワークスループットの向上、ゲートリンクの分散遅延の低減、二酸化炭素排出量の削減など、最先端のフィードバックPC戦略よりも優れています。
関連論文リスト
- Conformal Distributed Remote Inference in Sensor Networks Under Reliability and Communication Constraints [61.62410595953275]
通信制約付き分散共形リスク制御(CD-CRC)
CD-CRCは通信制約下でのセンサネットワークのための新しい意思決定フレームワークである。
論文 参考訳(メタデータ) (2024-09-12T10:12:43Z) - Combat Urban Congestion via Collaboration: Heterogeneous GNN-based MARL
for Coordinated Platooning and Traffic Signal Control [16.762073265205565]
本稿では、異種グラフ多エージェント強化学習と交通理論に基づいて、これらの課題に対処するための革新的な解決策を提案する。
提案手法は,1)小隊と信号制御を個別の強化学習エージェントとして設計し,各エージェント間のシームレスな情報交換を容易にするため,多エージェント強化学習にグラフニューラルネットワークを組み込んだ協調設計を行う。
論文 参考訳(メタデータ) (2023-10-17T02:46:04Z) - Learning to Sail Dynamic Networks: The MARLIN Reinforcement Learning
Framework for Congestion Control in Tactical Environments [53.08686495706487]
本稿では, 正確な並列化可能なエミュレーション環境を利用して, 戦術ネットワークの環境を再現するRLフレームワークを提案する。
衛星通信(SATCOM)とUHFワイドバンド(UHF)の無線リンク間のボトルネックリンク遷移を再現した条件下で、MARLINエージェントを訓練することにより、我々のRL学習フレームワークを評価する。
論文 参考訳(メタデータ) (2023-06-27T16:15:15Z) - Real-Time Network-Level Traffic Signal Control: An Explicit Multiagent
Coordination Method [9.761657423863706]
交通信号の効率的な制御 (TSC) は, 都市交通渋滞の低減に最も有用な方法の1つである。
強化学習(RL)手法を適用した最近の取り組みは、トラフィック状態を信号決定にリアルタイムでマッピングすることでポリシーをクエリすることができる。
本稿では,適応的,リアルタイム,ネットワークレベルのTSCを満足する,EMCに基づくオンライン計画手法を提案する。
論文 参考訳(メタデータ) (2023-06-15T04:08:09Z) - Accelerating Wireless Federated Learning via Nesterov's Momentum and
Distributed Principle Component Analysis [59.127630388320036]
サーバと作業員が無線チャネルを介して未コーディング情報を交換できるようにすることにより、無線連合学習システムについて検討する。
ワーカは、帯域幅に制限のあるチャネルを介して、しばしばサーバにローカルにアップロードするため、ワーカからサーバへのアップリンク送信は、通信ボトルネックとなる。
ワンショット分散原理成分分析(PCA)を利用して通信ボトルネックの次元を縮小する。
論文 参考訳(メタデータ) (2023-03-31T08:41:42Z) - Lyapunov Function Consistent Adaptive Network Signal Control with Back
Pressure and Reinforcement Learning [9.797994846439527]
本研究では、それぞれ特定のリャプノフ関数を定義するリアプノフ制御理論を用いた統一的なフレームワークを提案する。
Lyapunov理論の知見に基づいて、この研究は強化学習(Reinforcement Learning, RL)に基づくネットワーク信号制御のための報酬関数を設計する。
提案アルゴリズムは, 純旅客車流および貨物を含む異種交通流下での従来のRL法およびRL法と比較した。
論文 参考訳(メタデータ) (2022-10-06T00:22:02Z) - Time-to-Green predictions for fully-actuated signal control systems with
supervised learning [56.66331540599836]
本稿では,集約信号とループ検出データを用いた時系列予測フレームワークを提案する。
我々は、最先端の機械学習モデルを用いて、将来の信号位相の持続時間を予測する。
スイスのチューリッヒの信号制御システムから得られた経験的データに基づいて、機械学習モデルが従来の予測手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-08-24T07:50:43Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Multi-agent Reinforcement Learning for Networked System Control [6.89105475513757]
本稿では,ネットワークシステム制御におけるマルチエージェント強化学習(MARL)について考察する。
我々は,NMARLにおける情報損失と非定常性を低減するため,NeurCommと呼ばれる新しい通信プロトコルを提案する。
NeurCommは学習効率と制御性能の両方で既存の通信プロトコルより優れている。
論文 参考訳(メタデータ) (2020-04-03T02:21:07Z) - A Compressive Sensing Approach for Federated Learning over Massive MIMO
Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。
本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T05:56:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。