論文の概要: Generalized Phase Pressure Control Enhanced Reinforcement Learning for Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2503.20205v1
- Date: Wed, 26 Mar 2025 04:03:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:21:47.386396
- Title: Generalized Phase Pressure Control Enhanced Reinforcement Learning for Traffic Signal Control
- Title(参考訳): 一般位相圧力制御による交通信号制御のための強化強化学習
- Authors: Xiao-Cheng Liao, Yi Mei, Mengjie Zhang, Xiang-Ling Chen,
- Abstract要約: 我々は,交通信号制御ポリシーを学習するための,柔軟で効率的かつ理論的に基礎づけた手法を開発した。
待ち行列理論に基づいて, 圧力制御理論を多元系道路網の一般形式に拡張する。
我々は、一般化位相状態表現とMPLightとCoLightを組み合わせることにより、強化学習(RL)ベースのアルゴリズムテンプレートG2P-XLightと、2つのRLアルゴリズムG2P-MPLightとG2P-CoLightを開発する。
- 参考スコア(独自算出の注目度): 2.704899832646868
- License:
- Abstract: Appropriate traffic state representation is crucial for learning traffic signal control policies. However, most of the current traffic state representations are heuristically designed, with insufficient theoretical support. In this paper, we (1) develop a flexible, efficient, and theoretically grounded method, namely generalized phase pressure (G2P) control, which takes only simple lane features into consideration to decide which phase to be actuated; 2) extend the pressure control theory to a general form for multi-homogeneous-lane road networks based on queueing theory; (3) design a new traffic state representation based on the generalized phase state features from G2P control; and 4) develop a reinforcement learning (RL)-based algorithm template named G2P-XLight, and two RL algorithms, G2P-MPLight and G2P-CoLight, by combining the generalized phase state representation with MPLight and CoLight, two well-performed RL methods for learning traffic signal control policies. Extensive experiments conducted on multiple real-world datasets demonstrate that G2P control outperforms the state-of-the-art (SOTA) heuristic method in the transportation field and other recent human-designed heuristic methods; and that the newly proposed G2P-XLight significantly outperforms SOTA learning-based approaches. Our code is available online.
- Abstract(参考訳): 適切な交通状態表現は、交通信号制御ポリシーの学習に不可欠である。
しかし、現在の交通状態の表現のほとんどはヒューリスティックに設計されており、理論的には不十分である。
本稿では,(1)フレキシブルで効率的で理論的に基礎的な手法である一般化位相圧力(G2P)制御を開発し,どの位相を作動させるかを決定するため,単純なレーンの特徴のみを考慮に入れた。
2) 圧力制御理論を、待ち行列理論に基づく多元系道路網の一般形式に拡張し、(3)G2P制御から一般化された位相状態特徴に基づく新しい交通状態表現を設計する。
4) G2P-XLightとG2P-MPLightとG2P-CoLightという2つのRLアルゴリズムを,一般位相状態表現とMPLightとCoLightの組み合わせにより構築した。
複数の実世界のデータセットで実施された大規模な実験により、G2P制御は輸送分野や近年の人間設計のヒューリスティック手法において、最先端(SOTA)ヒューリスティック手法よりも優れており、新たに提案されたG2P-XLightは、SOTA学習に基づくアプローチよりも大幅に優れていることが示された。
私たちのコードはオンラインで利用可能です。
関連論文リスト
- Learning Traffic Signal Control via Genetic Programming [2.954908748487635]
複雑な交差点における信号制御の新しい学習手法を提案する。
本手法では,各信号位相に対する位相緊急の概念を設計する。
緊急関数は、現在の道路条件に基づいて特定位相の位相緊急を算出することができる。
論文 参考訳(メタデータ) (2024-03-26T02:22:08Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Reinforcement Learning Approaches for Traffic Signal Control under
Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。
本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文 参考訳(メタデータ) (2023-04-21T03:26:33Z) - Demonstration-guided Deep Reinforcement Learning for Coordinated Ramp
Metering and Perimeter Control in Large Scale Networks [12.296779112932741]
本研究では,高速道路のランプ計測と同質都市道路の周方向制御の2つの代表的な制御手法について考察する。
本稿では,新しいメソマクロ動的ネットワークモデルを提案し,初めてデモ誘導DRL法を開発した。
研究結果は,大規模ネットワークにおける協調制御のための従来のコントローラとDRLを組み合わせる大きな可能性を明らかにしている。
論文 参考訳(メタデータ) (2023-03-04T11:49:49Z) - Jump-Start Reinforcement Learning [68.82380421479675]
本稿では、オフラインデータやデモ、あるいは既存のポリシーを使ってRLポリシーを初期化するメタアルゴリズムを提案する。
特に,タスク解決に2つのポリシーを利用するアルゴリズムであるJump-Start Reinforcement Learning (JSRL)を提案する。
実験により、JSRLは既存の模倣と強化学習アルゴリズムを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-04-05T17:25:22Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Expression is enough: Improving traffic signal control with advanced
traffic state representation [24.917612761503996]
フレキシブルで簡便な新手法であるアドバンストマックスプレッシャー(Advanced-MP)を提案する。
我々はまた、ATSと現在のRLアプローチを組み合わせたRLベースのアルゴリズムテンプレートAdvanced-XLightを開発し、「Advanced-MPLight」と「Advanced-CoLight」の2つのRLアルゴリズムを生成する。
複数の実世界のデータセットに関する総合的な実験によると、(1)Advanced-MPは、デプロイに効率的で信頼性の高いベースラインメソッドよりも優れており、(2)Advanced-MPLightとAdvanced-CoLightは、新しい最先端を実現することができる。
論文 参考訳(メタデータ) (2021-12-19T10:28:39Z) - Efficient Pressure: Improving efficiency for signalized intersections [24.917612761503996]
交通信号制御(TSC)の問題を解決するために,強化学習(RL)が注目されている。
既存のRLベースの手法は、計算資源の面でコスト効率が良くなく、従来の手法よりも堅牢ではないため、ほとんどデプロイされない。
我々は,RTLに基づくアプローチに基づいて,トレーニングを減らし,複雑さを低減したTSCの適応制御系を構築する方法を示す。
論文 参考訳(メタデータ) (2021-12-04T13:49:58Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Reinforcement Learning with Augmented Data [97.42819506719191]
本稿では,ほとんどのRLアルゴリズムを拡張可能なシンプルなプラグイン・アンド・プレイモジュールであるReinforcement Learning with Augmented Data (RAD)を提案する。
本稿では,RLアルゴリズムが複雑な最先端手法より優れていることを示すために,ランダム翻訳,作物,カラージッタ,パッチカットアウト,ランダム畳み込み,振幅スケールなどの拡張法を提案する。
論文 参考訳(メタデータ) (2020-04-30T17:35:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。