論文の概要: Deep Reinforcement Learning for Traffic Light Control in Intelligent
Transportation Systems
- arxiv url: http://arxiv.org/abs/2302.03669v1
- Date: Sat, 4 Feb 2023 02:49:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-08 15:10:33.692418
- Title: Deep Reinforcement Learning for Traffic Light Control in Intelligent
Transportation Systems
- Title(参考訳): インテリジェント交通システムにおける交通光制御のための深層強化学習
- Authors: Xiao-Yang Liu, Ming Zhu, Sem Borst, and Anwar Walid
- Abstract要約: 道路網におけるリアルタイム交通状況に基づいて信号機を適応的に制御するための,深部強化学習 (DRL) は有望なアプローチである。
2つのシナリオにおいて、交通信号制御問題に対して2つのDRLアルゴリズムを用いる。
単一の道路交差点とグリッド道路ネットワークの両方で配信されたポリシーは、DRLアルゴリズムのスケーラビリティを示している。
- 参考スコア(独自算出の注目度): 19.318117948342362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Smart traffic lights in intelligent transportation systems (ITSs) are
envisioned to greatly increase traffic efficiency and reduce congestion. Deep
reinforcement learning (DRL) is a promising approach to adaptively control
traffic lights based on the real-time traffic situation in a road network.
However, conventional methods may suffer from poor scalability. In this paper,
we investigate deep reinforcement learning to control traffic lights, and both
theoretical analysis and numerical experiments show that the intelligent
behavior ``greenwave" (i.e., a vehicle will see a progressive cascade of green
lights, and not have to brake at any intersection) emerges naturally a grid
road network, which is proved to be the optimal policy in an avenue with
multiple cross streets. As a first step, we use two DRL algorithms for the
traffic light control problems in two scenarios. In a single road intersection,
we verify that the deep Q-network (DQN) algorithm delivers a thresholding
policy; and in a grid road network, we adopt the deep deterministic policy
gradient (DDPG) algorithm. Secondly, numerical experiments show that the DQN
algorithm delivers the optimal control, and the DDPG algorithm with passive
observations has the capability to produce on its own a high-level intelligent
behavior in a grid road network, namely, the ``greenwave" policy emerges. We
also verify the ``greenwave" patterns in a $5 \times 10$ grid road network.
Thirdly, the ``greenwave" patterns demonstrate that DRL algorithms produce
favorable solutions since the ``greenwave" policy shown in experiment results
is proved to be optimal in a specified traffic model (an avenue with multiple
cross streets). The delivered policies both in a single road intersection and a
grid road network demonstrate the scalability of DRL algorithms.
- Abstract(参考訳): インテリジェントトランスポートシステム(ITS)におけるスマートトラヒックライトは、交通効率を大幅に向上させ、混雑を低減するために考えられている。
道路網におけるリアルタイム交通状況に基づいて信号機を適応的に制御する手法として,深部強化学習(DRL)がある。
しかし、従来の手法はスケーラビリティに乏しい。
In this paper, we investigate deep reinforcement learning to control traffic lights, and both theoretical analysis and numerical experiments show that the intelligent behavior ``greenwave" (i.e., a vehicle will see a progressive cascade of green lights, and not have to brake at any intersection) emerges naturally a grid road network, which is proved to be the optimal policy in an avenue with multiple cross streets. As a first step, we use two DRL algorithms for the traffic light control problems in two scenarios. In a single road intersection, we verify that the deep Q-network (DQN) algorithm delivers a thresholding policy; and in a grid road network, we adopt the deep deterministic policy gradient (DDPG) algorithm. Secondly, numerical experiments show that the DQN algorithm delivers the optimal control, and the DDPG algorithm with passive observations has the capability to produce on its own a high-level intelligent behavior in a grid road network, namely, the ``greenwave" policy emerges.
また、5 \times 10$グリッドロードネットワークで ``greenwave" パターンを検証する。
第3に, 実験結果に示された「グリーンウェーブ」ポリシーは, 特定交通モデル(複数道路を横断する道路)において最適であることが証明されたため, DRLアルゴリズムが好ましい解を生成することを示す。
単一の道路交差点とグリッド道路ネットワークの両方で配信されたポリシーは、DRLアルゴリズムのスケーラビリティを示している。
関連論文リスト
- A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Deep Policy Dynamic Programming for Vehicle Routing Problems [89.96386273895985]
本稿では,学習ニューラルの強みと動的プログラミングアルゴリズムの強みを組み合わせた深層ポリシー動的プログラミング(d pdp)を提案する。
D PDPは、例の解からエッジを予測するために訓練されたディープニューラルネットワークから派生したポリシーを使用して、DP状態空間を優先し、制限する。
本研究では,旅行セールスマン問題 (TSP) と車両ルーティング問題 (VRP) の枠組みを評価し,ニューラルネットワークが(制限された)DPアルゴリズムの性能を向上させることを示す。
論文 参考訳(メタデータ) (2021-02-23T15:33:57Z) - A Traffic Light Dynamic Control Algorithm with Deep Reinforcement
Learning Based on GNN Prediction [5.585321463602587]
GPlightはグラフニューラルネットワーク(GNN)と統合された深層強化学習アルゴリズムである
GPlightでは、グラフニューラルネットワーク(GNN)が、交差点における将来の短期的トラフィックフローを予測するために最初に使用される。
論文 参考訳(メタデータ) (2020-09-29T01:09:24Z) - PDLight: A Deep Reinforcement Learning Traffic Light Control Algorithm
with Pressure and Dynamic Light Duration [5.585321463602587]
PRCOL(Pressure with Retaining Capacity of Outgoing Lane)として新たな報酬を付与した深部強化学習(DRL)トラヒック光制御アルゴリズムPDlightを提案する。
PRCOLは、交通制御アルゴリズムで使用される圧力に対する改善として、入車車線の車両数だけでなく、出車線の残りの容量も考慮している。
論文 参考訳(メタデータ) (2020-09-29T01:07:49Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。