論文の概要: A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization
- arxiv url: http://arxiv.org/abs/2107.06115v1
- Date: Tue, 13 Jul 2021 14:11:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 18:29:41.029547
- Title: A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization
- Title(参考訳): 交通信号制御最適化のための深層強化学習手法
- Authors: Zhenning Li, Chengzhong Xu, Guohui Zhang
- Abstract要約: 非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
- 参考スコア(独自算出の注目度): 14.455497228170646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inefficient traffic signal control methods may cause numerous problems, such
as traffic congestion and waste of energy. Reinforcement learning (RL) is a
trending data-driven approach for adaptive traffic signal control in complex
urban traffic networks. Although the development of deep neural networks (DNN)
further enhances its learning capability, there are still some challenges in
applying deep RLs to transportation networks with multiple signalized
intersections, including non-stationarity environment, exploration-exploitation
dilemma, multi-agent training schemes, continuous action spaces, etc. In order
to address these issues, this paper first proposes a multi-agent deep
deterministic policy gradient (MADDPG) method by extending the actor-critic
policy gradient algorithms. MADDPG has a centralized learning and decentralized
execution paradigm in which critics use additional information to streamline
the training process, while actors act on their own local observations. The
model is evaluated via simulation on the Simulation of Urban MObility (SUMO)
platform. Model comparison results show the efficiency of the proposed
algorithm in controlling traffic lights.
- Abstract(参考訳): 非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
強化学習(rl)は、複雑な都市交通ネットワークにおける適応的交通信号制御のためのトレンドデータ駆動アプローチである。
ディープニューラルネットワーク(DNN)の開発は、学習能力をさらに強化するが、非定常環境、探索-探索ジレンマ、マルチエージェントトレーニングスキーム、連続アクションスペースなど、複数の信号化交差点を持つ交通ネットワークにディープRを適用する上ではまだ、いくつかの課題がある。
これらの問題に対処するため,本稿では,アクタ-批判的ポリシー勾配アルゴリズムを拡張したマルチエージェント・ディープ決定性ポリシー勾配法(MADDPG)を提案する。
MADDPGは集中学習と分散実行パラダイムを持ち、批評家はトレーニングプロセスの合理化に追加情報を使用し、アクターは自身のローカルな観察を行う。
本モデルは,都市移動度シミュレーション(SUMO)プラットフォーム上でのシミュレーションにより評価する。
モデル比較結果は,提案アルゴリズムの信号制御における効率性を示す。
関連論文リスト
- Learning Decentralized Traffic Signal Controllers with Multi-Agent Graph
Reinforcement Learning [42.175067773481416]
我々は,空間的時間的相関を捉えるために,環境観測性を改善した新しい分散制御アーキテクチャを設計する。
具体的には,道路ネットワークに収集された非構造データから相関関連情報を抽出するトポロジ対応情報集約戦略を開発する。
拡散畳み込みモジュールが開発され、新しいMARLアルゴリズムが作成され、エージェントにグラフ学習の能力を与える。
論文 参考訳(メタデータ) (2023-11-07T06:43:15Z) - A Novel Multi-Agent Deep RL Approach for Traffic Signal Control [13.927155702352131]
都市ネットワークにおける複数の交通信号制御のための Friend-Deep Q-network (Friend-DQN) アプローチを提案する。
特に、複数のエージェント間の協調は状態-作用空間を減少させ、収束を加速させる。
論文 参考訳(メタデータ) (2023-06-05T08:20:37Z) - Improving the generalizability and robustness of large-scale traffic
signal control [3.8028221877086814]
交通信号の制御における深部強化学習(RL)アプローチの堅牢性について検討する。
欠落したデータに対して,近年の手法が脆弱なままであることを示す。
政策アンサンブルによる分散強化学習とバニラ強化学習の組み合わせを提案する。
論文 参考訳(メタデータ) (2023-06-02T21:30:44Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Reinforcement Learning for Datacenter Congestion Control [50.225885814524304]
渋滞制御アルゴリズムの成功は、レイテンシとネットワーク全体のスループットを劇的に改善する。
今日まで、このような学習ベースのアルゴリズムはこの領域で実用的な可能性を示さなかった。
実世界のデータセンターネットワークの様々な構成に一般化することを目的としたRLに基づくアルゴリズムを考案する。
本稿では,この手法が他のRL手法よりも優れており,トレーニング中に見られなかったシナリオに一般化可能であることを示す。
論文 参考訳(メタデータ) (2021-02-18T13:49:28Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。