論文の概要: Intelligent Traffic Light via Policy-based Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2112.13817v1
- Date: Mon, 27 Dec 2021 18:11:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-28 16:51:26.677746
- Title: Intelligent Traffic Light via Policy-based Deep Reinforcement Learning
- Title(参考訳): 政策に基づく深層強化学習によるインテリジェントトラヒックライト
- Authors: Yue Zhu, Mingyu Cai, Chris Schwarz, Junchao Li, and Shaoping Xiao
- Abstract要約: 本研究では,都市移動シミュレータ上での信号制御エージェントの訓練に強化学習を用いる。
政策に基づく深層強化学習手法であるPPO(Proximal Policy Optimization)を利用する。
- 参考スコア(独自算出の注目度): 2.0796717061432
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent traffic lights in smart cities can optimally reduce traffic
congestion. In this study, we employ reinforcement learning to train the
control agent of a traffic light on a simulator of urban mobility. As a
difference from existing works, a policy-based deep reinforcement learning
method, Proximal Policy Optimization (PPO), is utilized other than value-based
methods such as Deep Q Network (DQN) and Double DQN (DDQN). At first, the
obtained optimal policy from PPO is compared to those from DQN and DDQN. It is
found that the policy from PPO performs better than the others. Next, instead
of the fixed-interval traffic light phases, we adopt the light phases with
variable time intervals, which result in a better policy to pass the traffic
flow. Then, the effects of environment and action disturbances are studied to
demonstrate the learning-based controller is robust. At last, we consider
unbalanced traffic flows and find that an intelligent traffic light can perform
moderately well for the unbalanced traffic scenarios, although it learns the
optimal policy from the balanced traffic scenarios only.
- Abstract(参考訳): スマートシティのインテリジェントな交通ライトは、交通渋滞を最適に減らすことができる。
本研究では,都市移動シミュレータ上で交通信号の制御エージェントを訓練するために強化学習を利用する。
従来の作業と異なり,政策に基づく深層強化学習手法であるPPO(Proximal Policy Optimization)が,Deep Q Network(DQN)やDouble DQN(DDQN)といった価値ベースの手法以外に利用される。
まず、PPOから得られた最適ポリシーをDQNおよびDDQNから得たポリシーと比較する。
PPOの方針は他の政策よりも優れていることが判明した。
次に,一定のインターバルのトラヒック光位相ではなく,時間間隔の異なる光位相を採用することにより,トラヒックフローを通過させるポリシが向上する。
そして,学習ベースコントローラが頑健であることを示すため,環境と行動障害の影響について検討した。
最終的に、バランスの取れていない交通の流れを考慮し、バランスの取れていない交通シナリオに対してインテリジェントな交通信号が適度に機能することを発見した。
関連論文リスト
- Uncertainty Quantification for Image-based Traffic Prediction across
Cities [63.136794104678025]
不確実量化(UQ)法は確率論的推論を誘導するためのアプローチを提供する。
複数の都市にまたがる大規模画像ベース交通データセットへの適用について検討する。
モスクワ市を事例として,交通行動に対する時間的・空間的影響を考察した。
論文 参考訳(メタデータ) (2023-08-11T13:35:52Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Deep Reinforcement Learning for Traffic Light Control in Intelligent
Transportation Systems [19.318117948342362]
道路網におけるリアルタイム交通状況に基づいて信号機を適応的に制御するための,深部強化学習 (DRL) は有望なアプローチである。
2つのシナリオにおいて、交通信号制御問題に対して2つのDRLアルゴリズムを用いる。
単一の道路交差点とグリッド道路ネットワークの両方で配信されたポリシーは、DRLアルゴリズムのスケーラビリティを示している。
論文 参考訳(メタデータ) (2023-02-04T02:49:12Z) - Traffic Management of Autonomous Vehicles using Policy Based Deep
Reinforcement Learning and Intelligent Routing [0.26249027950824505]
本稿では,交差点の混雑状況に応じて交通信号を調整するDRLに基づく信号制御システムを提案する。
交差点の後方の道路での渋滞に対処するため,道路ネットワーク上で車両のバランスをとるために再ルート手法を用いた。
論文 参考訳(メタデータ) (2022-06-28T02:46:20Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - A Deep Reinforcement Learning Approach for Traffic Signal Control
Optimization [14.455497228170646]
非効率な信号制御手法は、交通渋滞やエネルギー浪費などの多くの問題を引き起こす可能性がある。
本稿では,アクター・クリティカル・ポリシー・グラデーション・アルゴリズムを拡張し,マルチエージェント・ディープ・決定性ポリシー・グラデーション(MADDPG)法を提案する。
論文 参考訳(メタデータ) (2021-07-13T14:11:04Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - PDLight: A Deep Reinforcement Learning Traffic Light Control Algorithm
with Pressure and Dynamic Light Duration [5.585321463602587]
PRCOL(Pressure with Retaining Capacity of Outgoing Lane)として新たな報酬を付与した深部強化学習(DRL)トラヒック光制御アルゴリズムPDlightを提案する。
PRCOLは、交通制御アルゴリズムで使用される圧力に対する改善として、入車車線の車両数だけでなく、出車線の残りの容量も考慮している。
論文 参考訳(メタデータ) (2020-09-29T01:07:49Z) - Efficient Deep Reinforcement Learning via Adaptive Policy Transfer [50.51637231309424]
強化学習(RL)を促進するための政策伝達フレームワーク(PTF)の提案
我々のフレームワークは、いつ、いつ、どのソースポリシーがターゲットポリシーの再利用に最適なのか、いつそれを終了するかを学習する。
実験結果から,学習過程を著しく加速し,最先端の政策伝達手法を超越していることが判明した。
論文 参考訳(メタデータ) (2020-02-19T07:30:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。