論文の概要: DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback
- arxiv url: http://arxiv.org/abs/2306.07553v1
- Date: Tue, 13 Jun 2023 05:58:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 14:50:02.130721
- Title: DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback
- Title(参考訳): DenseLight:Dense Feedbackを用いた大規模交通信号の効率的な制御
- Authors: Junfan Lin, Yuying Zhu, Lingbo Liu, Yang Liu, Guanbin Li, Liang Lin
- Abstract要約: 交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
- 参考スコア(独自算出の注目度): 109.84667902348498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic Signal Control (TSC) aims to reduce the average travel time of
vehicles in a road network, which in turn enhances fuel utilization efficiency,
air quality, and road safety, benefiting society as a whole. Due to the
complexity of long-horizon control and coordination, most prior TSC methods
leverage deep reinforcement learning (RL) to search for a control policy and
have witnessed great success. However, TSC still faces two significant
challenges. 1) The travel time of a vehicle is delayed feedback on the
effectiveness of TSC policy at each traffic intersection since it is obtained
after the vehicle has left the road network. Although several heuristic reward
functions have been proposed as substitutes for travel time, they are usually
biased and not leading the policy to improve in the correct direction. 2) The
traffic condition of each intersection is influenced by the non-local
intersections since vehicles traverse multiple intersections over time.
Therefore, the TSC agent is required to leverage both the local observation and
the non-local traffic conditions to predict the long-horizontal traffic
conditions of each intersection comprehensively. To address these challenges,
we propose DenseLight, a novel RL-based TSC method that employs an unbiased
reward function to provide dense feedback on policy effectiveness and a
non-local enhanced TSC agent to better predict future traffic conditions for
more precise traffic control. Extensive experiments and ablation studies
demonstrate that DenseLight can consistently outperform advanced baselines on
various road networks with diverse traffic flows. The code is available at
https://github.com/junfanlin/DenseLight.
- Abstract(参考訳): 交通信号制御(TSC)は、道路網における車両の平均走行時間を削減し、燃料利用効率、空気質、道路安全を高め、社会全体の利益をもたらすことを目的としている。
長期の制御と調整の複雑さのため、ほとんどの従来のTSC手法は、深い強化学習(RL)を利用して制御ポリシーを探索し、大きな成功を収めた。
しかし、TSCは依然として2つの大きな課題に直面している。
1)車両の走行時間は、車両が道路網を離れた後に得られるため、各交通交差点におけるTSCポリシーの有効性に対するフィードバックが遅れる。
旅行時間の代用としていくつかのヒューリスティック報酬関数が提案されているが、通常は偏りがあり、正しい方向を改善するための政策を導いていない。
2) 車両は時間とともに複数の交差点を横断するため, 交差点の交通条件は非局所交差点の影響を受けている。
したがって,TSCエージェントは局地観測と非局地交通条件の両方を利用して,交差点の長距離交通条件を総合的に予測する必要がある。
これらの課題に対処するため,不偏報酬関数を用いた新しいRTLベースのTSC手法であるDenseLightと,より正確な交通制御のために将来の交通状況を予測するための非局所拡張TSCエージェントを提案する。
大規模な実験とアブレーション研究により、DenseLightは多様な交通流を持つ様々な道路網の高度なベースラインを一貫して上回ることができることを示した。
コードはhttps://github.com/junfanlin/DenseLightで入手できる。
関連論文リスト
- Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Deep Reinforcement Learning for the Joint Control of Traffic Light
Signaling and Vehicle Speed Advice [8.506271224735029]
本稿では,交通信号制御と車両速度アドバイスの両方の制御を共同で学習する試みを提案する。
実験では,11のベンチマークシナリオ中8つのシナリオにおいて,共同制御手法により平均走行遅延を低減し,信号機のみを制御する。
論文 参考訳(メタデータ) (2023-09-18T15:45:22Z) - Deep Reinforcement Learning to Maximize Arterial Usage during Extreme
Congestion [4.934817254755007]
本稿では,過度の混雑中における多車線高速道路の交通渋滞を軽減するための深層強化学習(DRL)手法を提案する。
エージェントは、渋滞した高速道路交通に対する適応的な抑止戦略を学ぶために訓練される。
エージェントは、急激な混雑時の非作用と比較して平均交通速度を21%向上させることができる。
論文 参考訳(メタデータ) (2023-05-16T16:53:27Z) - Reinforcement Learning Approaches for Traffic Signal Control under
Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。
本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文 参考訳(メタデータ) (2023-04-21T03:26:33Z) - Reinforcement Learning based Cyberattack Model for Adaptive Traffic
Signal Controller in Connected Transportation Systems [61.39400591328625]
接続輸送システムにおいて、適応交通信号制御装置(ATSC)は、車両から受信したリアルタイム車両軌跡データを利用して、グリーンタイムを規制する。
この無線接続されたATSCはサイバー攻撃面を増やし、その脆弱性を様々なサイバー攻撃モードに拡大する。
そのようなモードの1つは、攻撃者がネットワーク内で偽の車両を作成する「シビル」攻撃である。
RLエージェントは、シビル車噴射の最適速度を学習し、アプローチの混雑を生じさせるように訓練される
論文 参考訳(メタデータ) (2022-10-31T20:12:17Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - Emergent Road Rules In Multi-Agent Driving Environments [84.82583370858391]
運転環境の要素が道路ルールの出現の原因となるかを分析する。
2つの重要な要因が雑音知覚とエージェントの空間密度であることがわかった。
我々の結果は、世界中の国々が安全で効率的な運転で合意した社会道路規則を実証的に支持する。
論文 参考訳(メタデータ) (2020-11-21T09:43:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。