論文の概要: AttendLight: Universal Attention-Based Reinforcement Learning Model for
Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2010.05772v1
- Date: Mon, 12 Oct 2020 15:07:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 05:55:52.343848
- Title: AttendLight: Universal Attention-Based Reinforcement Learning Model for
Traffic Signal Control
- Title(参考訳): トラヒック信号制御のためのユニバーサルアテンションに基づく強化学習モデル
- Authors: Afshin Oroojlooy, Mohammadreza Nazari, Davood Hajinezhad, Jorge Silva
- Abstract要約: 本稿では,交通信号制御問題に対するエンドツーエンド強化学習(RL)アルゴリズムであるAttendLightを提案する。
提案モデルでは、同様の構成がトレーニングセットで表現されている限り、任意の交差点構成で機能する。
我々は, (i) 単一環境訓練, (ii) 単一環境訓練, (ii) マルチ環境訓練, マルチデプロイメントの2つの体制を考察する。
- 参考スコア(独自算出の注目度): 5.944045645140131
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose AttendLight, an end-to-end Reinforcement Learning (RL) algorithm
for the problem of traffic signal control. Previous approaches for this problem
have the shortcoming that they require training for each new intersection with
a different structure or traffic flow distribution. AttendLight solves this
issue by training a single, universal model for intersections with any number
of roads, lanes, phases (possible signals), and traffic flow. To this end, we
propose a deep RL model which incorporates two attention models. The first
attention model is introduced to handle different numbers of roads-lanes; and
the second attention model is intended for enabling decision-making with any
number of phases in an intersection. As a result, our proposed model works for
any intersection configuration, as long as a similar configuration is
represented in the training set. Experiments were conducted with both synthetic
and real-world standard benchmark data-sets. The results we show cover
intersections with three or four approaching roads;
one-directional/bi-directional roads with one, two, and three lanes; different
number of phases; and different traffic flows. We consider two regimes: (i)
single-environment training, single-deployment, and (ii) multi-environment
training, multi-deployment. AttendLight outperforms both classical and other
RL-based approaches on all cases in both regimes.
- Abstract(参考訳): 本稿では,交通信号制御問題に対するエンドツーエンド強化学習(RL)アルゴリズムであるAttendLightを提案する。
この問題の従来のアプローチは、異なる構造や交通流の分布を持つ新しい交差点の訓練を必要とするという欠点がある。
AttendLightはこの問題を解決するために、道路、車線、フェーズ(可能な信号)、交通の流れなどと交差する単一で普遍的なモデルを訓練している。
そこで本研究では,2つの注意モデルを含む深部RLモデルを提案する。
第1のアテンションモデルは異なる路盤数を扱うために導入され、第2のアテンションモデルは交差点の任意の位相で意思決定を可能にすることを意図している。
その結果、同様の構成がトレーニングセットで表現される限り、我々の提案したモデルは任意の交差点構成で機能する。
合成および実世界の標準ベンチマークデータセットを用いて実験を行った。
その結果,3車線・4車線の交差点,1車線・2車線・3車線・2車線・2車線・3車線・異なる位相の交差点,および交通の流れが異なることがわかった。
二つの体制を考えます
(i)単一環境訓練、単一展開、及び
(ii)マルチ環境トレーニング、マルチデプロイ。
AttendLightは、古典的および他のRLベースのアプローチよりも、両方のレシエーションにおけるすべてのケースで優れている。
関連論文リスト
- UniTSA: A Universal Reinforcement Learning Framework for V2X Traffic
Signal Control [4.505547437110232]
交通渋滞は、効果的な交通信号制御(TSC)システムの開発を要求する都市部において持続的な問題である。
そこで本研究では,V2X(Vanger-to-Everything)環境での汎用的なRTLベースのTSCフレームワークを提案する。
様々な交差構造を扱う能力の向上を図ったRLベースのフレームワークを実現するため,信号光制御システムのための新しいトラフィック状態拡張手法が開発された。
論文 参考訳(メタデータ) (2023-12-08T15:18:40Z) - Improving the generalizability and robustness of large-scale traffic
signal control [3.8028221877086814]
交通信号の制御における深部強化学習(RL)アプローチの堅牢性について検討する。
欠落したデータに対して,近年の手法が脆弱なままであることを示す。
政策アンサンブルによる分散強化学習とバニラ強化学習の組み合わせを提案する。
論文 参考訳(メタデータ) (2023-06-02T21:30:44Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - ADLight: A Universal Approach of Traffic Signal Control with Augmented
Data Using Reinforcement Learning [3.3458830284045065]
本稿では,拡張データ(ADLight)を用いた新しい強化学習手法を提案する。
一般化性能を向上させるために,textitmovement shuffle という新しいデータ拡張手法を開発した。
その結果,本手法の性能は,単一環境で訓練されたモデルに近いことがわかった。
論文 参考訳(メタデータ) (2022-10-24T16:21:48Z) - On the Role of Bidirectionality in Language Model Pre-Training [85.14614350372004]
本研究では,次のトークン予測,テキスト入力,ゼロショットプライミング,微調整における双方向性の役割について検討する。
最大6.7Bのパラメータを持つモデルをトレーニングし、スケールで一貫性のある相違点を見つけます。
論文 参考訳(メタデータ) (2022-05-24T02:25:05Z) - Parallel Successive Learning for Dynamic Distributed Model Training over
Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。
我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。
我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文 参考訳(メタデータ) (2022-02-07T05:11:01Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。