論文の概要: Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization
- arxiv url: http://arxiv.org/abs/2005.09624v1
- Date: Tue, 19 May 2020 17:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 13:04:57.513261
- Title: Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization
- Title(参考訳): 効率的な交通信号最適化のためのバッチ強化マルチエージェント強化学習
- Authors: Yueh-Hua Wu, I-Hau Yeh, David Hu, Hong-Yuan Mark Liao
- Abstract要約: 提案手法は,現在使用されている固定時間信号機に比べて,待ち時間において交通渋滞を36%削減する。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
- 参考スコア(独自算出の注目度): 9.456254189014127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this work is to provide a viable solution based on reinforcement
learning for traffic signal control problems. Although the state-of-the-art
reinforcement learning approaches have yielded great success in a variety of
domains, directly applying it to alleviate traffic congestion can be
challenging, considering the requirement of high sample efficiency and how
training data is gathered. In this work, we address several challenges that we
encountered when we attempted to mitigate serious traffic congestion occurring
in a metropolitan area. Specifically, we are required to provide a solution
that is able to (1) handle the traffic signal control when certain surveillance
cameras that retrieve information for reinforcement learning are down, (2)
learn from batch data without a traffic simulator, and (3) make control
decisions without shared information across intersections. We present a
two-stage framework to deal with the above-mentioned situations. The framework
can be decomposed into an Evolution Strategies approach that gives a fixed-time
traffic signal control schedule and a multi-agent off-policy reinforcement
learning that is capable of learning from batch data with the aid of three
proposed components, bounded action, batch augmentation, and surrogate reward
clipping. Our experiments show that the proposed framework reduces traffic
congestion by 36% in terms of waiting time compared with the currently used
fixed-time traffic signal plan. Furthermore, the framework requires only 600
queries to a simulator to achieve the result.
- Abstract(参考訳): この研究の目的は、交通信号制御問題に対する強化学習に基づく実行可能なソリューションを提供することである。
最先端の強化学習アプローチは様々なドメインで大きな成功を収めているが、高いサンプル効率とトレーニングデータの収集方法の要件を考慮すると、トラフィックの軽減に直接適用することは困難である。
そこで本研究では,首都圏で発生した交通渋滞の軽減を図るため,いくつかの課題に対処した。
具体的には、(1)強化学習のための情報を取得する監視カメラがダウンしたときの信号制御を処理できるソリューション、(2)交通シミュレータを使わずにバッチデータから学習し、(3)交差点をまたいだ情報を共有することなく制御決定を行う必要がある。
上記の状況に対処するための2段階のフレームワークを提案する。
このフレームワークは、固定時間トラフィック信号制御スケジュールとマルチエージェントオフポリシー強化学習を提供する進化戦略アプローチに分解することができ、提案する3つのコンポーネント、境界アクション、バッチ拡張、サロゲート報酬クリップの助けを借りて、バッチデータから学習することができる。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
さらに、このフレームワークは結果を得るためにシミュレータに600クエリしか必要としない。
関連論文リスト
- Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Random Ensemble Reinforcement Learning for Traffic Signal Control [5.191217870404512]
効率的な交通信号制御戦略は、交通渋滞を低減し、都市交通効率を向上し、人々の生活を促進する。
既存の信号制御のための強化学習アプローチは主に、独立したニューラルネットワークによる学習に焦点を当てている。
論文 参考訳(メタデータ) (2022-03-10T08:45:47Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Reinforcement Learning for Mixed Autonomy Intersections [4.771833920251869]
シミュレーショントラフィックネットワークにおける混合自律性トラフィックを制御するためのモデルフリー強化学習手法を提案する。
本手法は,任意の数の制御車両に対して,局所的な観測に基づく分散制御が可能なマルチエージェントポリシー分解を利用する。
論文 参考訳(メタデータ) (2021-11-08T18:03:18Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。