論文の概要: Random Ensemble Reinforcement Learning for Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2203.05961v1
- Date: Thu, 10 Mar 2022 08:45:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 12:26:09.910155
- Title: Random Ensemble Reinforcement Learning for Traffic Signal Control
- Title(参考訳): 交通信号制御のためのランダムアンサンブル強化学習
- Authors: Ruijie Qi, Jianbin Huang, He Li, Qinglin Tan, Longji Huang and
Jiangtao Cui
- Abstract要約: 効率的な交通信号制御戦略は、交通渋滞を低減し、都市交通効率を向上し、人々の生活を促進する。
既存の信号制御のための強化学習アプローチは主に、独立したニューラルネットワークによる学習に焦点を当てている。
- 参考スコア(独自算出の注目度): 5.191217870404512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic signal control is a significant part of the construction of
intelligent transportation. An efficient traffic signal control strategy can
reduce traffic congestion, improve urban road traffic efficiency and facilitate
people's lives. Existing reinforcement learning approaches for traffic signal
control mainly focus on learning through a separate neural network. Such an
independent neural network may fall into the local optimum of the training
results. Worse more, the collected data can only be sampled once, so the data
utilization rate is low. Therefore, we propose the Random Ensemble Double DQN
Light (RELight) model. It can dynamically learn traffic signal control
strategies through reinforcement learning and combine random ensemble learning
to avoid falling into the local optimum to reach the optimal strategy.
Moreover, we introduce the Update-To-Data (UTD) ratio to control the number of
data reuses to improve the problem of low data utilization. In addition, we
have conducted sufficient experiments on synthetic data and real-world data to
prove that our proposed method can achieve better traffic signal control
effects than the existing optimal methods.
- Abstract(参考訳): 交通信号の制御は、インテリジェント輸送の構築において重要な部分である。
効率的な交通信号制御戦略は、交通渋滞を低減し、都市交通効率を向上し、人々の生活を促進する。
既存の信号制御のための強化学習アプローチは主に、独立したニューラルネットワークによる学習に焦点を当てている。
このような独立したニューラルネットワークは、トレーニング結果の局所的最適化に陥る可能性がある。
さらに悪いことに、収集されたデータは一度しかサンプリングできないため、データ利用率が低い。
そこで我々はRandom Ensemble Double DQN Light (RELight) モデルを提案する。
強化学習により交通信号制御戦略を動的に学習し、ランダムアンサンブル学習を組み合わせることで、最適戦略に到達するために局所最適に陥ることを避けることができる。
さらに,データ再利用量を制御するために更新データ(UTD)比を導入し,低利用率の問題を改善する。
さらに,合成データと実世界のデータについて十分な実験を行い,提案手法が既存の最適手法よりも優れた交通信号制御効果を達成できることを実証した。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - MoveLight: Enhancing Traffic Signal Control through Movement-Centric Deep Reinforcement Learning [13.369840354712021]
MoveLightは移動中心の深層強化学習を通じて都市交通管理を強化する新しい交通信号制御システムである。
詳細なリアルタイムデータと高度な機械学習技術を活用することで、MoveLightは従来の信号制御手法の限界を克服する。
論文 参考訳(メタデータ) (2024-07-24T14:17:16Z) - Reinforcement Learning Approaches for Traffic Signal Control under
Missing Data [5.896742981602458]
現実世界の都市では、センサーの欠如により交通状態の観察が欠如することがある。
本稿では, 適応制御を実現するために, トラフィック状態をインプットし, 適応制御とRLエージェントの訓練を可能にするために, 状態と報酬の両方をインプットする2つの方法を提案する。
論文 参考訳(メタデータ) (2023-04-21T03:26:33Z) - Output Feedback Tube MPC-Guided Data Augmentation for Robust, Efficient
Sensorimotor Policy Learning [49.05174527668836]
シミュレーション学習(IL)は、計算コストのかかるモデルベースセンシングと制御アルゴリズムによって提供されるデモから、計算効率のよいセンセータポリシーを生成することができる。
本研究では,ILと出力フィードバック頑健な管モデル予測コントローラを組み合わせることで,実演とデータ拡張戦略を併用し,ニューラルネットワークに基づくセンサモジュレータポリシーを効率的に学習する。
提案手法は,従来のIL法と比較して,実演効率が2桁向上した1つの実演から,ロバストなビズモータポリシーを学習できることを数値的に示す。
論文 参考訳(メタデータ) (2022-10-18T19:59:17Z) - Efficient Federated Learning with Spike Neural Networks for Traffic Sign
Recognition [70.306089187104]
我々は、エネルギー効率と高速モデルトレーニングのための交通信号認識に強力なスパイクニューラルネットワーク(SNN)を導入している。
数値的な結果から,提案するフェデレーションSNNは,従来のフェデレーション畳み込みニューラルネットワークよりも精度,ノイズ免疫性,エネルギー効率に優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-05-28T03:11:48Z) - ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal
Control [5.219291917441908]
本稿では,交通信号制御のためのモデルベースメタ強化学習フレームワーク(ModelLight)を提案する。
ModelLight内では、道路交差点のためのモデルのアンサンブルと最適化に基づくメタラーニング法を用いて、RLベースのトラヒックライト制御方式のデータ効率を改善する。
実世界のデータセットの実験では、ModelLightが最先端のトラヒックライト制御アルゴリズムより優れていることが示されている。
論文 参考訳(メタデータ) (2021-11-15T20:25:08Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z) - Deep traffic light detection by overlaying synthetic context on
arbitrary natural images [49.592798832978296]
深部交通光検出器のための人工的な交通関連トレーニングデータを生成する手法を提案する。
このデータは、任意の画像背景の上に偽のトラフィックシーンをブレンドするために、基本的な非現実的なコンピュータグラフィックスを用いて生成される。
また、交通信号データセットの本質的なデータ不均衡問題にも対処し、主に黄色い状態のサンプルの少なさによって引き起こされる。
論文 参考訳(メタデータ) (2020-11-07T19:57:22Z) - Batch-Augmented Multi-Agent Reinforcement Learning for Efficient Traffic
Signal Optimization [9.456254189014127]
提案手法は,現在使用されている固定時間信号機に比べて,待ち時間において交通渋滞を36%削減する。
提案手法は,現在使用されている固定時間信号計画と比較して,待ち時間において渋滞を36%低減することを示す。
論文 参考訳(メタデータ) (2020-05-19T17:53:05Z) - IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic
Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。
本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。
我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文 参考訳(メタデータ) (2020-03-06T17:17:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。