Fugu-MT 論文翻訳(概要): ADLight: A Universal Approach of Traffic Signal Control with Augmented Data Using Reinforcement Learning

論文の概要: ADLight: A Universal Approach of Traffic Signal Control with Augmented Data Using Reinforcement Learning

arxiv url: http://arxiv.org/abs/2210.13378v1
Date: Mon, 24 Oct 2022 16:21:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-25 15:24:52.065321
Title: ADLight: A Universal Approach of Traffic Signal Control with Augmented Data Using Reinforcement Learning
Title（参考訳）: ADLight:強化学習を用いた拡張データによる交通信号制御の普遍的アプローチ
Authors: Maonan Wang, Yutong Xu, Xi Xiong, Yuheng Kan, Chengcheng Xu, Man-On Pun
Abstract要約: 本稿では,拡張データ(ADLight)を用いた新しい強化学習手法を提案する。一般化性能を向上させるために,textitmovement shuffle という新しいデータ拡張手法を開発した。その結果,本手法の性能は,単一環境で訓練されたモデルに近いことがわかった。
参考スコア（独自算出の注目度）: 3.3458830284045065
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Traffic signal control has the potential to reduce congestion in dynamic networks. Recent studies show that traffic signal control with reinforcement learning (RL) methods can significantly reduce the average waiting time. However, a shortcoming of existing methods is that they require model retraining for new intersections with different structures. In this paper, we propose a novel reinforcement learning approach with augmented data (ADLight) to train a universal model for intersections with different structures. We propose a new agent design incorporating features on movements and actions with set current phase duration to allow the generalized model to have the same structure for different intersections. A new data augmentation method named \textit{movement shuffle} is developed to improve the generalization performance. We also test the universal model with new intersections in Simulation of Urban MObility (SUMO). The results show that the performance of our approach is close to the models trained in a single environment directly (only a 5% loss of average waiting time), and we can reduce more than 80% of training time, which saves a lot of computational resources in scalable operations of traffic lights.
Abstract（参考訳）: 交通信号制御は、動的ネットワークの混雑を減少させる可能性がある。近年の研究では、強化学習法(RL)による交通信号制御が平均待ち時間を著しく短縮できることが示された。しかし、既存の方法の欠点は、異なる構造を持つ新しい交差点のモデル再訓練が必要であることである。本稿では,拡張データ(ADLight)を用いた新しい強化学習手法を提案する。本稿では,異なる交差点に対して同じ構造を持つ一般化モデルを実現するために,現在の位相期間を設定した動作と動作の特徴を取り入れた新しいエージェント設計を提案する。一般化性能を向上させるために,新しいデータ拡張法である \textit{movement shuffle} を開発した。また,都市移動シミュレーション(sumo)において,新しい交差点を用いたユニバーサルモデルをテストする。その結果,1つの環境で訓練されたモデル(平均待ち時間の5%の損失に過ぎず)に近づき,80%以上のトレーニング時間を削減でき,信号機のスケーラブルな操作において多くの計算資源を節約できることがわかった。

関連論文リスト

World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。 mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文参考訳（メタデータ） (2025-05-03T06:23:18Z)
Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。 PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文参考訳（メタデータ） (2024-11-01T00:37:00Z)
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters [65.15700861265432]
本稿では,視覚言語モデルを用いた漸進的学習における長期的忘れを緩和するパラメータ効率の連続学習フレームワークを提案する。提案手法では,Mixture-of-Experts (MoE)アダプタの統合により,事前学習したCLIPモデルの動的拡張を行う。視覚言語モデルのゼロショット認識能力を維持するために,分布判別オートセレクタを提案する。
論文参考訳（メタデータ） (2024-03-18T08:00:23Z)
Improving the generalizability and robustness of large-scale traffic signal control [3.8028221877086814]
交通信号の制御における深部強化学習(RL)アプローチの堅牢性について検討する。欠落したデータに対して,近年の手法が脆弱なままであることを示す。政策アンサンブルによる分散強化学習とバニラ強化学習の組み合わせを提案する。
論文参考訳（メタデータ） (2023-06-02T21:30:44Z)
PDFormer: Propagation Delay-Aware Dynamic Long-Range Transformer for Traffic Flow Prediction [78.05103666987655]
空間時空間グラフニューラルネットワーク(GNN)モデルは、この問題を解決する最も有望な方法の1つである。本稿では,交通流の正確な予測を行うために,遅延を意識した動的長距離トランスフォーマー(PDFormer)を提案する。提案手法は,最先端の性能を達成するだけでなく,計算効率の競争力も発揮できる。
論文参考訳（メタデータ） (2023-01-19T08:42:40Z)
Pretraining Graph Neural Networks for few-shot Analog Circuit Modeling and Design [68.1682448368636]
本稿では、新しい未知のトポロジや未知の予測タスクに適応可能な回路表現を学習するための教師付き事前学習手法を提案する。異なる回路の変動位相構造に対処するため、各回路をグラフとして記述し、グラフニューラルネットワーク(GNN)を用いてノード埋め込みを学習する。出力ノード電圧の予測における事前学習GNNは、新しい未知のトポロジや新しい回路レベル特性の予測に適応可能な学習表現を促進することができることを示す。
論文参考訳（メタデータ） (2022-03-29T21:18:47Z)
ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal Control [5.219291917441908]
本稿では,交通信号制御のためのモデルベースメタ強化学習フレームワーク(ModelLight)を提案する。 ModelLight内では、道路交差点のためのモデルのアンサンブルと最適化に基づくメタラーニング法を用いて、RLベースのトラヒックライト制御方式のデータ効率を改善する。実世界のデータセットの実験では、ModelLightが最先端のトラヒックライト制御アルゴリズムより優れていることが示されている。
論文参考訳（メタデータ） (2021-11-15T20:25:08Z)
Multi-intersection Traffic Optimisation: A Benchmark Dataset and a Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文参考訳（メタデータ） (2021-01-24T03:55:39Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)
GeneraLight: Improving Environment Generalization of Traffic Signal Control via Meta Reinforcement Learning [35.351323110536924]
本稿では,Wasserstein生成逆数ネットワークに基づく新しいトラフィックフロー生成手法を提案し,十分な多種多様な品質のトラフィックフローを生成する。 GeneraLightは、フロークラスタリングとモデルに依存しないメタラーニングのアイデアを組み合わせることで、一般化のパフォーマンスを向上する。
論文参考訳（メタデータ） (2020-09-17T04:14:28Z)
Meta Reinforcement Learning-Based Lane Change Strategy for Autonomous Vehicles [11.180588185127892]
教師付き学習アルゴリズムは、大量のラベル付きデータをトレーニングすることで、新しい環境に一般化することができる。しばしば、新しい環境ごとに十分なデータを得るために、実用的または費用を抑えることができる。エージェントの一般化能力を向上させるメタ強化学習(MRL)法を提案する。
論文参考訳（メタデータ） (2020-08-28T02:57:11Z)
IG-RL: Inductive Graph Reinforcement Learning for Massive-Scale Traffic Signal Control [4.273991039651846]
適応的な交通信号制御のスケーリングには、状態と行動空間を扱う必要がある。本稿では,グラフ畳み込みネットワークに基づくインダクティブグラフ強化学習(IG-RL)を紹介する。我々のモデルは、新しい道路網、交通分布、交通体制に一般化することができる。
論文参考訳（メタデータ） (2020-03-06T17:17:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。