論文の概要: Optimizing Traffic Signal Control using High-Dimensional State Representation and Efficient Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2411.07759v1
- Date: Tue, 12 Nov 2024 12:37:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-13 13:20:12.830266
- Title: Optimizing Traffic Signal Control using High-Dimensional State Representation and Efficient Deep Reinforcement Learning
- Title(参考訳): 高次元状態表現と効率的な深層強化学習を用いた交通信号制御の最適化
- Authors: Lawrence Francis, Blessed Guda, Ahmed Biyabani,
- Abstract要約: 最近の研究では、高次元状態表現の使用は交通信号制御(TSC)の性能向上に繋がらないことが示唆されている。
実験結果から,高次元状態表現を用いることで,平均待ち時間の最大17.9%が向上し,TSC性能が向上する可能性が示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In reinforcement learning-based (RL-based) traffic signal control (TSC), decisions on the signal timing are made based on the available information on vehicles at a road intersection. This forms the state representation for the RL environment which can either be high-dimensional containing several variables or a low-dimensional vector. Current studies suggest that using high dimensional state representations does not lead to improved performance on TSC. However, we argue, with experimental results, that the use of high dimensional state representations can, in fact, lead to improved TSC performance with improvements up to 17.9% of the average waiting time. This high-dimensional representation is obtainable using the cost-effective vehicle-to-infrastructure (V2I) communication, encouraging its adoption for TSC. Additionally, given the large size of the state, we identified the need to have computational efficient models and explored model compression via pruning.
- Abstract(参考訳): 強化学習に基づく(RLに基づく)交通信号制御(TSC)では、道路交差点における車両の情報に基づいて信号タイミングの決定を行う。
これは、複数の変数を含む高次元または低次元ベクトルであるRL環境の状態表現を形成する。
最近の研究では、高次元状態表現を用いることで、TSCの性能が向上しないことが示唆されている。
しかし, 実験結果から, 高次元状態表現を用いることで, 平均待ち時間の最大17.9%が向上し, TSC性能が向上する可能性が示唆された。
この高次元表現は、コスト効率のよいV2I通信を用いて得られ、TSCの採用を促進する。
さらに, 状態が大きければ, 計算効率のよいモデルの必要性を認識し, プルーニングによるモデル圧縮について検討した。
関連論文リスト
- Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - CCSPNet-Joint: Efficient Joint Training Method for Traffic Sign
Detection Under Extreme Conditions [3.6190463374643795]
CCSPNetはContextual TransformerとCNNをベースにした効率的な特徴抽出モジュールである。
データ効率と一般化を改善するための共同トレーニングモデルCCSPNet-Jointを提案する。
実験により,CCSPNetは極端条件下での交通標識検出において最先端の性能を達成することが示された。
論文 参考訳(メタデータ) (2023-09-13T12:00:33Z) - Leveraging Queue Length and Attention Mechanisms for Enhanced Traffic
Signal Control Optimization [3.0309252269809264]
本稿では、待ち行列長を効率的な状態表現として利用する交通信号制御(TSC)について述べる。
複数の実世界のデータセットに関する総合的な実験は、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2021-12-30T09:24:09Z) - Expression is enough: Improving traffic signal control with advanced
traffic state representation [24.917612761503996]
フレキシブルで簡便な新手法であるアドバンストマックスプレッシャー(Advanced-MP)を提案する。
我々はまた、ATSと現在のRLアプローチを組み合わせたRLベースのアルゴリズムテンプレートAdvanced-XLightを開発し、「Advanced-MPLight」と「Advanced-CoLight」の2つのRLアルゴリズムを生成する。
複数の実世界のデータセットに関する総合的な実験によると、(1)Advanced-MPは、デプロイに効率的で信頼性の高いベースラインメソッドよりも優れており、(2)Advanced-MPLightとAdvanced-CoLightは、新しい最先端を実現することができる。
論文 参考訳(メタデータ) (2021-12-19T10:28:39Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Spatio-temporal Modeling for Large-scale Vehicular Networks Using Graph
Convolutional Networks [110.80088437391379]
SMARTと呼ばれるグラフベースのフレームワークが提案され、大規模な地理的領域にわたるV2I通信遅延の統計をモデル化し、追跡する。
深層Q-networksアルゴリズムと統合したグラフ畳み込みネットワークを用いたグラフ再構築型手法を開発する。
その結果,提案手法は,モデル化の精度と効率と,大規模車両ネットワークにおける遅延性能を有意に向上させることが示された。
論文 参考訳(メタデータ) (2021-03-13T06:56:29Z) - Physics-Informed Deep Learning for Traffic State Estimation [3.779860024918729]
交通状態推定(TSE)は、部分的に観測されたデータを用いて道路セグメント上の交通変数(例えば密度)を再構築する。
本論文では,少量の観測データを用いて高品質なTSEを効率的に実行するための物理情報深層学習(PIDL)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2021-01-17T03:28:32Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。