論文の概要: Traffic Light Control with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2308.14295v1
- Date: Mon, 28 Aug 2023 04:29:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 15:43:57.885771
- Title: Traffic Light Control with Reinforcement Learning
- Title(参考訳): 強化学習による交通光制御
- Authors: Taoyu Pan
- Abstract要約: 本稿では,ディープラーニングを用いたリアルタイム交通信号制御手法を提案する。
キューの長さ、遅延、移動時間、スループットを考慮した報酬関数が組み込まれている。
モデルは現在の交通条件に基づいて動的に位相変化を決定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traffic light control is important for reducing congestion in urban mobility
systems. This paper proposes a real-time traffic light control method using
deep Q learning. Our approach incorporates a reward function considering queue
lengths, delays, travel time, and throughput. The model dynamically decides
phase changes based on current traffic conditions. The training of the deep Q
network involves an offline stage from pre-generated data with fixed schedules
and an online stage using real-time traffic data. A deep Q network structure
with a "phase gate" component is used to simplify the model's learning task
under different phases. A "memory palace" mechanism is used to address sample
imbalance during the training process. We validate our approach using both
synthetic and real-world traffic flow data on a road intersecting in Hangzhou,
China. Results demonstrate significant performance improvements of the proposed
method in reducing vehicle waiting time (57.1% to 100%), queue lengths (40.9%
to 100%), and total travel time (16.8% to 68.0%) compared to traditional fixed
signal plans.
- Abstract(参考訳): 交通光制御は都市交通システムにおける混雑軽減に重要である。
本稿では,ディープq学習を用いたリアルタイム交通光制御手法を提案する。
提案手法では,待ち時間,遅延,移動時間,スループットを考慮した報酬関数を組み込んだ。
モデルは現在の交通条件に基づいて動的に位相変化を決定する。
ディープQネットワークのトレーニングには、事前生成したデータから固定スケジュールのオフラインステージと、リアルタイムトラフィックデータを使用したオンラインステージが含まれる。
位相ゲート」コンポーネントを備えた深Qネットワーク構造を用いて、異なる位相下でのモデルの学習タスクを簡素化する。
トレーニングプロセス中にサンプルの不均衡に対処するために"メモリパレス"メカニズムが使用される。
中国杭州市で交差する道路における合成交通流データと実世界の交通流データを用いて,我々のアプローチを検証する。
その結果、車両待ち時間(57.1%から100%)、待ち行列長(40.9%から100%)、総走行時間(16.8%から68.0%)を従来の固定信号計画と比較して大幅に改善した。
関連論文リスト
- Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - Phased Deep Spatio-temporal Learning for Highway Traffic Volume
Prediction [3.8277254030074537]
3つのフェーズで日当たりの交通量を予測するために,深部時間学習法を提案する。
決定段階では、来日ネットワーク全体の料金所でのトラフィック量が効果的に達成される。
論文 参考訳(メタデータ) (2023-08-11T14:33:20Z) - Multi-graph Spatio-temporal Graph Convolutional Network for Traffic Flow
Prediction [0.5551832942032954]
毎日の交通量予測は、ネットワーク全体の料金所で依然として課題に直面している。
本稿では,流路時間深度学習による日中交通流ハイウェイ領域の相関予測手法を提案する。
本手法は,ビジネスにおけるベースラインや実践的利益よりも予測精度が向上したことを示す。
論文 参考訳(メタデータ) (2023-08-10T14:20:43Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Leveraging Neo4j and deep learning for traffic congestion simulation &
optimization [0.0]
渋滞や事故の場合に交通が後進的に伝播し,道路の他の部分への全体的影響を示す。
また、実時間トラフィックデータに基づいて連続的なRNN-LSTM(Long Short-Term Memory)ディープラーニングモデルを訓練し、道路固有の渋滞に基づいてシミュレーション結果の精度を評価する。
論文 参考訳(メタデータ) (2023-04-01T01:23:10Z) - A Slow-Shifting Concerned Machine Learning Method for Short-term Traffic
Flow Forecasting [21.6456624219159]
トラフィックフロー予測における重要な課題は、毎日のサイクルと毎週のサイクルの間の時間的ピークの緩やかなシフトである。
本稿では,2つの部分を含む交通流予測のためのスローシフト型機械学習手法を提案する。
提案手法は,ルート平均二乗誤差と平均絶対パーセンテージ誤差を用いて,最先端の結果を14.55%,62.56%向上させる。
論文 参考訳(メタデータ) (2023-03-31T03:07:53Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - An Experimental Urban Case Study with Various Data Sources and a Model
for Traffic Estimation [65.28133251370055]
我々はスイスのチューリッヒの都市ネットワーク内の地域でビデオ計測による実験キャンペーンを組織した。
我々は,既存のサーマルカメラからの測定を確実にすることで,交通の流れや走行時間の観点からの交通状況の把握に注力する。
本稿では,様々なデータソースの融合による移動時間を推定するために,単純かつ効率的な多重線形回帰(MLR)モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T08:13:57Z) - A Graph Convolutional Network with Signal Phasing Information for
Arterial Traffic Prediction [63.470149585093665]
動脈交通予測は 現代のインテリジェント交通システムの発展に 重要な役割を担っています
動脈交通予測に関する既存の研究の多くは、ループセンサからの流量と占有率の時間的測定のみを考慮し、上流と下流の検出器間のリッチな空間的関係を無視している。
我々は,信号タイミング計画から発生する空間情報を用いて,深層学習アプローチである拡散畳み込みリカレントニューラルネットワークを強化することで,このギャップを埋める。
論文 参考訳(メタデータ) (2020-12-25T01:40:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。