論文の概要: Optimizing Traffic Lights with Multi-agent Deep Reinforcement Learning
and V2X communication
- arxiv url: http://arxiv.org/abs/2002.09853v1
- Date: Sun, 23 Feb 2020 07:43:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:28:21.883585
- Title: Optimizing Traffic Lights with Multi-agent Deep Reinforcement Learning
and V2X communication
- Title(参考訳): 多エージェント深層強化学習とv2x通信による交通信号の最適化
- Authors: Azhar Hussain, Tong Wang and Cao Jiahua
- Abstract要約: 本稿では,多エージェント深部強化学習とV2X通信を用いた交通信号の持続時間を最適化するシステムについて考察する。
本システムは,複数エージェントに対する独立報酬と共有報酬を分析し,信号の時間制御を目的とする。
- 参考スコア(独自算出の注目度): 5.40232936994133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider a system to optimize duration of traffic signals using
multi-agent deep reinforcement learning and Vehicle-to-Everything (V2X)
communication. This system aims at analyzing independent and shared rewards for
multi-agents to control duration of traffic lights. A learning agent traffic
light gets information along its lanes within a circular V2X coverage. The
duration cycles of traffic light are modeled as Markov decision Processes. We
investigate four variations of reward functions. The first two are
unshared-rewards: based on waiting number, and waiting time of vehicles between
two cycles of traffic light. The third and fourth functions are: shared-rewards
based on waiting cars, and waiting time for all agents. Each agent has a memory
for optimization through target network and prioritized experience replay. We
evaluate multi-agents through the Simulation of Urban MObility (SUMO)
simulator. The results prove effectiveness of the proposed system to optimize
traffic signals and reduce average waiting cars to 41.5 % as compared to the
traditional periodic traffic control system.
- Abstract(参考訳): マルチエージェント深部強化学習とV2X通信を用いた交通信号の持続時間を最適化するシステムを提案する。
本システムは,複数エージェントに対する独立報酬と共有報酬を分析し,信号の時間制御を目的とする。
学習エージェントtraffic lightは、円形のv2xカバレッジ内のレーンに沿って情報を取得する。
信号機の時間周期はマルコフ決定プロセスとしてモデル化される。
報酬関数の4つのバリエーションを調査した。
最初の2つは未共有で、待機数と2サイクルの信号の間の車両の待ち時間に基づいている。
第3と第4の機能は、待機車に基づく共用リワードと、すべてのエージェントの待機時間である。
各エージェントは、ターゲットネットワークを介して最適化するためのメモリを持ち、エクスペリエンスの再生を優先する。
都市運動シミュレーション(SUMO)シミュレータによるマルチエージェントの評価を行った。
提案手法は,従来の周期的交通制御システムと比較して,交通信号の最適化と平均待機車数を41.5%削減する効果を示す。
関連論文リスト
- Reinforcement Learning for Adaptive Traffic Signal Control: Turn-Based and Time-Based Approaches to Reduce Congestion [2.733700237741334]
本稿では,交差点における信号処理の強化にReinforcement Learning(強化学習)を用いることについて検討する。
本稿では,リアルタイム待ち行列長に基づく信号の動的優先順位付けを行うターンベースエージェントと,交通条件に応じた信号位相長の調整を行うタイムベースエージェントの2つのアルゴリズムを紹介する。
シミュレーションの結果、両RLアルゴリズムは従来の信号制御システムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-08-28T12:35:56Z) - TrafficGPT: Towards Multi-Scale Traffic Analysis and Generation with Spatial-Temporal Agent Framework [3.947797359736224]
我々は3つのAIエージェントを用いてマルチスケールトラフィックデータを処理するマルチスケールトラフィック生成システムであるTrafficGPTを設計した。
TrafficGPTは,1)ユーザと対話し,テキストを介して予測タスクを抽出するテキスト・ツー・デマンドエージェント,2)マルチスケールトラフィックデータを利用して時間的特徴と類似性を生成するトラフィック予測エージェント,3)予測結果を用いて提案や視覚化を行う提案・可視化エージェントの3つの重要なAIエージェントから構成される。
論文 参考訳(メタデータ) (2024-05-08T07:48:40Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Cooperative Reinforcement Learning on Traffic Signal Control [3.759936323189418]
交通信号の制御は、道路交差点での車両の移動を調整することで、全体の走行時間を最小化することを目的とした、現実的な課題である。
既存の信号制御システムは、過度に単純化された情報とルールベースの方法に大きく依存している。
本稿では,交通信号制御最適化のための複数の報酬項をより正確に推定するために,年齢遅延重み付き協調型多目的アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-23T13:25:15Z) - An Intelligent Self-driving Truck System For Highway Transportation [81.12838700312308]
本稿では,インテリジェントな自動運転トラックシステムについて紹介する。
提案システムは,1)テストシナリオにおける現実的なトラフィックフローを生成する現実的なトラフィックシミュレーションモジュール,2)実環境における実際のトラックの応答を模倣するために設計,評価された高忠実度トラックモデル,の3つの主要コンポーネントから構成される。
また,提案するシステムを実車に展開し,実車間ギャップを緩和するシステムの能力を示す実物実験を行う。
論文 参考訳(メタデータ) (2021-12-31T04:54:13Z) - Reinforcement Learning for Mixed Autonomy Intersections [4.771833920251869]
シミュレーショントラフィックネットワークにおける混合自律性トラフィックを制御するためのモデルフリー強化学習手法を提案する。
本手法は,任意の数の制御車両に対して,局所的な観測に基づく分散制御が可能なマルチエージェントポリシー分解を利用する。
論文 参考訳(メタデータ) (2021-11-08T18:03:18Z) - An Experimental Urban Case Study with Various Data Sources and a Model
for Traffic Estimation [65.28133251370055]
我々はスイスのチューリッヒの都市ネットワーク内の地域でビデオ計測による実験キャンペーンを組織した。
我々は,既存のサーマルカメラからの測定を確実にすることで,交通の流れや走行時間の観点からの交通状況の把握に注力する。
本稿では,様々なデータソースの融合による移動時間を推定するために,単純かつ効率的な多重線形回帰(MLR)モデルを提案する。
論文 参考訳(メタデータ) (2021-08-02T08:13:57Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Assessment of Reward Functions in Reinforcement Learning for Multi-Modal
Urban Traffic Control under Real-World limitations [0.0]
本稿では,歩行者と車両の交差点を制御するために,30種類の強化学習報酬関数を頑健に評価する。
我々は、マンチェスター大都市圏における実際の交差点の需要、センサー、グリーンタイム、その他の運用上の制約について、キャリブレーションされたモデルを使用します。
論文 参考訳(メタデータ) (2020-10-17T16:20:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。