論文の概要: Adaptive Frequency Green Light Optimal Speed Advisory based on Hybrid
Actor-Critic Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2306.04660v1
- Date: Wed, 7 Jun 2023 01:16:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-09 18:23:30.825630
- Title: Adaptive Frequency Green Light Optimal Speed Advisory based on Hybrid
Actor-Critic Reinforcement Learning
- Title(参考訳): ハイブリッドアクター・クリティカル強化学習に基づく適応周波数グリーンライト最適速度アドバイザ
- Authors: Ming Xu, Dongyu Zuo
- Abstract要約: GLOSAシステムは、緑の間隔で交差点を通過するのを助けるために車両に速度を推奨する。
これまでの研究は、GLOSAアルゴリズムの最適化に重点を置いており、スピードアドバイザリーの頻度を無視している。
本稿では,Hybrid Proximal Policy Optimizationに基づく適応周波数GLOSAモデルを提案する。
- 参考スコア(独自算出の注目度): 2.257737378757467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Green Light Optimal Speed Advisory (GLOSA) system suggests speeds to vehicles
to assist them in passing through intersections during green intervals, thus
reducing traffic congestion and fuel consumption by minimizing the number of
stops and idle times at intersections. However, previous research has focused
on optimizing the GLOSA algorithm, neglecting the frequency of speed advisory
by the GLOSA system. Specifically, some studies provide speed advisory profile
at each decision step, resulting in redundant advisory, while others calculate
the optimal speed for the vehicle only once, which cannot adapt to dynamic
traffic. In this paper, we propose an Adaptive Frequency GLOSA (AF-GLOSA) model
based on Hybrid Proximal Policy Optimization (H-PPO), which employs an
actor-critic architecture with a hybrid actor network. The hybrid actor network
consists of a discrete actor that outputs advisory frequency and a continuous
actor that outputs acceleration profiles. Additionally, we design a novel
reward function that considers both travel efficiency and fuel consumption. The
AF-GLOSA model is evaluated in comparison to traditional GLOSA and
learning-based GLOSA methods in a three-lane intersection with a traffic signal
in SUMO, under three different levels of traffic density. The results
demonstrate that the AF-GLOSA model performs best in reducing average stop
times, fuel consumption and CO2 emissions.
- Abstract(参考訳): green light optimal speed advisory (glosa) システムは、グリーンインターバルの間、交差点を通過する速度を車両に提案し、交差点での停止数とアイドル時間を最小限に抑えることにより、交通渋滞と燃料消費量を減らす。
しかし、従来の研究では、GLOSAアルゴリズムの最適化に重点を置いており、GLOSAシステムによる速度勧告の頻度を無視している。
具体的には、各決定ステップでスピードアドバイザリープロファイルを提供し、結果として冗長なアドバイザリーが得られ、一方、動的トラフィックに適応できない車両の最適な速度を1回だけ計算する研究もある。
本稿では,ハイブリッド・アクタ・ネットワークを用いたアクタ-クリティック・アーキテクチャを用いたh-ppo(hybrid proximal policy optimization)に基づく適応周波数glosa(af-glosa)モデルを提案する。
ハイブリッドアクターネットワークは、アドバイザリー周波数を出力する個別アクターと、加速度プロファイルを出力する連続アクターとから構成される。
さらに,移動効率と燃料消費の両方を考慮した新しい報酬関数を設計する。
AF-GLOSAモデルは, 従来のGLOSA法と学習に基づくGLOSA法と比較して, SUMOの信号機との3車線交点において, 3種類の交通密度で評価される。
その結果, AF-GLOSAモデルでは, 平均停止時間, 燃料消費量, CO2排出量を削減できることがわかった。
関連論文リスト
- Traffic signal optimization in large-scale urban road networks: an adaptive-predictive controller using Ising models [4.408586742026574]
本稿では,スケーラビリティと最適性の両方を保証するAMPICという制御手法を提案する。
提案手法では,車両流の予測モデルを明確に考慮し,各制御区間における最適制御問題の解法としてモデル予測制御を用いる。
その結果,AMPICは従来の制御方式よりも待ち時間が少なく,より高速な走行が可能であった。
論文 参考訳(メタデータ) (2024-06-06T02:20:34Z) - Queue-based Eco-Driving at Roundabouts with Reinforcement Learning [0.0]
我々は、交通の流れと交通効率を高めるために、混在する交通のラウンドアバウンドでエコ運転に対処する。
我々はルールベースと強化学習ベースのエコ自動運転システムという2つのアプローチを開発した。
その結果、どちらのアプローチもベースラインを上回っていることがわかった。
論文 参考訳(メタデータ) (2024-05-01T16:48:28Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Teal: Learning-Accelerated Optimization of WAN Traffic Engineering [68.7863363109948]
本稿では,GPUの並列処理能力を活用してTE制御を高速化する学習型TEアルゴリズムTealを提案する。
問題スケールの削減と学習のトラクタビリティ向上のために,Tealはマルチエージェント強化学習(RL)アルゴリズムを用いて,各トラフィック要求を独立に割り当てる。
他のTE加速方式と比較して、Tealは需要を6~32%増やし、197~625倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2022-10-25T04:46:30Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Motion Planning and Control for Multi Vehicle Autonomous Racing at High
Speeds [100.61456258283245]
本稿では,自律走行のための多層移動計画と制御アーキテクチャを提案する。
提案手法はダララのAV-21レースカーに適用され、楕円形のレーストラックで25$m/s2$まで加速試験された。
論文 参考訳(メタデータ) (2022-07-22T15:16:54Z) - Cooperative Reinforcement Learning on Traffic Signal Control [3.759936323189418]
交通信号の制御は、道路交差点での車両の移動を調整することで、全体の走行時間を最小化することを目的とした、現実的な課題である。
既存の信号制御システムは、過度に単純化された情報とルールベースの方法に大きく依存している。
本稿では,交通信号制御最適化のための複数の報酬項をより正確に推定するために,年齢遅延重み付き協調型多目的アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-23T13:25:15Z) - Safe Model-based Off-policy Reinforcement Learning for Eco-Driving in
Connected and Automated Hybrid Electric Vehicles [3.5259944260228977]
本研究は,エコドライブ問題に対するセーフオフポジーモデルに基づく強化学習アルゴリズムを提案する。
提案アルゴリズムは, モデルフリーエージェントと比較して, 平均速度が高く, 燃費も良好である。
論文 参考訳(メタデータ) (2021-05-25T03:41:29Z) - Data-Driven Intersection Management Solutions for Mixed Traffic of
Human-Driven and Connected and Automated Vehicles [0.0]
この論文は、コネクテッドカーとオートマチックカーの存在下での都市交通制御のための2つの解決策を提案する。
まず, 協調的交差点管理問題に対して, 集中型小隊制御器を提案する。
第二に,コネクテッドカーの存在下での適応信号制御のためのデータ駆動手法を提案する。
論文 参考訳(メタデータ) (2020-12-10T01:44:45Z) - Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits [71.28712804110974]
本稿では,UAVの切断時間,ハンドオーバ速度,エネルギー消費を低減するため,MAB(Multi-armed bandit)アルゴリズムを提案する。
それぞれの性能指標(PI)が、適切な学習パラメータの範囲を採用することにより、どのように改善されるかを示す。
論文 参考訳(メタデータ) (2020-09-21T12:35:23Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。