論文の概要: HONEST-CAV: Hierarchical Optimization of Network Signals and Trajectories for Connected and Automated Vehicles with Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.18740v1
- Date: Sat, 21 Feb 2026 07:27:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.275134
- Title: HONEST-CAV: Hierarchical Optimization of Network Signals and Trajectories for Connected and Automated Vehicles with Multi-Agent Reinforcement Learning
- Title(参考訳): HONEST-CAV:マルチエージェント強化学習によるネットワーク信号と軌道の階層的最適化
- Authors: Ziyan Zhang, Changxin Wan, Peng Hao, Kanok Boriboonsomsin, Matthew J. Barth, Yongkang Liu, Seyhan Ucar, Guoyuan Wu,
- Abstract要約: 本研究では、HV(Human-driven Vehicles)、Connected and Automated Vehicles(CAV)からなる混在交通のための階層型ネットワークレベルのトラフィックフロー制御フレームワークを提案する。
このフレームワークは、車両レベルのエコドライブ行動と交差点レベルの交通信号制御を共同で最適化し、全体のネットワーク効率を高め、エネルギー消費を減少させる。
- 参考スコア(独自算出の注目度): 17.40474300735107
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study presents a hierarchical, network-level traffic flow control framework for mixed traffic consisting of Human-driven Vehicles (HVs), Connected and Automated Vehicles (CAVs). The framework jointly optimizes vehicle-level eco-driving behaviors and intersection-level traffic signal control to enhance overall network efficiency and decrease energy consumption. A decentralized Multi-Agent Reinforcement Learning (MARL) approach by Value Decomposition Network (VDN) manages cycle-based traffic signal control (TSC) at intersections, while an innovative Signal Phase and Timing (SPaT) prediction method integrates a Machine Learning-based Trajectory Planning Algorithm (MLTPA) to guide CAVs in executing Eco-Approach and Departure (EAD) maneuvers. The framework is evaluated across varying CAV proportions and powertrain types to assess its effects on mobility and energy performance. Experimental results conducted in a 4*4 real-world network demonstrate that the MARL-based TSC method outperforms the baseline model (i.e., Webster method) in speed, fuel consumption, and idling time. In addition, with MLTPA, HONEST-CAV benefits the traffic system further in energy consumption and idling time. With a 60% CAV proportion, vehicle average speed, fuel consumption, and idling time can be improved/saved by 7.67%, 10.23%, and 45.83% compared with the baseline. Furthermore, discussions on CAV proportions and powertrain types are conducted to quantify the performance of the proposed method with the impact of automation and electrification.
- Abstract(参考訳): 本研究では、HV(Human-driven Vehicles)、Connected and Automated Vehicles(Connected and Automated Vehicles)からなる混在トラフィックのための階層的なネットワークレベルのトラフィックフロー制御フレームワークを提案する。
このフレームワークは、車両レベルのエコドライブ行動と交差点レベルの交通信号制御を共同で最適化し、全体のネットワーク効率を高め、エネルギー消費を減らす。
Value Decomposition Network (VDN) による分散マルチエージェント強化学習 (MARL) アプローチでは、交差点における周期に基づく交通信号制御 (TSC) を管理し、革新的な信号位相とタイミング (SPaT) 予測手法では、機械学習ベースの軌道計画アルゴリズム (MLTPA) を統合して、Eco-Approach and Departure (EAD) 操作の実行においてCAVを誘導する。
このフレームワークは、様々なCAV比とパワートレインタイプで評価され、モビリティとエネルギー性能への影響を評価する。
4*4実世界のネットワークで実施された実験結果から,MARLに基づくTSC法は,速度,燃料消費,アイドリング時間において,ベースラインモデル(Webster法)よりも優れていた。
さらに、MLTPAにより、HONEST-CAVは、エネルギー消費とアイドリング時間において交通システムにさらに恩恵を与える。
60%のCAV比率で、車両の平均速度、燃料消費、アイドリング時間は、ベースラインと比較して7.67%、10.23%、45.83%改善できる。
さらに,CAV比とパワートレインタイプに関する議論を行い,自動化と電化の影響で提案手法の性能を定量化する。
関連論文リスト
- Optimizing Multi-Lane Intersection Performance in Mixed Autonomy Environments [0.0]
本稿では,グラフ注意ネットワーク(GAT)とSoft Actor-Critic(SAC)強化学習を組み合わせた新しい交通信号制御フレームワークを提案する。
提案したSACは、エントロピー最適化決定による適応的な信号制御を可能にする頑健な非政治強化学習アルゴリズムである。
実験の結果,従来の手法と比較して平均遅延時間を24.1%削減し,トラフィック違反を29.2%減少させることにより,GAT-SACアプローチの有効性を示した。
論文 参考訳(メタデータ) (2025-11-04T03:10:47Z) - STAR-RIS-assisted Collaborative Beamforming for Low-altitude Wireless Networks [58.13757830013997]
無人航空機(UAV)に基づく無線ネットワークは、都市コミュニケーションに高いモビリティ、柔軟性、カバーを提供する。
閉塞により、密集した環境では信号の減衰が激しい。
この重要な問題に対処するために、UAVの協調ビームの導入と全方向逆方向ビームフォーミングについて検討する。
論文 参考訳(メタデータ) (2025-10-25T01:28:37Z) - Neighbor-Aware Reinforcement Learning for Mixed Traffic Optimization in Large-scale Networks [1.9413548770753521]
本稿では,交差する交差点を横断する混在トラフィックを調整するための強化学習フレームワークを提案する。
我々の重要な貢献は、RVがネットワーク間のバランスの取れた分散を維持することができる隣り合わせの報酬メカニズムである。
その結果,最先端の単一断面制御方式と比較して平均待ち時間を39.2%削減できることがわかった。
論文 参考訳(メタデータ) (2024-12-17T07:35:56Z) - Improving Traffic Flow Predictions with SGCN-LSTM: A Hybrid Model for Spatial and Temporal Dependencies [55.2480439325792]
本稿ではSGCN-LSTM(Signal-Enhanced Graph Convolutional Network Long Short Term Memory)モデルを提案する。
PEMS-BAYロードネットワークトラフィックデータセットの実験は、SGCN-LSTMモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-11-01T00:37:00Z) - A Holistic Framework Towards Vision-based Traffic Signal Control with
Microscopic Simulation [53.39174966020085]
交通信号制御(TSC)は交通渋滞を低減し、交通の流れを円滑にし、アイドリング時間を短縮し、CO2排出量を減らすために重要である。
本研究では,道路交通の流れを視覚的観察によって調節するTSCのコンピュータビジョンアプローチについて検討する。
我々は、視覚ベースのTSCとそのベンチマークに向けて、TrafficDojoと呼ばれる総合的なトラフィックシミュレーションフレームワークを導入する。
論文 参考訳(メタデータ) (2024-03-11T16:42:29Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Eco-driving for Electric Connected Vehicles at Signalized Intersections:
A Parameterized Reinforcement Learning approach [6.475252042082737]
本稿では、強化学習(RL)に基づく電気連系車両(CV)のエコ駆動フレームワークを提案する。
我々の戦略は、他の人間駆動車(HDV)を中断することなく適切な行動スキームを学習することで、エネルギー消費を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2022-06-24T04:11:28Z) - Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected
and Automated Vehicles at Signalized Intersections [3.401874022426856]
視覚知覚法は車間通信(V2I)と統合され、より高モビリティとエネルギー効率を実現する。
HRLフレームワークには3つのコンポーネントがある。ルールベースのドライビングマネージャで、ルールベースのポリシーとRLポリシーの協調を運用する。
実験により, HRL法によりエネルギー消費量を12.70%削減し, 11.75%の移動時間を省くことができた。
論文 参考訳(メタデータ) (2022-01-19T19:31:12Z) - Network-wide traffic signal control optimization using a multi-agent
deep reinforcement learning [20.385286762476436]
非効率な交通制御は、交通渋滞やエネルギー廃棄物などの多くの問題を引き起こす可能性がある。
本論文では,交通信号間の協調性を高めることで最適制御を実現するマルチエージェント強化学習手法であるKS-DDPGを提案する。
論文 参考訳(メタデータ) (2021-04-20T12:53:08Z) - Federated Learning on the Road: Autonomous Controller Design for
Connected and Autonomous Vehicles [109.71532364079711]
CAV(コネクテッド・アンド・自律車両)の自律制御設計のための新しい統合学習(FL)フレームワークの提案
CAVの移動性、無線フェーディングチャネル、および不均衡で非独立で同一に分散されたデータを考慮に入れた新しい動的フェデレーション・プロキシ(DFP)アルゴリズムが提案されている。
最適制御器を用いてCAVがどの程度の速度で収束するかを同定するために,提案アルゴリズムに対して厳密な収束解析を行う。
論文 参考訳(メタデータ) (2021-02-05T19:57:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。