論文の概要: Adaptive Kalman-based hybrid car following strategy using TD3 and CACC
- arxiv url: http://arxiv.org/abs/2312.15993v1
- Date: Tue, 26 Dec 2023 10:51:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 15:20:25.267225
- Title: Adaptive Kalman-based hybrid car following strategy using TD3 and CACC
- Title(参考訳): TD3とCACCを用いたカルマン型ハイブリッド車追従戦略
- Authors: Yuqi Zheng, Ruidong Yan, Bin Jia, Rui Jiang, Adriana TAPUS, Xiaojing
Chen, Shiteng Zheng, Ying Shang
- Abstract要約: 自律運転においては、深部強化学習と協調適応クルーズ制御(CACC)のハイブリッド戦略は、後続車の性能を著しく向上させることができる。
固定係数に基づく従来のハイブリッド戦略では、混在するトラフィックフローのシナリオに適応することが困難である。
CACC と Twin Delayed Deep Deterministic Policy Gradient (TD3) アルゴリズムに関して,適応カルマンフィルタに基づくハイブリッドカーの追従戦略を提案する。
- 参考スコア(独自算出の注目度): 5.052960220478617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In autonomous driving, the hybrid strategy of deep reinforcement learning and
cooperative adaptive cruise control (CACC) can fully utilize the advantages of
the two algorithms and significantly improve the performance of car following.
However, it is challenging for the traditional hybrid strategy based on fixed
coefficients to adapt to mixed traffic flow scenarios, which may decrease the
performance and even lead to accidents. To address the above problems, a hybrid
car following strategy based on an adaptive Kalman Filter is proposed by
regarding CACC and Twin Delayed Deep Deterministic Policy Gradient (TD3)
algorithms. Different from traditional hybrid strategy based on fixed
coefficients, the Kalman gain H, using as an adaptive coefficient, is derived
from multi-timestep predictions and Monte Carlo Tree Search. At the end of
study, simulation results with 4157745 timesteps indicate that, compared with
the TD3 and HCFS algorithms, the proposed algorithm in this study can
substantially enhance the safety of car following in mixed traffic flow without
compromising the comfort and efficiency.
- Abstract(参考訳): 自律運転において、深部強化学習と協調適応クルーズ制御(CACC)のハイブリッド戦略は、2つのアルゴリズムの利点を完全に活用し、追従車の性能を大幅に向上させることができる。
しかしながら,トラヒックフローの混合シナリオに適合する固定係数に基づく従来のハイブリッド戦略では,性能が低下し,さらには事故につながる可能性がある。
以上の問題に対処するため、適応カルマンフィルタに基づくハイブリッドカーをCACCとツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムで提案する。
固定係数に基づく従来のハイブリッド戦略とは異なり、適応係数として用いられるカルマンゲインhは、マルチタイムステップ予測とモンテカルロ木探索から導かれる。
4157745の時間ステップを用いたシミュレーションの結果,提案手法は,td3およびhcfsアルゴリズムと比較して,快適性と効率を損なうことなく,混合交通流における車追従の安全性を著しく向上できることがわかった。
関連論文リスト
- Adaptive Frequency Green Light Optimal Speed Advisory based on Hybrid
Actor-Critic Reinforcement Learning [2.257737378757467]
GLOSAシステムは、緑の間隔で交差点を通過するのを助けるために車両に速度を推奨する。
これまでの研究は、GLOSAアルゴリズムの最適化に重点を置いており、スピードアドバイザリーの頻度を無視している。
本稿では,Hybrid Proximal Policy Optimization (H-PPO) に基づく適応周波数GLOSAモデルを提案する。
論文 参考訳(メタデータ) (2023-06-07T01:16:45Z) - Roulette-Wheel Selection-Based PSO Algorithm for Solving the Vehicle
Routing Problem with Time Windows [58.891409372784516]
本稿では,Roulette Wheel Method (RWPSO) を用いた新しいPSO手法を提案する。
RWPSOのSolomon VRPTWベンチマークデータセットを用いた実験は、RWPSOが文学の他の最先端アルゴリズムと競合していることを示している。
論文 参考訳(メタデータ) (2023-06-04T09:18:02Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Eco-driving for Electric Connected Vehicles at Signalized Intersections:
A Parameterized Reinforcement Learning approach [6.475252042082737]
本稿では、強化学習(RL)に基づく電気連系車両(CV)のエコ駆動フレームワークを提案する。
我々の戦略は、他の人間駆動車(HDV)を中断することなく適切な行動スキームを学習することで、エネルギー消費を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2022-06-24T04:11:28Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Safe Model-based Off-policy Reinforcement Learning for Eco-Driving in
Connected and Automated Hybrid Electric Vehicles [3.5259944260228977]
本研究は,エコドライブ問題に対するセーフオフポジーモデルに基づく強化学習アルゴリズムを提案する。
提案アルゴリズムは, モデルフリーエージェントと比較して, 平均速度が高く, 燃費も良好である。
論文 参考訳(メタデータ) (2021-05-25T03:41:29Z) - Hybrid Car-Following Strategy based on Deep Deterministic Policy
Gradient and Cooperative Adaptive Cruise Control [7.016756906859412]
深度決定論的政策勾配(DDPG)と協調適応巡航制御(CACC)に基づくハイブリッドカーフォロー戦略を提案する。
提案手法は,CACCによる車追従の基本的な性能を保証するとともに,DDPGによる複雑な環境探索の利点をフル活用する。
論文 参考訳(メタデータ) (2021-02-24T17:37:47Z) - Average-Reward Off-Policy Policy Evaluation with Function Approximation [66.67075551933438]
平均報酬MDPの関数近似によるオフポリシ政策評価を検討する。
ブートストラップは必要であり、オフポリシ学習とFAと一緒に、致命的なトライアドをもたらす。
そこで本研究では,勾配型tdアルゴリズムの成功を再現する2つの新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-08T00:43:04Z) - Multi-Agent Reinforcement Learning in NOMA-aided UAV Networks for
Cellular Offloading [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T20:22:05Z) - Tactical Decision Making for Emergency Vehicles Based on A Combinational
Learning Method [3.995104718683131]
ルールベースの回避戦略(AS)が考案され、EVの前に優先されたゾーンのCVはそれを避けるために車線を加速または変更すべきである。
速度適応型コンパクト状態空間(SC-DQN)を持つ新しいDQN法をEVの高速機能に適合させる。
次のアプローチは、DRLが一般化におけるルールベースの回避戦略を補完し、それらの組み合わせにより、応答時間が少なく、衝突速度が低く、軌道が滑らかになることを示している。
論文 参考訳(メタデータ) (2020-09-09T10:41:56Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。