論文の概要: Adaptive Kalman-based hybrid car following strategy using TD3 and CACC
- arxiv url: http://arxiv.org/abs/2312.15993v1
- Date: Tue, 26 Dec 2023 10:51:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 15:20:25.267225
- Title: Adaptive Kalman-based hybrid car following strategy using TD3 and CACC
- Title(参考訳): TD3とCACCを用いたカルマン型ハイブリッド車追従戦略
- Authors: Yuqi Zheng, Ruidong Yan, Bin Jia, Rui Jiang, Adriana TAPUS, Xiaojing
Chen, Shiteng Zheng, Ying Shang
- Abstract要約: 自律運転においては、深部強化学習と協調適応クルーズ制御(CACC)のハイブリッド戦略は、後続車の性能を著しく向上させることができる。
固定係数に基づく従来のハイブリッド戦略では、混在するトラフィックフローのシナリオに適応することが困難である。
CACC と Twin Delayed Deep Deterministic Policy Gradient (TD3) アルゴリズムに関して,適応カルマンフィルタに基づくハイブリッドカーの追従戦略を提案する。
- 参考スコア(独自算出の注目度): 5.052960220478617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In autonomous driving, the hybrid strategy of deep reinforcement learning and
cooperative adaptive cruise control (CACC) can fully utilize the advantages of
the two algorithms and significantly improve the performance of car following.
However, it is challenging for the traditional hybrid strategy based on fixed
coefficients to adapt to mixed traffic flow scenarios, which may decrease the
performance and even lead to accidents. To address the above problems, a hybrid
car following strategy based on an adaptive Kalman Filter is proposed by
regarding CACC and Twin Delayed Deep Deterministic Policy Gradient (TD3)
algorithms. Different from traditional hybrid strategy based on fixed
coefficients, the Kalman gain H, using as an adaptive coefficient, is derived
from multi-timestep predictions and Monte Carlo Tree Search. At the end of
study, simulation results with 4157745 timesteps indicate that, compared with
the TD3 and HCFS algorithms, the proposed algorithm in this study can
substantially enhance the safety of car following in mixed traffic flow without
compromising the comfort and efficiency.
- Abstract(参考訳): 自律運転において、深部強化学習と協調適応クルーズ制御(CACC)のハイブリッド戦略は、2つのアルゴリズムの利点を完全に活用し、追従車の性能を大幅に向上させることができる。
しかしながら,トラヒックフローの混合シナリオに適合する固定係数に基づく従来のハイブリッド戦略では,性能が低下し,さらには事故につながる可能性がある。
以上の問題に対処するため、適応カルマンフィルタに基づくハイブリッドカーをCACCとツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムで提案する。
固定係数に基づく従来のハイブリッド戦略とは異なり、適応係数として用いられるカルマンゲインhは、マルチタイムステップ予測とモンテカルロ木探索から導かれる。
4157745の時間ステップを用いたシミュレーションの結果,提案手法は,td3およびhcfsアルゴリズムと比較して,快適性と効率を損なうことなく,混合交通流における車追従の安全性を著しく向上できることがわかった。
関連論文リスト
- A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles [9.840325772591024]
本稿では,マルチエージェント・マルコフゲームに対する並列更新によるモンテカルロ木探索(MCTS)手法を提案する。
部分定常交通流における多車両共同動作空間の並列動作を解析することにより、並列更新法は潜在的危険な動作を迅速に排除することができる。
論文 参考訳(メタデータ) (2024-09-20T03:13:01Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Adaptive traffic signal safety and efficiency improvement by multi objective deep reinforcement learning approach [0.0]
本研究では,多目的深部強化学習(DRL)技術を活用した適応交通信号制御(ATSC)の革新的手法を提案する。
提案手法は, 安全, 効率, 脱炭目標に対処しながら, 交差点における制御戦略を強化することを目的としている。
論文 参考訳(メタデータ) (2024-08-01T13:10:41Z) - Performance Comparison of Deep RL Algorithms for Mixed Traffic Cooperative Lane-Changing [3.4761212729163304]
車線変更は、交通環境の複雑なダイナミクスと高い不確実性のため、コネクテッドおよび自動走行車(CAV)にとって難しいシナリオである。
本研究では,HV(Human-driven Vehicle)の不確かさと,HVとCAVの微視的相互作用を両立させることにより,現在のCLCMT機構を強化する。
4つのDRLアルゴリズムの性能比較により,DDPG,TD3,SAC,PPOアルゴリズムが交通環境の不確実性に対処可能であることが示された。
論文 参考訳(メタデータ) (2024-06-25T07:49:25Z) - Deep-Reinforcement-Learning-Based AoI-Aware Resource Allocation for RIS-Aided IoV Networks [43.443526528832145]
車両間通信(V2X)方式を考慮したRIS支援車両インターネット(IoV)を提案する。
車両間リンク(V2I)のタイムラインと車両間リンク(V2V)の安定性を改善するため,情報量(AoI)モデルとペイロード伝達確率モデルを導入する。
論文 参考訳(メタデータ) (2024-06-17T06:16:07Z) - Roulette-Wheel Selection-Based PSO Algorithm for Solving the Vehicle
Routing Problem with Time Windows [58.891409372784516]
本稿では,Roulette Wheel Method (RWPSO) を用いた新しいPSO手法を提案する。
RWPSOのSolomon VRPTWベンチマークデータセットを用いた実験は、RWPSOが文学の他の最先端アルゴリズムと競合していることを示している。
論文 参考訳(メタデータ) (2023-06-04T09:18:02Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Safe Model-based Off-policy Reinforcement Learning for Eco-Driving in
Connected and Automated Hybrid Electric Vehicles [3.5259944260228977]
本研究は,エコドライブ問題に対するセーフオフポジーモデルに基づく強化学習アルゴリズムを提案する。
提案アルゴリズムは, モデルフリーエージェントと比較して, 平均速度が高く, 燃費も良好である。
論文 参考訳(メタデータ) (2021-05-25T03:41:29Z) - Using Kalman Filter The Right Way: Noise Estimation Is Not Optimal [46.556605821252276]
kfの仮定を少しでも破っても、効果のあるノイズを著しく修正できることを示す。
KFの対称および正定値(SPD)パラメータに勾配に基づく最適化を効率的に適用する方法を提案する。
論文 参考訳(メタデータ) (2021-04-06T08:59:15Z) - Hybrid Car-Following Strategy based on Deep Deterministic Policy
Gradient and Cooperative Adaptive Cruise Control [7.016756906859412]
深度決定論的政策勾配(DDPG)と協調適応巡航制御(CACC)に基づくハイブリッドカーフォロー戦略を提案する。
提案手法は,CACCによる車追従の基本的な性能を保証するとともに,DDPGによる複雑な環境探索の利点をフル活用する。
論文 参考訳(メタデータ) (2021-02-24T17:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。