論文の概要: Safe Hybrid-Action Reinforcement Learning-Based Decision and Control for
Discretionary Lane Change
- arxiv url: http://arxiv.org/abs/2403.00446v1
- Date: Fri, 1 Mar 2024 11:03:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 17:38:28.856659
- Title: Safe Hybrid-Action Reinforcement Learning-Based Decision and Control for
Discretionary Lane Change
- Title(参考訳): 安全なハイブリッド・アクション強化学習に基づく離散レーン変更のための決定と制御
- Authors: Ruichen Xu, Xiao Liu, Jinming Xu, Yuan Lin
- Abstract要約: 安全かつ適切な車線変更の実施方法は、自動運転分野における研究の一般的なトピックである。
安全なハイブリッド強化作用学習を初めて, 選別レーン変更に導入する。
PASAC-PIDLagアルゴリズムは,1kmあたり15両の交通密度において,衝突率0%,衝突率1%のPASACアルゴリズムよりも優れた安全性を示す。
- 参考スコア(独自算出の注目度): 6.221047868628538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous lane-change, a key feature of advanced driver-assistance systems,
can enhance traffic efficiency and reduce the incidence of accidents. However,
safe driving of autonomous vehicles remains challenging in complex
environments. How to perform safe and appropriate lane change is a popular
topic of research in the field of autonomous driving. Currently, few papers
consider the safety of reinforcement learning in autonomous lane-change
scenarios. We introduce safe hybrid-action reinforcement learning into
discretionary lane change for the first time and propose Parameterized Soft
Actor-Critic with PID Lagrangian (PASAC-PIDLag) algorithm. Furthermore, we
conduct a comparative analysis of the Parameterized Soft Actor-Critic (PASAC),
which is an unsafe version of PASAC-PIDLag. Both algorithms are employed to
train the lane-change strategy of autonomous vehicles to output discrete
lane-change decision and longitudinal vehicle acceleration. Our simulation
results indicate that at a traffic density of 15 vehicles per kilometer (15
veh/km), the PASAC-PIDLag algorithm exhibits superior safety with a collision
rate of 0%, outperforming the PASAC algorithm, which has a collision rate of
1%. The outcomes of the generalization assessments reveal that at low traffic
density levels, both the PASAC-PIDLag and PASAC algorithms are proficient in
attaining a 0% collision rate. Under conditions of high traffic flow density,
the PASAC-PIDLag algorithm surpasses PASAC in terms of both safety and
optimality.
- Abstract(参考訳): 高度な運転支援システムの重要な特徴である自律車線変更は、交通効率を高め、事故の発生率を低減する。
しかし、複雑な環境では、自動運転車の安全な運転は困難である。
安全かつ適切な車線変更の実施方法は、自動運転分野における研究の一般的なトピックである。
現在、自律車線変更シナリオにおける強化学習の安全性を考える論文は少ない。
PIDラグランジアン (PASAC-PIDLag) アルゴリズムを用いたパラメタライズド・ソフト・アクター・クリティカルを提案する。
さらに,PASAC-PIDLagの安全でないバージョンであるパラメータ化ソフトアクタークリティカル(PASAC)の比較分析を行った。
両アルゴリズムは、自動運転車の車線変更戦略を訓練し、離散車線変更決定と縦方向車両加速度を出力する。
シミュレーションの結果,PASAC-PIDLagアルゴリズムは,1kmあたり15両の交通密度(15 veh/km)において,衝突速度0%で良好な安全性を示し,衝突速度1%のPASACアルゴリズムを上回った。
一般化評価の結果,PASAC-PIDLagアルゴリズムとPASACアルゴリズムは,低トラフィック密度レベルでは,衝突速度が0%に達するのに十分であることがわかった。
高トラフィックフロー密度の条件下では、PASAC-PIDLagアルゴリズムは安全性と最適性の両方の観点からPASACを上回る。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [17.434924472015812]
本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。
その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - Automatic driving lane change safety prediction model based on LSTM [3.8749946206111603]
LSTMネットワークに基づく軌道予測法は、長い時間領域における軌道予測において明らかな利点がある。
その結果、従来のモデルベース手法と比較して、LSTMネットワークに基づく軌道予測法は、長い時間領域における軌道予測において明らかな利点があることが示された。
論文 参考訳(メタデータ) (2024-02-28T12:34:04Z) - CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文 参考訳(メタデータ) (2023-08-02T09:48:08Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Evaluating Model-free Reinforcement Learning toward Safety-critical
Tasks [70.76757529955577]
本稿では、国家安全RLの観点から、この領域における先行研究を再考する。
安全最適化と安全予測を組み合わせた共同手法であるUnrolling Safety Layer (USL)を提案する。
この領域のさらなる研究を容易にするため、我々は関連するアルゴリズムを統一パイプラインで再現し、SafeRL-Kitに組み込む。
論文 参考訳(メタデータ) (2022-12-12T06:30:17Z) - Decision-Making under On-Ramp merge Scenarios by Distributional Soft
Actor-Critic Algorithm [10.258474373022075]
SDSAC(Shield Distributional Soft Actor-critic)と呼ばれるオフライントレーニングとオンライン修正の枠組みに基づくRLベースのエンドツーエンド意思決定方法を提案する。
その結果,SDSACはベースラインアルゴリズムよりも安全性が高く,運転効率も高いことがわかった。
論文 参考訳(メタデータ) (2021-03-08T03:57:32Z) - SAINT-ACC: Safety-Aware Intelligent Adaptive Cruise Control for
Autonomous Vehicles Using Deep Reinforcement Learning [17.412117389855226]
SAINT-ACC:Setyaf-Aware Intelligent ACC system (SAINT-ACC) は、交通効率、運転安全性、運転快適性の同時最適化を実現するために設計された。
交通効率と運転安全・快適性の最適バランスを求めるために,新しい二重RLエージェントベースアプローチを開発した。
論文 参考訳(メタデータ) (2021-03-06T14:01:29Z) - Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using
Reinforcement Learning [19.71676985220504]
本稿では,衝突回避戦略とアクティベーション機能を含むDPAS設計を提案する。
運転政策適応型アクティベーション機能は、緊急脅威が検出された場合に、現在の運転方針リスクを動的に評価し、起動する必要がある。
実験の結果は自然発生運転データにより校正され, より多くの介入を伴わずに, 衝突速度を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-02T08:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。