論文の概要: Safe and Efficient CAV Lane Changing using Decentralised Safety Shields
- arxiv url: http://arxiv.org/abs/2505.01453v1
- Date: Wed, 30 Apr 2025 09:11:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.121379
- Title: Safe and Efficient CAV Lane Changing using Decentralised Safety Shields
- Title(参考訳): 分散型安全シールドを用いた安全高効率CAV車線変更
- Authors: Bharathkumar Hegde, Melanie Bouroche,
- Abstract要約: レーン変更はコネクテッド・アンド・オートマチック・ビークル(CAV)の複雑な意思決定問題である
我々は、最適化とルールに基づく安全保証アプローチを組み合わせた分散ハイブリッド安全シールド(HSS)を提案する。
本手法は,CAVの縦方向および横方向の制御入力を拘束するために制御障壁関数を適用し,安全な操作を確実にする。
- 参考スコア(独自算出の注目度): 2.07180164747172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lane changing is a complex decision-making problem for Connected and Autonomous Vehicles (CAVs) as it requires balancing traffic efficiency with safety. Although traffic efficiency can be improved by using vehicular communication for training lane change controllers using Multi-Agent Reinforcement Learning (MARL), ensuring safety is difficult. To address this issue, we propose a decentralised Hybrid Safety Shield (HSS) that combines optimisation and a rule-based approach to guarantee safety. Our method applies control barrier functions to constrain longitudinal and lateral control inputs of a CAV to ensure safe manoeuvres. Additionally, we present an architecture to integrate HSS with MARL, called MARL-HSS, to improve traffic efficiency while ensuring safety. We evaluate MARL-HSS using a gym-like environment that simulates an on-ramp merging scenario with two levels of traffic densities, such as light and moderate densities. The results show that HSS provides a safety guarantee by strictly enforcing a dynamic safety constraint defined on a time headway, even in moderate traffic density that offers challenging lane change scenarios. Moreover, the proposed method learns stable policies compared to the baseline, a state-of-the-art MARL lane change controller without a safety shield. Further policy evaluation shows that our method achieves a balance between safety and traffic efficiency with zero crashes and comparable average speeds in light and moderate traffic densities.
- Abstract(参考訳): レーン変更は、交通効率と安全性のバランスをとる必要があるため、コネクテッド・アンド・オートマチック・ビークルズ(CAV)にとって複雑な意思決定問題である。
MARL(Multi-Agent Reinforcement Learning)を用いた車線変更制御装置の訓練に車両通信を用いることで、交通効率を向上させることができるが、安全性の確保は困難である。
この問題に対処するために,最適化とルールに基づく安全保証アプローチを組み合わせた分散ハイブリッド安全シールド(HSS)を提案する。
本手法は,CAVの縦方向および横方向の制御入力を拘束するために制御障壁関数を適用し,安全な操作を確実にする。
さらに,安全を確保しつつ,交通効率を向上させるため,MARL-HSSと呼ばれるHSSをMARLに統合するアーキテクチャを提案する。
MARL-HSSは,光密度と中等度密度の2段階の交通密度でオンランプマージシナリオをシミュレートするジムライクな環境を用いて評価する。
その結果,HSSは車線変更シナリオに挑戦する中程度の交通密度であっても,時間方向の動的安全制約を厳格に実施することにより,安全保証を提供することを示した。
さらに,提案手法は,安全シールドのない最先端のMARLレーン切替制御装置であるベースラインと比較して,安定した方針を学習する。
さらなる政策評価の結果,事故ゼロ,軽度,中程度の交通密度の平均速度で安全と交通効率のバランスがとれることがわかった。
関連論文リスト
- SCANS: Mitigating the Exaggerated Safety for LLMs via Safety-Conscious Activation Steering [56.92068213969036]
悪意のある命令から脅威を守るために、LLM(Large Language Models)には安全アライメントが不可欠である。
近年の研究では、過大な安全性の問題により、安全性に配慮したLCMは、良質な問い合わせを拒否する傾向にあることが明らかになっている。
過大な安全性の懸念を和らげるために,SCANS法を提案する。
論文 参考訳(メタデータ) (2024-08-21T10:01:34Z) - Safety through Permissibility: Shield Construction for Fast and Safe Reinforcement Learning [57.84059344739159]
シールドディング」は、強化学習(RL)の安全性を強制する一般的な手法である
安全と遮蔽構造に対処する新しい許容性に基づく枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T18:00:21Z) - Towards Comprehensive Post Safety Alignment of Large Language Models via Safety Patching [74.62818936088065]
textscSafePatchingは包括的なPSAのための新しいフレームワークである。
textscSafePatchingはベースラインメソッドよりも包括的なPSAを実現する。
textscSafePatchingは、連続的なPSAシナリオにおいて、その優位性を示している。
論文 参考訳(メタデータ) (2024-05-22T16:51:07Z) - Safe Hybrid-Action Reinforcement Learning-Based Decision and Control for
Discretionary Lane Change [6.221047868628538]
安全かつ適切な車線変更の実施方法は、自動運転分野における研究の一般的なトピックである。
安全なハイブリッド強化作用学習を初めて, 選別レーン変更に導入する。
PASAC-PIDLagアルゴリズムは,1kmあたり15両の交通密度において,衝突率0%,衝突率1%のPASACアルゴリズムよりも優れた安全性を示す。
論文 参考訳(メタデータ) (2024-03-01T11:03:17Z) - SafeLight: A Reinforcement Learning Method toward Collision-free Traffic
Signal Control [5.862792724739738]
アメリカの道路事故の4分の1は、信号のタイミングの問題により交差点で発生している。
安全強化強化学習法(SafeLight)を提案する。
本手法は交通の移動性を高めながら衝突を著しく低減することができる。
論文 参考訳(メタデータ) (2022-11-20T05:09:12Z) - Spatial-Temporal-Aware Safe Multi-Agent Reinforcement Learning of
Connected Autonomous Vehicles in Challenging Scenarios [10.37986799561165]
通信技術はコネクテッド・自動運転車(CAV)間の協調を可能にする
CAVのための並列安全シールドを備えた制約付きマルチエージェント強化学習(MARL)フレームワークを提案する。
その結果,提案手法は難易度の高いシナリオにおいて,システムの安全性と効率を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2022-10-05T14:39:07Z) - Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement
Learning in Unknown Stochastic Environments [84.3830478851369]
本研究では,環境を協調的に学習し,制御ポリシーを最適化する安全な強化学習手法を提案する。
本手法は, 安全性の制約を効果的に適用し, シミュレーションにより測定したシステム安全率においてCMDPベースのベースライン法を著しく上回っている。
論文 参考訳(メタデータ) (2022-09-29T20:49:25Z) - Decision-Making under On-Ramp merge Scenarios by Distributional Soft
Actor-Critic Algorithm [10.258474373022075]
SDSAC(Shield Distributional Soft Actor-critic)と呼ばれるオフライントレーニングとオンライン修正の枠組みに基づくRLベースのエンドツーエンド意思決定方法を提案する。
その結果,SDSACはベースラインアルゴリズムよりも安全性が高く,運転効率も高いことがわかった。
論文 参考訳(メタデータ) (2021-03-08T03:57:32Z) - SAINT-ACC: Safety-Aware Intelligent Adaptive Cruise Control for
Autonomous Vehicles Using Deep Reinforcement Learning [17.412117389855226]
SAINT-ACC:Setyaf-Aware Intelligent ACC system (SAINT-ACC) は、交通効率、運転安全性、運転快適性の同時最適化を実現するために設計された。
交通効率と運転安全・快適性の最適バランスを求めるために,新しい二重RLエージェントベースアプローチを開発した。
論文 参考訳(メタデータ) (2021-03-06T14:01:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。