論文の概要: Risk-anticipatory autonomous driving strategies considering vehicles'
weights, based on hierarchical deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2401.08661v1
- Date: Wed, 27 Dec 2023 06:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 09:38:12.209641
- Title: Risk-anticipatory autonomous driving strategies considering vehicles'
weights, based on hierarchical deep reinforcement learning
- Title(参考訳): 階層的深層強化学習に基づく車両重みを考慮したリスク予測自律運転戦略
- Authors: Di Chen, Hao Li, Zhicheng Jin and Huizhao Tu
- Abstract要約: 本研究では,周囲の車両の重量を考慮し,リスク予測に基づく自律運転戦略を開発する。
リスクフィールド理論に基づいて、周囲の車両の重量を統合するリスクインジケータを提案し、自律運転決定に組み込んだ。
衝突時の潜在的な衝突エネルギーを示す指標を新たに提案し, AV駆動方式の性能評価を行った。
- 参考スコア(独自算出の注目度): 11.465760521923768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles (AVs) have the potential to prevent accidents caused by
drivers' error and reduce road traffic risks. Due to the nature of heavy
vehicles, whose collisions cause more serious crashes, the weights of vehicles
need to be considered when making driving strategies aimed at reducing the
potential risks and their consequences in the context of autonomous driving.
This study develops an autonomous driving strategy based on risk anticipation,
considering the weights of surrounding vehicles and using hierarchical deep
reinforcement learning. A risk indicator integrating surrounding vehicles'
weights, based on the risk field theory, is proposed and incorporated into
autonomous driving decisions. A hybrid action space is designed to allow for
left lane changes, right lane changes and car-following, which enables AVs to
act more freely and realistically whenever possible. To solve the above hybrid
decision-making problem, a hierarchical proximal policy optimization (HPPO)
algorithm is developed and an attention mechanism is incorporated, providing
great advantages in maintaining stable performance. An indicator, potential
collision energy in conflicts (PCEC), is newly proposed to evaluate the
performance of the developed AV driving strategy from both the perspectives of
the likelihood and the consequences of potential accidents. An application is
carried out and the simulation results demonstrate that our model provides
driving strategies that reduce both the likelihood and consequences of
potential accidents, at the same time maintaining driving efficiency. The
developed method is especially meaningful for AVs driving on highways, where
heavy vehicles make up a high proportion of the traffic.
- Abstract(参考訳): 自動運転車(avs)は、ドライバーのエラーによる事故を防止し、道路交通のリスクを減らす可能性がある。
衝突がより深刻な事故を引き起こす重車両の性質のため、自動運転車の潜在的なリスクと結果の低減を目的とした運転戦略を行う際には、車両の重量を考慮する必要がある。
本研究では,周囲車両の重みを考慮し,階層的深層強化学習を用いて,リスク予測に基づく自律運転戦略を開発する。
リスクフィールド理論に基づき、周囲の車両の重量を統合するリスク指標が提案され、自動運転決定に組み込まれている。
ハイブリッドアクションスペースは、左車線変更、右車線変更、車の追尾を可能にするように設計されている。
上記のハイブリッド意思決定問題を解決するため,階層的近似ポリシ最適化(HPPO)アルゴリズムを開発し,アテンション機構を導入し,安定した性能を維持する上で大きなメリットをもたらす。
コンフリクト(PCEC)における潜在的な衝突エネルギーの指標として,潜在的な事故の可能性を両面から検討する。
シミュレーションにより,本モデルが運転効率の維持と同時に,潜在的な事故の可能性と結果の両方を低減できる運転戦略を提供することを示す。
この手法は、高速道路を走行するavsにとって特に有意義であり、重自動車が交通の比率が高い。
関連論文リスト
- A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [17.434924472015812]
本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。
その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - RACER: Epistemic Risk-Sensitive RL Enables Fast Driving with Fewer Crashes [57.319845580050924]
本稿では,リスク感応制御と適応行動空間のカリキュラムを組み合わせた強化学習フレームワークを提案する。
提案アルゴリズムは,現実世界のオフロード運転タスクに対して,高速なポリシーを学習可能であることを示す。
論文 参考訳(メタデータ) (2024-05-07T23:32:36Z) - Deep Reinforcement Learning for Advanced Longitudinal Control and Collision Avoidance in High-Risk Driving Scenarios [0.0]
本研究では, 縦方向制御と衝突回避のための深部強化学習に基づく新しいアルゴリズムを提案する。
シミュレーションされた高リスクシナリオにおけるその実装は、従来のシステムが通常失敗する密集した交通で緊急ブレーキを伴い、衝突の可能性のある衝突を防ぐアルゴリズム能力を実証している。
論文 参考訳(メタデータ) (2024-04-29T19:58:34Z) - RACER: Rational Artificial Intelligence Car-following-model Enhanced by
Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.27309191283943]
本稿では,異なるAVの行動のリスクを評価するためのデータ駆動型フレームワークを提案する。
本稿では,衝突を引き起こす可能性のある名目行動から最小限の偏差を示す,対実的安全マージンの概念を提案する。
論文 参考訳(メタデータ) (2023-08-02T09:48:08Z) - RCP-RF: A Comprehensive Road-car-pedestrian Risk Management Framework
based on Driving Risk Potential Field [1.625213292350038]
本研究では,コネクテッド・アンド・オートマチック・ビークル(CAV)環境下での電位場理論に基づく総合運転リスク管理フレームワークRCP-RFを提案する。
既存のアルゴリズムと異なり,エゴ車と障害物車と歩行者係数の移動傾向は,提案手法において正当に考慮されている。
実世界のデータセットNGSIMおよび実AVプラットフォーム上での最先端手法に対する提案手法の優位性を検証する実証的研究を行った。
論文 参考訳(メタデータ) (2023-05-04T01:54:37Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Don't Get Yourself into Trouble! Risk-aware Decision-Making for
Autonomous Vehicles [4.94950858749529]
1)望ましくない結果の確率と、2)望ましくない結果がどの程度望ましくないかを見積もる(損失)。
我々は、高レベルリスクベースの経路計画と強化学習に基づく低レベル制御を統合する、自動運転車のリスクベースの意思決定フレームワークを開発した。
この作業は、自動運転車がいつの日か回避し、危険な状況に対処することによって、安全性を向上させることができる。
論文 参考訳(メタデータ) (2021-06-08T18:24:02Z) - Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using
Reinforcement Learning [19.71676985220504]
本稿では,衝突回避戦略とアクティベーション機能を含むDPAS設計を提案する。
運転政策適応型アクティベーション機能は、緊急脅威が検出された場合に、現在の運転方針リスクを動的に評価し、起動する必要がある。
実験の結果は自然発生運転データにより校正され, より多くの介入を伴わずに, 衝突速度を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-02T08:01:53Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。