論文の概要: Risk-anticipatory autonomous driving strategies considering vehicles'
weights, based on hierarchical deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2401.08661v1
- Date: Wed, 27 Dec 2023 06:03:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 09:38:12.209641
- Title: Risk-anticipatory autonomous driving strategies considering vehicles'
weights, based on hierarchical deep reinforcement learning
- Title(参考訳): 階層的深層強化学習に基づく車両重みを考慮したリスク予測自律運転戦略
- Authors: Di Chen, Hao Li, Zhicheng Jin and Huizhao Tu
- Abstract要約: 本研究では,周囲の車両の重量を考慮し,リスク予測に基づく自律運転戦略を開発する。
リスクフィールド理論に基づいて、周囲の車両の重量を統合するリスクインジケータを提案し、自律運転決定に組み込んだ。
衝突時の潜在的な衝突エネルギーを示す指標を新たに提案し, AV駆動方式の性能評価を行った。
- 参考スコア(独自算出の注目度): 11.465760521923768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles (AVs) have the potential to prevent accidents caused by
drivers' error and reduce road traffic risks. Due to the nature of heavy
vehicles, whose collisions cause more serious crashes, the weights of vehicles
need to be considered when making driving strategies aimed at reducing the
potential risks and their consequences in the context of autonomous driving.
This study develops an autonomous driving strategy based on risk anticipation,
considering the weights of surrounding vehicles and using hierarchical deep
reinforcement learning. A risk indicator integrating surrounding vehicles'
weights, based on the risk field theory, is proposed and incorporated into
autonomous driving decisions. A hybrid action space is designed to allow for
left lane changes, right lane changes and car-following, which enables AVs to
act more freely and realistically whenever possible. To solve the above hybrid
decision-making problem, a hierarchical proximal policy optimization (HPPO)
algorithm is developed and an attention mechanism is incorporated, providing
great advantages in maintaining stable performance. An indicator, potential
collision energy in conflicts (PCEC), is newly proposed to evaluate the
performance of the developed AV driving strategy from both the perspectives of
the likelihood and the consequences of potential accidents. An application is
carried out and the simulation results demonstrate that our model provides
driving strategies that reduce both the likelihood and consequences of
potential accidents, at the same time maintaining driving efficiency. The
developed method is especially meaningful for AVs driving on highways, where
heavy vehicles make up a high proportion of the traffic.
- Abstract(参考訳): 自動運転車(avs)は、ドライバーのエラーによる事故を防止し、道路交通のリスクを減らす可能性がある。
衝突がより深刻な事故を引き起こす重車両の性質のため、自動運転車の潜在的なリスクと結果の低減を目的とした運転戦略を行う際には、車両の重量を考慮する必要がある。
本研究では,周囲車両の重みを考慮し,階層的深層強化学習を用いて,リスク予測に基づく自律運転戦略を開発する。
リスクフィールド理論に基づき、周囲の車両の重量を統合するリスク指標が提案され、自動運転決定に組み込まれている。
ハイブリッドアクションスペースは、左車線変更、右車線変更、車の追尾を可能にするように設計されている。
上記のハイブリッド意思決定問題を解決するため,階層的近似ポリシ最適化(HPPO)アルゴリズムを開発し,アテンション機構を導入し,安定した性能を維持する上で大きなメリットをもたらす。
コンフリクト(PCEC)における潜在的な衝突エネルギーの指標として,潜在的な事故の可能性を両面から検討する。
シミュレーションにより,本モデルが運転効率の維持と同時に,潜在的な事故の可能性と結果の両方を低減できる運転戦略を提供することを示す。
この手法は、高速道路を走行するavsにとって特に有意義であり、重自動車が交通の比率が高い。
関連論文リスト
- RACER: Rational Artificial Intelligence Car-following-model Enhanced by
Reality [51.244807332133696]
本稿では,アダプティブ・クルーズ・コントロール(ACC)運転行動を予測する,最先端の深層学習車追従モデルであるRACERを紹介する。
従来のモデルとは異なり、RACERは実走行の重要な要素であるRDC(Rational Driving Constraints)を効果的に統合している。
RACERはアクセラレーション、ベロシティ、スペーシングといった主要なメトリクスを網羅し、ゼロ違反を登録する。
論文 参考訳(メタデータ) (2023-12-12T06:21:30Z) - ReMAV: Reward Modeling of Autonomous Vehicles for Finding Likely Failure
Events [1.84926694477846]
本稿では、まず、オフライン軌道を用いて、既存の自動運転車の挙動を分析するブラックボックステストフレームワークを提案する。
実験の結果,車両衝突,道路物体衝突,歩行者衝突,オフロードステアリング事故の発生率は35,23,48,50%増加した。
論文 参考訳(メタデータ) (2023-08-28T13:09:00Z) - RCP-RF: A Comprehensive Road-car-pedestrian Risk Management Framework
based on Driving Risk Potential Field [1.625213292350038]
本研究では,コネクテッド・アンド・オートマチック・ビークル(CAV)環境下での電位場理論に基づく総合運転リスク管理フレームワークRCP-RFを提案する。
既存のアルゴリズムと異なり,エゴ車と障害物車と歩行者係数の移動傾向は,提案手法において正当に考慮されている。
実世界のデータセットNGSIMおよび実AVプラットフォーム上での最先端手法に対する提案手法の優位性を検証する実証的研究を行った。
論文 参考訳(メタデータ) (2023-05-04T01:54:37Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Safety-aware Motion Prediction with Unseen Vehicles for Autonomous
Driving [104.32241082170044]
本研究では,無人運転用無人車を用いた新しい作業,安全を意識した動作予測手法について検討する。
既存の車両の軌道予測タスクとは異なり、占有率マップの予測が目的である。
私たちのアプローチは、ほとんどの場合、目に見えない車両の存在を予測できる最初の方法です。
論文 参考訳(メタデータ) (2021-09-03T13:33:33Z) - Don't Get Yourself into Trouble! Risk-aware Decision-Making for
Autonomous Vehicles [4.94950858749529]
1)望ましくない結果の確率と、2)望ましくない結果がどの程度望ましくないかを見積もる(損失)。
我々は、高レベルリスクベースの経路計画と強化学習に基づく低レベル制御を統合する、自動運転車のリスクベースの意思決定フレームワークを開発した。
この作業は、自動運転車がいつの日か回避し、危険な状況に対処することによって、安全性を向上させることができる。
論文 参考訳(メタデータ) (2021-06-08T18:24:02Z) - Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using
Reinforcement Learning [19.71676985220504]
本稿では,衝突回避戦略とアクティベーション機能を含むDPAS設計を提案する。
運転政策適応型アクティベーション機能は、緊急脅威が検出された場合に、現在の運転方針リスクを動的に評価し、起動する必要がある。
実験の結果は自然発生運転データにより校正され, より多くの介入を伴わずに, 衝突速度を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-12-02T08:01:53Z) - Emergent Road Rules In Multi-Agent Driving Environments [84.82583370858391]
運転環境の要素が道路ルールの出現の原因となるかを分析する。
2つの重要な要因が雑音知覚とエージェントの空間密度であることがわかった。
我々の結果は、世界中の国々が安全で効率的な運転で合意した社会道路規則を実証的に支持する。
論文 参考訳(メタデータ) (2020-11-21T09:43:50Z) - Reinforcement Learning based Control of Imitative Policies for
Near-Accident Driving [41.54021613421446]
事故に近いシナリオでは、車両の動作の微妙な変化でさえ、劇的に異なる結果をもたらす可能性がある。
本稿では、ILが個別駆動モードで学んだ低レベルポリシーと、異なる駆動モード間で切り替えるRLで学んだ高レベルポリシーからなる階層的強化と模倣学習(H-ReIL)アプローチを提案する。
論文 参考訳(メタデータ) (2020-07-01T01:41:45Z) - Can Autonomous Vehicles Identify, Recover From, and Adapt to
Distribution Shifts? [104.04999499189402]
トレーニング外の配布(OOD)シナリオは、デプロイ時にエージェントを学ぶ上で一般的な課題である。
インプロバスト模倣計画(RIP)と呼ばれる不確実性を考慮した計画手法を提案する。
提案手法は,OODシーンにおける過信および破滅的な外挿を低減し,分布変化を検知し,回復することができる。
分散シフトを伴うタスク群に対する駆動エージェントのロバスト性を評価するために,自動走行車ノベルシーンベンチマークであるtexttCARNOVEL を導入する。
論文 参考訳(メタデータ) (2020-06-26T11:07:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。