論文の概要: A Multi-Agent Reinforcement Learning Approach For Safe and Efficient
Behavior Planning Of Connected Autonomous Vehicles
- arxiv url: http://arxiv.org/abs/2003.04371v3
- Date: Sun, 4 Sep 2022 00:11:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-25 08:25:15.519528
- Title: A Multi-Agent Reinforcement Learning Approach For Safe and Efficient
Behavior Planning Of Connected Autonomous Vehicles
- Title(参考訳): 自律走行車の安全かつ効率的な行動計画のためのマルチエージェント強化学習手法
- Authors: Songyang Han, Shanglin Zhou, Jiangwei Wang, Lynn Pepin, Caiwen Ding,
Jie Fu, Fei Miao
- Abstract要約: 我々は、コネクテッド・自動運転車のための情報共有型強化学習フレームワークを設計する。
提案手法は, 平均速度と快適性の観点から, CAV システムの効率性を向上させることができることを示す。
我々は,共用視覚が早期に障害物を観測し,交通渋滞を避けるために行動を起こすのに役立つことを示すために,障害物回避シナリオを構築した。
- 参考スコア(独自算出の注目度): 21.132777568170702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent advancements in wireless technology enable connected autonomous
vehicles (CAVs) to gather information about their environment by
vehicle-to-vehicle (V2V) communication. In this work, we design an
information-sharing-based multi-agent reinforcement learning (MARL) framework
for CAVs, to take advantage of the extra information when making decisions to
improve traffic efficiency and safety. The safe actor-critic algorithm we
propose has two new techniques: the truncated Q-function and safe action
mapping. The truncated Q-function utilizes the shared information from
neighboring CAVs such that the joint state and action spaces of the Q-function
do not grow in our algorithm for a large-scale CAV system. We prove the bound
of the approximation error between the truncated-Q and global Q-functions. The
safe action mapping provides a provable safety guarantee for both the training
and execution based on control barrier functions. Using the CARLA simulator for
experiments, we show that our approach can improve the CAV system's efficiency
in terms of average velocity and comfort under different CAV ratios and
different traffic densities. We also show that our approach avoids the
execution of unsafe actions and always maintains a safe distance from other
vehicles. We construct an obstacle-at-corner scenario to show that the shared
vision can help CAVs to observe obstacles earlier and take action to avoid
traffic jams.
- Abstract(参考訳): 近年の無線技術の発展により、コネクテッド・自動運転車(CAV)はV2V通信によって環境に関する情報を収集できるようになっている。
本研究では,CAVのための情報共有型マルチエージェント強化学習(MARL)フレームワークを設計し,交通効率と安全性を向上させるための意思決定を行う際の余分な情報を活用する。
私たちが提案するsafe actor-criticアルゴリズムには,停止q関数とsafeアクションマッピングという2つの新しい手法がある。
停止したQ関数は隣接するCAVの共有情報を利用して,大規模CAVシステムにおいて,Q関数の結合状態と動作空間が我々のアルゴリズムでは成長しない。
truncated-Q と大域 Q-関数の近似誤差の有界性を証明する。
安全なアクションマッピングは、制御バリア機能に基づいたトレーニングと実行の両方の安全保証を提供する。
CARLAシミュレータを用いて,CAVの速度と快適さを異なるCAV比と異なる交通密度で比較することにより,CAVシステムの効率を向上できることを示す。
また,我々のアプローチは安全でないアクションの実行を回避し,常に他の車両から安全な距離を保っていることを示す。
我々は,共用視覚が早期に障害物を観測し,交通渋滞を避けるために行動を起こすのに役立つことを示すために,障害物回避シナリオを構築した。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - CAT: Closed-loop Adversarial Training for Safe End-to-End Driving [54.60865656161679]
Adversarial Training (CAT) は、自動運転車における安全なエンドツーエンド運転のためのフレームワークである。
Catは、安全クリティカルなシナリオでエージェントを訓練することで、運転エージェントの安全性を継続的に改善することを目的としている。
猫は、訓練中のエージェントに対抗する敵シナリオを効果的に生成できる。
論文 参考訳(メタデータ) (2023-10-19T02:49:31Z) - Convergence of Communications, Control, and Machine Learning for Secure
and Autonomous Vehicle Navigation [78.60496411542549]
接続された自動運転車(CAV)は、交通事故におけるヒューマンエラーを低減し、道路効率を向上し、様々なタスクを実行する。これらのメリットを享受するためには、CAVが目標とする目的地へ自律的にナビゲートする必要がある。
本稿では,通信理論,制御理論,機械学習の収束を利用して,効果的なCAVナビゲーションを実現する手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T21:38:36Z) - A Survey of Federated Learning for Connected and Automated Vehicles [2.348805691644086]
コネクテッド・アンド・オートマチック・ビークルズ(CAV)は、自動車分野における新興技術の1つである。
フェデレートラーニング(FL)は、複数の車両との協調モデル開発を可能にするCAVの効果的なソリューションである。
論文 参考訳(メタデータ) (2023-03-19T14:44:37Z) - Shared Information-Based Safe And Efficient Behavior Planning For
Connected Autonomous Vehicles [6.896682830421197]
我々は、連結自動運転車のための統合情報共有と安全なマルチエージェント強化学習フレームワークを設計する。
まず、重畳畳み込み畳み込みニューラルネットワーク(CNN)を用いて、生画像とポイントクラウドのLIDARデータを各自動運転車でローカルに処理する。
次に、車両の局部観測とV2V通信を介して受信した情報の両方を利用する安全なアクター批判アルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-02-08T20:31:41Z) - Spatial-Temporal-Aware Safe Multi-Agent Reinforcement Learning of
Connected Autonomous Vehicles in Challenging Scenarios [10.37986799561165]
通信技術はコネクテッド・自動運転車(CAV)間の協調を可能にする
CAVのための並列安全シールドを備えた制約付きマルチエージェント強化学習(MARL)フレームワークを提案する。
その結果,提案手法は難易度の高いシナリオにおいて,システムの安全性と効率を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2022-10-05T14:39:07Z) - Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement
Learning [9.48157144651867]
本稿では,CAVのマルチモーダル強化学習によるロバスト・オン・ランプ・マージに対する新しいアプローチを提案する。
具体的には、運転安全性、快適運転行動、交通効率を考慮に入れ、マークフ決定プロセス(MDP)としてオンランプマージ問題を定式化する。
信頼性の高い統合操作を実現するため,BSMと監視画像を同時に活用してマルチモーダル観測を行う。
論文 参考訳(メタデータ) (2022-07-21T16:34:57Z) - Differentiable Control Barrier Functions for Vision-based End-to-End
Autonomous Driving [100.57791628642624]
本稿では,視覚に基づくエンドツーエンド自動運転のための安全保証学習フレームワークを提案する。
我々は、勾配降下によりエンドツーエンドに訓練された微分制御バリア関数(dCBF)を備えた学習システムを設計する。
論文 参考訳(メタデータ) (2022-03-04T16:14:33Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Facilitating Connected Autonomous Vehicle Operations Using
Space-weighted Information Fusion and Deep Reinforcement Learning Based
Control [6.463332275753283]
本稿では、他の車両からのセンシングと接続機能を通じて収集されたデータを統合するディープ強化学習に基づくアプローチについて述べる。
CAVにおけるアルゴリズムの実装は、CAV運転操作に関連する安全性とモビリティを高めることが期待されている。
論文 参考訳(メタデータ) (2020-09-30T13:38:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。