論文の概要: Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2208.07307v1
- Date: Thu, 21 Jul 2022 16:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-28 22:33:20.974110
- Title: Towards Robust On-Ramp Merging via Augmented Multimodal Reinforcement
Learning
- Title(参考訳): マルチモーダル強化学習によるロバストオンランプマージに向けて
- Authors: Gaurav Bagwe, Jian Li, Xiaoyong Yuan, Lan Zhang
- Abstract要約: 本稿では,CAVのマルチモーダル強化学習によるロバスト・オン・ランプ・マージに対する新しいアプローチを提案する。
具体的には、運転安全性、快適運転行動、交通効率を考慮に入れ、マークフ決定プロセス(MDP)としてオンランプマージ問題を定式化する。
信頼性の高い統合操作を実現するため,BSMと監視画像を同時に活用してマルチモーダル観測を行う。
- 参考スコア(独自算出の注目度): 9.48157144651867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the success of AI-enabled onboard perception, on-ramp merging has
been one of the main challenges for autonomous driving. Due to limited sensing
range of onboard sensors, a merging vehicle can hardly observe main road
conditions and merge properly. By leveraging the wireless communications
between connected and automated vehicles (CAVs), a merging CAV has potential to
proactively obtain the intentions of nearby vehicles. However, CAVs can be
prone to inaccurate observations, such as the noisy basic safety messages (BSM)
and poor quality surveillance images. In this paper, we present a novel
approach for Robust on-ramp merge of CAVs via Augmented and Multi-modal
Reinforcement Learning, named by RAMRL. Specifically, we formulate the on-ramp
merging problem as a Markov decision process (MDP) by taking driving safety,
comfort driving behavior, and traffic efficiency into account. To provide
reliable merging maneuvers, we simultaneously leverage BSM and surveillance
images for multi-modal observation, which is used to learn a policy model
through proximal policy optimization (PPO). Moreover, to improve data
efficiency and provide better generalization performance, we train the policy
model with augmented data (e.g., noisy BSM and noisy surveillance images).
Extensive experiments are conducted with Simulation of Urban MObility (SUMO)
platform under two typical merging scenarios. Experimental results demonstrate
the effectiveness and efficiency of our robust on-ramp merging design.
- Abstract(参考訳): AI対応のオンボード認識の成功にもかかわらず、オンランプ統合は自動運転の主要な課題の1つとなっている。
搭載センサの感知範囲が限られているため、マージ車両は主要道路状況の観察やマージが困難である。
接続された車両と自動走行車(cav)の間の無線通信を活用することで、マージキャビブは近隣の車両の意図を積極的に得ることができる。
しかし、CAVは、ノイズの多い基本安全メッセージ(BSM)や品質の悪い監視画像など、不正確な観察をしがちである。
本稿では,RAMRLによって命名されたAugmentedおよびMulti-modal Reinforcement Learningを介して,CAVのロバストオンランプマージを行う新しい手法を提案する。
具体的には,運転安全,快適運転行動,交通効率を考慮して,オンランプ合併問題をマルコフ決定プロセス(mdp)として定式化する。
信頼性の高いマージ操作を実現するために,bsmと監視画像を同時に活用して,近位政策最適化(ppo)による政策モデル学習を行うマルチモーダル観測を行う。
さらに,データ効率の向上と一般化性能の向上を目的として,拡張データ(ノイズbsmやノイズ監視画像など)を用いてポリシモデルをトレーニングする。
都市モビリティ(sumo)プラットフォームを2つの典型的なマージシナリオでシミュレーションし,広範な実験を行った。
実験結果は,ロバストなオンランプマージ設計の有効性と効率を示す。
関連論文リスト
- Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Shared Information-Based Safe And Efficient Behavior Planning For
Connected Autonomous Vehicles [6.896682830421197]
我々は、連結自動運転車のための統合情報共有と安全なマルチエージェント強化学習フレームワークを設計する。
まず、重畳畳み込み畳み込みニューラルネットワーク(CNN)を用いて、生画像とポイントクラウドのLIDARデータを各自動運転車でローカルに処理する。
次に、車両の局部観測とV2V通信を介して受信した情報の両方を利用する安全なアクター批判アルゴリズムを設計する。
論文 参考訳(メタデータ) (2023-02-08T20:31:41Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - Multi-agent Reinforcement Learning for Cooperative Lane Changing of
Connected and Autonomous Vehicles in Mixed Traffic [16.858651125916133]
レーン変更は、混合および動的交通シナリオにおける自動運転車(AV)にとって大きな課題である。
本稿では,マルチエージェント強化学習(MARL)問題として,混在高速道路環境における複数のAVの車線変更決定を定式化する。
提案するMARLフレームワークは,効率,安全性,ドライバの快適性という点で,最先端のベンチマークを一貫して上回っている。
論文 参考訳(メタデータ) (2021-11-11T17:17:24Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - A Multi-Agent Reinforcement Learning Approach For Safe and Efficient
Behavior Planning Of Connected Autonomous Vehicles [21.132777568170702]
我々は、コネクテッド・自動運転車のための情報共有型強化学習フレームワークを設計する。
提案手法は, 平均速度と快適性の観点から, CAV システムの効率性を向上させることができることを示す。
我々は,共用視覚が早期に障害物を観測し,交通渋滞を避けるために行動を起こすのに役立つことを示すために,障害物回避シナリオを構築した。
論文 参考訳(メタデータ) (2020-03-09T19:15:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。