論文の概要: Reinforcement Learning-Enabled Decision-Making Strategies for a
Vehicle-Cyber-Physical-System in Connected Environment
- arxiv url: http://arxiv.org/abs/2007.09101v1
- Date: Thu, 16 Jul 2020 14:37:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 22:40:30.849602
- Title: Reinforcement Learning-Enabled Decision-Making Strategies for a
Vehicle-Cyber-Physical-System in Connected Environment
- Title(参考訳): 連系環境における車体-車体-物理系の強化学習型意思決定戦略
- Authors: Teng Liu, Xiaolin Tang, Jinwei Zhang, Wenbo Li, Zejian Deng, Yalian
Yang
- Abstract要約: 本稿では,コネクテッド環境における自動運転車の意思決定戦略について論じる。
2つの古典的強化学習(RL)アルゴリズム、Q-learningとDynaを利用して、DM戦略を導出する。
DMポリシーの安全性と効率の制御性能を解析した。
- 参考スコア(独自算出の注目度): 9.61519028373031
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a typical vehicle-cyber-physical-system (V-CPS), connected automated
vehicles attracted more and more attention in recent years. This paper focuses
on discussing the decision-making (DM) strategy for autonomous vehicles in a
connected environment. First, the highway DM problem is formulated, wherein the
vehicles can exchange information via wireless networking. Then, two classical
reinforcement learning (RL) algorithms, Q-learning and Dyna, are leveraged to
derive the DM strategies in a predefined driving scenario. Finally, the control
performance of the derived DM policies in safety and efficiency is analyzed.
Furthermore, the inherent differences of the RL algorithms are embodied and
discussed in DM strategies.
- Abstract(参考訳): 典型的なV-CPS(V-cyber-physical-system)として、コネクテッド・オートマチック・カーは近年ますます注目を集めている。
本稿では,コネクテッド環境における自動運転車の意思決定戦略について議論する。
まずハイウェイDMの問題を定式化し、車両は無線ネットワークを介して情報を交換できる。
次に、古典的強化学習(RL)アルゴリズムであるQ-learningとDynaを利用して、事前に定義された運転シナリオにおけるDM戦略を導出する。
最後に、安全及び効率における派生dmポリシーの制御性能を解析する。
さらに、RLアルゴリズム固有の違いを具現化し、DM戦略で議論する。
関連論文リスト
- SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Integrated Decision and Control for High-Level Automated Vehicles by
Mixed Policy Gradient and Its Experiment Verification [10.393343763237452]
本稿では,IDC(Integrated Decision and Control)に基づく自己進化型意思決定システムを提案する。
制約付き混合ポリシー勾配 (CMPG) と呼ばれるRLアルゴリズムは、IDCの駆動ポリシーを継続的に更新するために提案される。
実験結果から, モデルに基づく手法よりも運転能力の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2022-10-19T14:58:41Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Eco-driving for Electric Connected Vehicles at Signalized Intersections:
A Parameterized Reinforcement Learning approach [6.475252042082737]
本稿では、強化学習(RL)に基づく電気連系車両(CV)のエコ駆動フレームワークを提案する。
我々の戦略は、他の人間駆動車(HDV)を中断することなく適切な行動スキームを学習することで、エネルギー消費を大幅に削減できることを示す。
論文 参考訳(メタデータ) (2022-06-24T04:11:28Z) - Deep Interactive Motion Prediction and Planning: Playing Games with
Motion Prediction Models [162.21629604674388]
本研究は,新しい対話型マルチエージェントニューラルネットワークポリシを予測モデルの一部として使用するゲーム理論モデル予測制御器(MPC)を提案する。
本手法の成功の基礎は,周辺エージェントの状態と地図情報に基づいて車両を操縦できる,新しいマルチエージェントポリシーネットワークの設計である。
論文 参考訳(メタデータ) (2022-04-05T17:58:18Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z) - A Comparative Analysis of Deep Reinforcement Learning-enabled Freeway
Decision-making for Automated Vehicles [2.394554182452767]
人工知能の課題に対処するための強力な方法論として、深層強化学習(DRL)が登場している。
本稿では高速道路における自律走行車による意思決定問題に対するDRLアプローチについて比較する。
これらのDRL対応意思決定戦略の制御性能を評価するために,一連のシミュレーション実験を行った。
論文 参考訳(メタデータ) (2020-08-04T03:21:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。