論文の概要: Integrated Decision and Control for High-Level Automated Vehicles by
Mixed Policy Gradient and Its Experiment Verification
- arxiv url: http://arxiv.org/abs/2210.10613v1
- Date: Wed, 19 Oct 2022 14:58:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 15:13:56.175502
- Title: Integrated Decision and Control for High-Level Automated Vehicles by
Mixed Policy Gradient and Its Experiment Verification
- Title(参考訳): 混合ポリシー勾配による高レベル自動走行車の総合的意思決定制御とその実験検証
- Authors: Yang Guan, Liye Tang, Chuanxiao Li, Shengbo Eben Li, Yangang Ren,
Junqing Wei, Bo Zhang, Keqiang Li
- Abstract要約: 本稿では,IDC(Integrated Decision and Control)に基づく自己進化型意思決定システムを提案する。
制約付き混合ポリシー勾配 (CMPG) と呼ばれるRLアルゴリズムは、IDCの駆動ポリシーを継続的に更新するために提案される。
実験結果から, モデルに基づく手法よりも運転能力の向上が期待できることがわかった。
- 参考スコア(独自算出の注目度): 10.393343763237452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-evolution is indispensable to realize full autonomous driving. This
paper presents a self-evolving decision-making system based on the Integrated
Decision and Control (IDC), an advanced framework built on reinforcement
learning (RL). First, an RL algorithm called constrained mixed policy gradient
(CMPG) is proposed to consistently upgrade the driving policy of the IDC. It
adapts the MPG under the penalty method so that it can solve constrained
optimization problems using both the data and model. Second, an attention-based
encoding (ABE) method is designed to tackle the state representation issue. It
introduces an embedding network for feature extraction and a weighting network
for feature fusion, fulfilling order-insensitive encoding and importance
distinguishing of road users. Finally, by fusing CMPG and ABE, we develop the
first data-driven decision and control system under the IDC architecture, and
deploy the system on a fully-functional self-driving vehicle running in daily
operation. Experiment results show that boosting by data, the system can
achieve better driving ability over model-based methods. It also demonstrates
safe, efficient and smart driving behavior in various complex scenes at a
signalized intersection with real mixed traffic flow.
- Abstract(参考訳): 完全自動運転を実現するには自己進化が不可欠である。
本稿では、強化学習(RL)に基づく高度なフレームワークであるIDC(Integrated Decision and Control)に基づく自己進化型意思決定システムを提案する。
まず,制約付き混合ポリシー勾配 (CMPG) と呼ばれるRLアルゴリズムを提案し,IDCの駆動ポリシーを継続的に更新する。
ペナルティ法の下でMPGを適用し、データとモデルの両方を用いて制約付き最適化問題を解く。
第二に、状態表現問題に取り組むために注意に基づく符号化(abe)法を考案する。
特徴抽出のための埋め込みネットワークと機能融合のための重み付けネットワークを導入し、注文に敏感なエンコーディングを実現し、道路利用者の識別を重要視する。
最後に, CMPG と ABE を融合させることで,IDC アーキテクチャに基づく最初のデータ駆動型意思決定制御システムを開発し, 日常運転中の完全機能型自動運転車にシステムを展開する。
実験結果から,モデルに基づく手法よりも運転能力の向上が期待できることがわかった。
また、実際の混合交通流との信号化交差点において、様々な複雑なシーンで安全で効率的でスマートな運転行動を示す。
関連論文リスト
- SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - DriveCoT: Integrating Chain-of-Thought Reasoning with End-to-End Driving [81.04174379726251]
本稿では,DriveCoTというエンド・ツー・エンドの運転データセットを総合的に収集する。
センサーデータ、制御決定、および推論プロセスを示すチェーン・オブ・シークレット・ラベルが含まれている。
我々は,私たちのデータセットに基づいてトレーニングされたDriveCoT-Agentと呼ばれるベースラインモデルを提案し,連鎖予測と最終決定を生成する。
論文 参考訳(メタデータ) (2024-03-25T17:59:01Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Parallelized and Randomized Adversarial Imitation Learning for
Safety-Critical Self-Driving Vehicles [11.463476667274051]
運転システムを安全に制御するために、信頼性の高いADAS機能調整を検討することが不可欠である。
本稿では,RAILアルゴリズムを提案する。
提案手法は, LIDARデータを扱う意思決定者を訓練し, 多車線複合高速道路環境における自律走行を制御できる。
論文 参考訳(メタデータ) (2021-12-26T23:42:49Z) - Encoding Integrated Decision and Control for Autonomous Driving with
Mixed Traffic Flow [5.7440882048331705]
強化学習(Reinforcement Learning, RL)は、自律運転においてインテリジェントな運転ポリシーを実現するために広く採用されている。
本稿では,複合交通流を伴う複雑な運転タスクを処理するための符号化統合決定制御(E-IDC)を提案する。
論文 参考訳(メタデータ) (2021-10-24T06:06:27Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。
提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文 参考訳(メタデータ) (2021-03-01T06:47:29Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z) - Decision-making Strategy on Highway for Autonomous Vehicles using Deep
Reinforcement Learning [6.298084785377199]
高速道路のオーバーテイク行動に対処するため、自動車の深層強化学習(DRL)対応意思決定ポリシーを構築した。
これらの車両を制御するために階層的な制御フレームワークが提示され、上層部が運転決定を管理することを示す。
DDQNをベースとしたオーバーテイク政策は、ハイウェイ運転のタスクを効率的かつ安全に達成することができた。
論文 参考訳(メタデータ) (2020-07-16T23:41:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。