論文の概要: Research on Autonomous Driving Decision-making Strategies based Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2408.03084v1
- Date: Tue, 6 Aug 2024 10:24:54 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-07 14:27:34.451802
- Title: Research on Autonomous Driving Decision-making Strategies based Deep Reinforcement Learning
- Title(参考訳): 深層強化学習に基づく自律運転意思決定戦略に関する研究
- Authors: Zixiang Wang, Hao Yan, Changsong Wei, Junyu Wang, Shi Bo, Minheng Xiao,
- Abstract要約: 行動決定サブシステムは、自律運転システムの重要な構成要素である。
本研究では、自律的に学習し、運転戦略を最適化する高度な強化学習モデルを採用する。
- 参考スコア(独自算出の注目度): 8.794428617785869
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The behavior decision-making subsystem is a key component of the autonomous driving system, which reflects the decision-making ability of the vehicle and the driver, and is an important symbol of the high-level intelligence of the vehicle. However, the existing rule-based decision-making schemes are limited by the prior knowledge of designers, and it is difficult to cope with complex and changeable traffic scenarios. In this work, an advanced deep reinforcement learning model is adopted, which can autonomously learn and optimize driving strategies in a complex and changeable traffic environment by modeling the driving decision-making process as a reinforcement learning problem. Specifically, we used Deep Q-Network (DQN) and Proximal Policy Optimization (PPO) for comparative experiments. DQN guides the agent to choose the best action by approximating the state-action value function, while PPO improves the decision-making quality by optimizing the policy function. We also introduce improvements in the design of the reward function to promote the robustness and adaptability of the model in real-world driving situations. Experimental results show that the decision-making strategy based on deep reinforcement learning has better performance than the traditional rule-based method in a variety of driving tasks.
- Abstract(参考訳): 行動決定サブシステムは、車両と運転者の意思決定能力を反映した自律運転システムの重要な構成要素であり、車両の高レベルの知性の重要なシンボルである。
しかし,既存のルールベースの意思決定方式は設計者の事前知識によって制限されており,複雑で変更可能な交通シナリオに対処することは困難である。
本研究では,運転決定過程を強化学習問題としてモデル化することにより,複雑な交通環境下での運転戦略を自律的に学習し,最適化する,高度な強化学習モデルを採用する。
具体的には、比較実験にDeep Q-Network (DQN) と Proximal Policy Optimization (PPO) を用いた。
DQNは、政策関数を最適化して意思決定品質を向上する一方、状態-作用値関数を近似することにより、最適な行動を選択するようエージェントに誘導する。
また,実世界の運転状況におけるモデルの堅牢性と適応性を高めるために,報酬関数の設計の改善も導入する。
実験結果から, 深い強化学習に基づく意思決定戦略は, 各種運転課題における従来のルールベース手法よりも優れた性能を示した。
関連論文リスト
- Mix Q-learning for Lane Changing: A Collaborative Decision-Making Method in Multi-Agent Deep Reinforcement Learning [8.455482816036689]
本稿では,Mix Q-learning for Lane Changing(MQLC)を提案する。
集団レベルでは,グローバル情報を利用して個別のQネットワークとグローバルQネットワークを協調する。
個人レベルでは、深層学習に基づく意図認識モジュールを観察に統合し、意思決定ネットワークを強化した。
論文 参考訳(メタデータ) (2024-06-14T06:44:19Z) - Tactical Decision Making for Autonomous Trucks by Deep Reinforcement
Learning with Total Cost of Operation Based Reward [4.404496835736175]
自律トラックにおける戦術的意思決定のための深層強化学習フレームワークを開発した。
以上の結果から,ハイレベル意思決定プロセスと低レベル制御動作の分離が有用であることが示唆された。
論文 参考訳(メタデータ) (2024-03-11T08:58:42Z) - Rethinking Decision Transformer via Hierarchical Reinforcement Learning [54.3596066989024]
決定変換器(Decision Transformer, DT)は、強化学習(RL)における変換器アーキテクチャの最近の進歩を活用する革新的なアルゴリズムである。
本稿では,階層RLのレンズを用いたシーケンシャル意思決定のための汎用シーケンスモデリングフレームワークを提案する。
DTは、高レベルかつ低レベルなポリシーを選択することで、このフレームワークの特別なケースとして現れ、これらの選択の潜在的な失敗について議論する。
論文 参考訳(メタデータ) (2023-11-01T03:32:13Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Safe Decision-making for Lane-change of Autonomous Vehicles via Human
Demonstration-aided Reinforcement Learning [3.8902094267855167]
意思決定は、自動運転における車線変更に不可欠である。
貧弱なランタイム安全性は、実際に複雑な運転タスクからRLベースの意思決定戦略を妨げる。
本稿では,人間による実演をRLに基づく意思決定戦略に組み込む。
論文 参考訳(メタデータ) (2022-07-01T14:16:50Z) - Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement
Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。
本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。
配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文 参考訳(メタデータ) (2021-03-08T05:34:05Z) - Improving Robustness of Learning-based Autonomous Steering Using
Adversarial Images [58.287120077778205]
自動運転用画像入力における学習アルゴリズムw.r.tの堅牢性を解析するためのフレームワークについて紹介する。
感度分析の結果を用いて, 「操縦への学習」 タスクの総合的性能を向上させるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-26T02:08:07Z) - Behavioral decision-making for urban autonomous driving in the presence
of pedestrians using Deep Recurrent Q-Network [0.0]
都市環境における自動運転の意思決定は,道路構造の複雑化と多様な道路利用者の行動の不確実性により困難である。
本研究では,歩行者の存在下での都市環境における高レベル運転行動に対する深層強化学習に基づく意思決定手法を提案する。
提案手法は都市密集シナリオに対して評価し,ルールベース手法と比較し,DRQNに基づく運転行動決定器がルールベース手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-10-26T08:08:06Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。