論文の概要: Encoding Integrated Decision and Control for Autonomous Driving with
Mixed Traffic Flow
- arxiv url: http://arxiv.org/abs/2110.12359v1
- Date: Sun, 24 Oct 2021 06:06:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 18:28:58.822714
- Title: Encoding Integrated Decision and Control for Autonomous Driving with
Mixed Traffic Flow
- Title(参考訳): 混合交通流を用いた自律走行のための統合決定と制御の符号化
- Authors: Yangang Ren, Jianhua Jiang, Jingliang Duan, Shengbo Eben Li, Dongjie
Yu, Guojian Zhan
- Abstract要約: 強化学習(Reinforcement Learning, RL)は、自律運転においてインテリジェントな運転ポリシーを実現するために広く採用されている。
本稿では,複合交通流を伴う複雑な運転タスクを処理するための符号化統合決定制御(E-IDC)を提案する。
- 参考スコア(独自算出の注目度): 5.7440882048331705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning (RL) has been widely adopted to make intelligent
driving policy in autonomous driving due to the self-evolution ability and
humanoid learning paradigm. Despite many elegant demonstrations of RL-enabled
decision-making, current research mainly focuses on the pure vehicle driving
environment while ignoring other traffic participants like bicycles and
pedestrians. For urban roads, the interaction of mixed traffic flows leads to a
quite dynamic and complex relationship, which poses great difficulty to learn a
safe and intelligent policy. This paper proposes the encoding integrated
decision and control (E-IDC) to handle complicated driving tasks with mixed
traffic flows, which composes of an encoding function to construct driving
states, a value function to choose the optimal path as well as a policy
function to output the control command of ego vehicle. Specially, the encoding
function is capable of dealing with different types and variant number of
traffic participants and extracting features from original driving observation.
Next, we design the training principle for the functions of E-IDC with RL
algorithms by adding the gradient-based update rules and refine the safety
constraints concerning the otherness of different participants. The
verification is conducted on the intersection scenario with mixed traffic flows
and result shows that E-IDC can enhance the driving performance, including the
tracking performance and safety constraint requirements with a large margin.
The online application indicates that E-IDC can realize efficient and smooth
driving in the complex intersection, guaranteeing the intelligence and safety
simultaneously.
- Abstract(参考訳): 強化学習(rl)は自己進化能力とヒューマノイド学習パラダイムにより、自律運転におけるインテリジェントな運転方針を実現するために広く採用されている。
RLによる意思決定のエレガントなデモは多数あるが、現在の研究は主に純粋な自動車運転環境に焦点を当て、自転車や歩行者のような他の交通参加者を無視している。
都市道路では、混合交通の流れの相互作用は、非常にダイナミックで複雑な関係につながり、安全でインテリジェントな政策を学ぶのは非常に困難である。
本稿では,運転状態を構成する符号化関数と最適経路を選択する値関数と,エゴ車両の制御コマンドを出力するポリシー関数からなる混合交通流を用いた複雑な運転タスクを処理するための符号化統合決定制御(E-IDC)を提案する。
特に、符号化機能は、異なる種類の交通参加者と異種数に対応でき、元の運転観察から特徴を抽出することができる。
次に、勾配に基づく更新ルールを追加して、RLアルゴリズムによるE-IDC関数のトレーニング原理を設計し、異なる参加者の他性に関する安全性制約を洗練する。
その結果,E-IDCは走行性能を向上し,走行性能と安全制約を高いマージンで達成できることがわかった。
オンラインアプリケーションは、E-IDCが複雑な交差点における効率的かつスムーズな運転を実現し、インテリジェンスと安全性を同時に保証できることを示している。
関連論文リスト
- SPformer: A Transformer Based DRL Decision Making Method for Connected Automated Vehicles [9.840325772591024]
本稿ではトランスフォーマーと強化学習アルゴリズムに基づくCAV意思決定アーキテクチャを提案する。
学習可能なポリシートークンは、多車連携ポリシーの学習媒体として使用される。
我々のモデルは交通シナリオにおける車両の全ての状態情報をうまく活用することができる。
論文 参考訳(メタデータ) (2024-09-23T15:16:35Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [17.434924472015812]
本稿では,ラウンドアバウンドにおける安全かつ効率的な運転行動を促進するための学習アルゴリズムを提案する。
提案アルゴリズムは、複雑なマルチサイクルラウンドアバウトにおける安全かつ効率的な運転戦略を学習するために、深層Q-ラーニングネットワークを用いる。
その結果,本システムは安定したトレーニングプロセスを維持しつつ,安全かつ効率的な運転を実現することができた。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - Decentralized Semantic Traffic Control in AVs Using RL and DQN for Dynamic Roadblocks [9.485363025495225]
車両自体にセマンティックエンコーディングの責務を委譲するセマンティックトラフィック制御システムを提案する。
このシステムは、強化学習(RL)エージェントから得られる意思決定を処理し、意思決定プロセスの合理化を行う。
論文 参考訳(メタデータ) (2024-06-26T20:12:48Z) - DriveCoT: Integrating Chain-of-Thought Reasoning with End-to-End Driving [81.04174379726251]
本稿では,DriveCoTというエンド・ツー・エンドの運転データセットを総合的に収集する。
センサーデータ、制御決定、および推論プロセスを示すチェーン・オブ・シークレット・ラベルが含まれている。
我々は,私たちのデータセットに基づいてトレーニングされたDriveCoT-Agentと呼ばれるベースラインモデルを提案し,連鎖予測と最終決定を生成する。
論文 参考訳(メタデータ) (2024-03-25T17:59:01Z) - Integrated Decision and Control for High-Level Automated Vehicles by
Mixed Policy Gradient and Its Experiment Verification [10.393343763237452]
本稿では,IDC(Integrated Decision and Control)に基づく自己進化型意思決定システムを提案する。
制約付き混合ポリシー勾配 (CMPG) と呼ばれるRLアルゴリズムは、IDCの駆動ポリシーを継続的に更新するために提案される。
実験結果から, モデルに基づく手法よりも運転能力の向上が期待できることがわかった。
論文 参考訳(メタデータ) (2022-10-19T14:58:41Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - Integrated Decision and Control at Multi-Lane Intersections with Mixed
Traffic Flow [6.233422723925688]
本稿では,混在交通流を伴う複雑な交差点を扱うための学習に基づくアルゴリズムを提案する。
まず、学習過程における緑と赤の異なる速度モデルについて検討し、有限状態マシンを用いて異なるモードの光変換を扱う。
次に, 車両, 信号機, 歩行者, 自転車にそれぞれ異なる種類の距離制約を設計し, 制約された最適制御問題をフォーミュレートする。
論文 参考訳(メタデータ) (2021-08-30T07:55:32Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。
近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。
本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文 参考訳(メタデータ) (2021-01-04T03:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。