論文の概要: A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- arxiv url: http://arxiv.org/abs/2411.14593v1
- Date: Thu, 21 Nov 2024 21:23:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:03:24.119022
- Title: A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry
- Title(参考訳): 安全・ロバストな高速道路ランプ導入のためのマルチエージェント深部強化学習の体系的研究
- Authors: Larry Schester, Luis E. Ortiz,
- Abstract要約: 本研究では,車体前方移動動作を制御するハイウェイランプ機能について検討し,車体が進入する高速道路交通の流れとの衝突を最小限に抑える。
我々はこの問題に対してゲーム理論的マルチエージェント(MA)アプローチを採用し、深層強化学習(DRL)に基づくコントローラの利用について検討する。
本稿では,2台以上の車両(エージェント)の相互作用を研究することで既存の作業を拡張し,交通量やエゴカーを付加して道路シーンを体系的に拡張する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Vehicles today can drive themselves on highways and driverless robotaxis operate in major cities, with more sophisticated levels of autonomous driving expected to be available and become more common in the future. Yet, technically speaking, so-called "Level 5" (L5) operation, corresponding to full autonomy, has not been achieved. For that to happen, functions such as fully autonomous highway ramp entry must be available, and provide provably safe, and reliably robust behavior to enable full autonomy. We present a systematic study of a highway ramp function that controls the vehicles forward-moving actions to minimize collisions with the stream of highway traffic into which a merging (ego) vehicle enters. We take a game-theoretic multi-agent (MA) approach to this problem and study the use of controllers based on deep reinforcement learning (DRL). The virtual environment of the MA DRL uses self-play with simulated data where merging vehicles safely learn to control longitudinal position during a taper-type merge. The work presented in this paper extends existing work by studying the interaction of more than two vehicles (agents) and does so by systematically expanding the road scene with additional traffic and ego vehicles. While previous work on the two-vehicle setting established that collision-free controllers are theoretically impossible in fully decentralized, non-coordinated environments, we empirically show that controllers learned using our approach are nearly ideal when measured against idealized optimal controllers.
- Abstract(参考訳): 現在、自動車は高速道路で運転でき、大都市では無人運転が可能で、将来的にはより高度な自動運転が利用できるようになると期待されている。
しかし、技術的には、完全な自律性に対応するいわゆる「レベル5」(L5)操作は達成されていない。
そのためには、完全な自律性を実現するために、完全に自律的なハイウェイランプの入り口のような機能を提供し、確実に安全で確実に堅牢な行動を提供する必要がある。
本研究では,車両の前方移動動作を制御するハイウェイ・ランプ機能について,車両が進入する高速道路交通の流れとの衝突を最小限に抑えるための体系的研究を行う。
本稿では,この問題に対するゲーム理論的マルチエージェント(MA)アプローチと,深層強化学習(DRL)に基づくコントローラの利用について検討する。
MA DRLの仮想環境は、タッカー型マージ中の縦位置を安全に制御する、シミュレーションデータによるセルフプレイを使用する。
本稿では,2台以上の車両(エージェント)の相互作用を研究することで既存の作業を拡張し,交通量やエゴカーを付加して道路シーンを体系的に拡張する。
衝突のない制御系は, 完全分散・非協調環境においては理論的に不可能であることがわかったが, 理想化された最適制御系に対して学習した制御系は, 理想化された最適制御系に対してほぼ理想的であることを示す。
関連論文リスト
- Empowering Autonomous Driving with Large Language Models: A Safety Perspective [82.90376711290808]
本稿では,Large Language Models (LLM) の自律運転システムへの統合について検討する。
LLMは行動計画におけるインテリジェントな意思決定者であり、文脈的安全学習のための安全検証シールドを備えている。
適応型LLM条件モデル予測制御(MPC)と状態機械を用いたLLM対応対話型行動計画スキームという,シミュレーション環境における2つの重要な研究について述べる。
論文 参考訳(メタデータ) (2023-11-28T03:13:09Z) - Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-03-27T02:55:56Z) - Tackling Real-World Autonomous Driving using Deep Reinforcement Learning [63.3756530844707]
本研究では,加速と操舵角度を予測するニューラルネットワークを学習するモデルレスディープ強化学習プランナを提案する。
実際の自動運転車にシステムをデプロイするために、我々は小さなニューラルネットワークで表されるモジュールも開発する。
論文 参考訳(メタデータ) (2022-07-05T16:33:20Z) - COOPERNAUT: End-to-End Driving with Cooperative Perception for Networked
Vehicles [54.61668577827041]
本稿では,車間認識を用いたエンドツーエンド学習モデルであるCOOPERNAUTを紹介する。
われわれのAutoCastSim実験は、我々の協調知覚駆動モデルが平均成功率を40%向上させることを示唆している。
論文 参考訳(メタデータ) (2022-05-04T17:55:12Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Scalable Multiagent Driving Policies For Reducing Traffic Congestion [32.08636346620938]
過去の研究では、AVと人間駆動車両の両方で小規模の混合交通シナリオでは、制御されたマルチエージェント運転ポリシーを実行する少数のAVが混雑を緩和できることを示しています。
本稿では,既存のアプローチをスケールアップし,より複雑なシナリオにおいてavのための新しいマルチエージェント駆動ポリシを開発する。
論文 参考訳(メタデータ) (2021-02-26T21:29:55Z) - Decision-making at Unsignalized Intersection for Autonomous Vehicles:
Left-turn Maneuver with Deep Reinforcement Learning [17.715274169051494]
本研究は、自動運転車の信号なし交差点における深層強化学習に基づく左旋回意思決定フレームワークを提案する。
提案した意思決定戦略は、衝突率を効果的に低減し、輸送効率を向上させることができる。
この研究は、構築された左旋回制御構造がリアルタイムに適用可能な大きな可能性を持っていることも明らかにした。
論文 参考訳(メタデータ) (2020-08-14T22:44:26Z) - Deep Reinforcement Learning for Human-Like Driving Policies in Collision
Avoidance Tasks of Self-Driving Cars [1.160208922584163]
自動運転ポリシーを生成するために,モデルフリーで深層強化学習手法を導入する。
本研究では,2車線道路における静的障害物回避タスクをシミュレーションで検討する。
このアプローチが人間ライクな運転ポリシーにつながることを実証します。
論文 参考訳(メタデータ) (2020-06-07T18:20:33Z) - Cooperative Highway Work Zone Merge Control based on Reinforcement
Learning in A Connected and Automated Environment [6.402634424631123]
本稿では,人工知能が実現した協調運転行動に基づく高速道路の作業ゾーン統合制御戦略を提案し,評価する。
提案手法は、全車両が完全に自動化され、接続され、協調していると仮定する。
その結果, この協調的RL型マージ制御は, 流動性と安全性の両面で, 後期マージや早期マージといった一般的な戦略を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2020-01-21T21:39:44Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。