論文の概要: Learning to Robustly Negotiate Bi-Directional Lane Usage in
High-Conflict Driving Scenarios
- arxiv url: http://arxiv.org/abs/2103.12070v1
- Date: Mon, 22 Mar 2021 14:46:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 14:04:36.081832
- Title: Learning to Robustly Negotiate Bi-Directional Lane Usage in
High-Conflict Driving Scenarios
- Title(参考訳): 高速走行シナリオにおける双方向車線利用のロバストな交渉
- Authors: Christoph Killing, Adam Villaflor, John M. Dolan
- Abstract要約: 我々は、平等な権利と優先順位のエージェント間の交渉を必要とする、以前考慮されていない、しかし日常的で、高紛争の運転シナリオを紹介します。
マルチエージェント強化学習(MARL)を用いて、監視できないほど協力性のある対向車両と強固に交渉する方針を訓練します。
DASACを使用することで、99%以上と想定されるシナリオの交渉とトラバースに成功できることが示されています。
- 参考スコア(独自算出の注目度): 9.528139043328089
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recently, autonomous driving has made substantial progress in addressing the
most common traffic scenarios like intersection navigation and lane changing.
However, most of these successes have been limited to scenarios with
well-defined traffic rules and require minimal negotiation with other vehicles.
In this paper, we introduce a previously unconsidered, yet everyday,
high-conflict driving scenario requiring negotiations between agents of equal
rights and priorities. There exists no centralized control structure and we do
not allow communications. Therefore, it is unknown if other drivers are willing
to cooperate, and if so to what extent. We train policies to robustly negotiate
with opposing vehicles of an unobservable degree of cooperativeness using
multi-agent reinforcement learning (MARL). We propose Discrete Asymmetric Soft
Actor-Critic (DASAC), a maximum-entropy off-policy MARL algorithm allowing for
centralized training with decentralized execution. We show that using DASAC we
are able to successfully negotiate and traverse the scenario considered over
99% of the time. Our agents are robust to an unknown timing of opponent
decisions, an unobservable degree of cooperativeness of the opposing vehicle,
and previously unencountered policies. Furthermore, they learn to exhibit
human-like behaviors such as defensive driving, anticipating solution options
and interpreting the behavior of other agents.
- Abstract(参考訳): 近年、自律運転は交差点ナビゲーションや車線変更など、最も一般的な交通シナリオに対処する上で大きな進歩を遂げている。
しかし、これらの成功の大部分は、明確に定義された交通規則のシナリオに限定されており、他の車両との最小限の交渉を必要とする。
本稿では,同権と優先権を持つエージェントの交渉を必要とする,これまでは思いもよらなかったが日常的な,ハイコンフリクトな運転シナリオを紹介する。
中央集権的な制御構造はなく、通信を許可しません。
そのため、他のドライバーが協力する意思があるのか、どの程度かは不明である。
我々は,マルチエージェント強化学習(marl)を用いて,観測不能な協調性を有する車両とのロバストな交渉を指導する。
我々は,分散実行による集中型トレーニングを可能にする最大エントロピーオフポリシーmarlアルゴリズムである離散的非対称ソフトアクタ-クリティック(dasac)を提案する。
DASACを使用することで、99%以上と想定されるシナリオの交渉とトラバースに成功できることが示されています。
我々のエージェントは、相手の判断の未知のタイミング、相手の車両の協調性の観察不能な程度、および以前には計り知れなかった政策にロバストである。
さらに、防御運転、ソリューションオプションの予測、他のエージェントの振る舞いの解釈などの人間的な行動を示すことを学ぶ。
関連論文リスト
- A Systematic Study of Multi-Agent Deep Reinforcement Learning for Safe and Robust Autonomous Highway Ramp Entry [0.0]
本研究では,車体前方移動動作を制御するハイウェイランプ機能について検討し,車体が進入する高速道路交通の流れとの衝突を最小限に抑える。
我々はこの問題に対してゲーム理論的マルチエージェント(MA)アプローチを採用し、深層強化学習(DRL)に基づくコントローラの利用について検討する。
本稿では,2台以上の車両(エージェント)の相互作用を研究することで既存の作業を拡張し,交通量やエゴカーを付加して道路シーンを体系的に拡張する。
論文 参考訳(メタデータ) (2024-11-21T21:23:46Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - N-Agent Ad Hoc Teamwork [36.10108537776956]
協調的マルチエージェント行動の学習への現在のアプローチは、比較的限定的な設定を前提としている。
本稿では,この問題を定式化し,エージェントモデリングを用いたポリシー最適化(POAM)アルゴリズムを提案する。
POAMは、NAHT問題に対するポリシーグラデーションであり、マルチエージェント強化学習アプローチであり、多様なチームメイト行動への適応を可能にする。
論文 参考訳(メタデータ) (2024-04-16T17:13:08Z) - Fair collaborative vehicle routing: A deep multi-agent reinforcement
learning approach [49.00137468773683]
協力的な車両ルーティングは、キャリアがそれぞれの輸送要求を共有し、互いに代表して輸送要求を実行することで協力するときに発生する。
従来のゲーム理論解の概念は、特性関数がエージェントの数とともに指数関数的にスケールするので、計算に費用がかかる。
我々は,この問題を,深層マルチエージェント強化学習を用いて解決した連立交渉ゲームとしてモデル化することを提案する。
論文 参考訳(メタデータ) (2023-10-26T15:42:29Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - A Reinforcement Learning Benchmark for Autonomous Driving in
Intersection Scenarios [11.365750371241154]
本稿では,RL-CISと呼ばれる複雑な交差点シナリオにおける自律走行エージェントの訓練と試験のためのベンチマークを提案する。
テストベンチマークとベースラインは、交差点シナリオにおける自動運転のためのRLの研究のための公平で包括的なトレーニングおよびテストプラットフォームを提供する。
論文 参考訳(メタデータ) (2021-09-22T07:38:23Z) - Carl-Lead: Lidar-based End-to-End Autonomous Driving with Contrastive
Deep Reinforcement Learning [10.040113551761792]
我々は、ライダーに基づくエンドツーエンドの運転ポリシーのトレーニングに、深層強化学習(DRL)を使用します。
本研究では、DRLを用いて、不完全な部分観察を自然に考慮するライダーベースのエンドツーエンド駆動ポリシーを訓練する。
提案手法は,最新技術(SOTA)によるエンド・ツー・エンド駆動ネットワークよりも高い成功率を達成する。
論文 参考訳(メタデータ) (2021-09-17T11:24:10Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Deep Structured Reactive Planning [94.92994828905984]
自動運転のための新しいデータ駆動型リアクティブ計画目標を提案する。
本モデルは,非常に複雑な操作を成功させる上で,非反応性変種よりも優れることを示す。
論文 参考訳(メタデータ) (2021-01-18T01:43:36Z) - Intelligent Roundabout Insertion using Deep Reinforcement Learning [68.8204255655161]
本稿では,多忙なラウンドアバウンドの入場を交渉できる演習計画モジュールを提案する。
提案されたモジュールは、トレーニングされたニューラルネットワークに基づいて、操作の全期間にわたって、ラウンドアバウンドに入るタイミングと方法を予測する。
論文 参考訳(メタデータ) (2020-01-03T11:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。