論文の概要: iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2306.06236v1
- Date: Fri, 9 Jun 2023 20:12:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 20:22:20.866019
- Title: iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning
- Title(参考訳): iplan:分散マルチエージェント強化学習による異種交通のインテントアウェア計画
- Authors: Xiyang Wu, Rohan Chandra, Tianrui Guan, Amrit Singh Bedi, Dinesh
Manocha
- Abstract要約: トラジェクトリと意図予測を用いた分散マルチエージェント強化学習アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
- 参考スコア(独自算出の注目度): 52.05097882874643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Navigating safely and efficiently in dense and heterogeneous traffic
scenarios is challenging for autonomous vehicles (AVs) due to their inability
to infer the behaviors or intentions of nearby drivers. In this work, we
propose a distributed multi-agent reinforcement learning (MARL) algorithm with
trajectory and intent prediction in dense and heterogeneous traffic scenarios.
Our approach for intent-aware planning, iPLAN, allows agents to infer nearby
drivers' intents solely from their local observations. We model two distinct
incentives for agents' strategies: Behavioral incentives for agents' long-term
planning based on their driving behavior or personality; Instant incentives for
agents' short-term planning for collision avoidance based on the current
traffic state. We design a two-stream inference module that allows agents to
infer their opponents' incentives and incorporate their inferred information
into decision-making. We perform experiments on two simulation environments,
Non-Cooperative Navigation and Heterogeneous Highway. In Heterogeneous Highway,
results show that, compared with centralized MARL baselines such as QMIX and
MAPPO, our method yields a 4.0% and 35.7% higher episodic reward in mild and
chaotic traffic, with 48.1% higher success rate and 80.6% longer survival time
in chaotic traffic. We also compare with a decentralized baseline IPPO and
demonstrate a higher episodic reward of 9.2% and 10.3% in mild traffic and
chaotic traffic, 25.3% higher success rate, and 13.7% longer survival time.
- Abstract(参考訳): 密集した均一な交通シナリオで安全かつ効率的に航行することは、近くのドライバーの行動や意図を推測できないため、自動運転車(AV)にとって困難である。
本研究では,高密度および不均一な交通シナリオにおける軌跡と意図予測を備えた分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
エージェントの戦略に対する2つの異なるインセンティブをモデル化する:エージェントの運転行動や性格に基づく長期計画に対する行動インセンティブ;エージェントの現在の交通状況に基づく衝突回避のための短期計画に対する即時インセンティブ。
エージェントが相手のインセンティブを推論し、推論した情報を意思決定に組み込む2つのストリーム推論モジュールを設計した。
非協力型ナビゲーションと不均一道路という2つのシミュレーション環境で実験を行う。
ヘテロジニアスハイウェイでは,QMIXやMAPPOなどの集中型MARLベースラインと比較して,本手法は軽度・カオス性交通において4.0%,35.7%,成功率48.1%,カオス性交通において生存時間を80.6%と高い。
また,分散ベースラインippoと比較し,マイルドトラフィックとカオストラフィックでは9.2%,10.3%,成功率25.3%,生存時間13.7%のエピソディック報酬を示した。
関連論文リスト
- Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0111084468944]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。
L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。
本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文 参考訳(メタデータ) (2024-03-18T15:02:46Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Deep Reinforcement Learning for Autonomous Vehicle Intersection
Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。
そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。
提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2023-09-30T10:54:02Z) - Studying the Impact of Semi-Cooperative Drivers on Overall Highway Flow [76.38515853201116]
半協調行動は、人間ドライバーの本質的な性質であり、自律運転には考慮すべきである。
新たな自律型プランナーは、社会的に準拠した軌道を生成するために、人間のドライバーの社会的価値指向(SVO)を考慮することができる。
エージェントが反復的最適応答のゲーム理論バージョンをデプロイする暗黙的な半協調運転について検討する。
論文 参考訳(メタデータ) (2023-04-23T16:01:36Z) - Communication-Critical Planning via Multi-Agent Trajectory Exchange [21.923724399511798]
本稿では,統合マルチエージェント認識と計画の課題に対処する。
これは、コネクテッド・自動運転車の衝突のないナビゲーションという現実の課題に関連している。
論文 参考訳(メタデータ) (2023-03-10T16:59:24Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Learning Interaction-aware Guidance Policies for Motion Planning in
Dense Traffic Scenarios [8.484564880157148]
本稿では,高密度交通シナリオにおける対話型モーションプランニングのための新しい枠組みを提案する。
我々は,他車両の協調性に関する国際的ガイダンスを提供するインタラクション対応政策であるDeep Reinforcement Learning (RL) を通じて学習することを提案する。
学習されたポリシーは、ローカル最適化ベースのプランナーを推論し、対話的な振る舞いで誘導し、他の車両が収まらない場合に安全を維持しながら、密集したトラフィックに積極的にマージする。
論文 参考訳(メタデータ) (2021-07-09T16:43:12Z) - Courteous Behavior of Automated Vehicles at Unsignalized Intersections
via Reinforcement Learning [30.00761722505295]
深層強化学習を用いた混在交通状況における交差点における交通流の最適化手法を提案する。
我々の強化学習エージェントは、信号のない交差点で接続された自動運転車が道路の権利を放棄し、交通の流れを最適化するために他の車両に利する、集中型制御器のポリシーを学習する。
論文 参考訳(メタデータ) (2021-06-11T13:16:48Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。