論文の概要: MIDAS: Multi-agent Interaction-aware Decision-making with Adaptive
Strategies for Urban Autonomous Navigation
- arxiv url: http://arxiv.org/abs/2008.07081v2
- Date: Tue, 23 Mar 2021 05:05:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 03:27:41.893771
- Title: MIDAS: Multi-agent Interaction-aware Decision-making with Adaptive
Strategies for Urban Autonomous Navigation
- Title(参考訳): midas: 都市自律ナビゲーションのための適応戦略を用いたマルチエージェントインタラクションアウェア意思決定
- Authors: Xiaoyi Chen, Pratik Chaudhari
- Abstract要約: そこで本研究では,エゴエージェントが他車の制御動作に影響を与えることを学習する,MIDASと呼ばれる強化学習手法を構築した。
MIDAS は広範にわたる実験により検証され,(i) 異なる道路測地をまたいで動作可能であること,(ii) 外部エージェントの駆動方針の変化に対して堅牢であること,(iv) インタラクション対応意思決定に対する既存のアプローチよりも効率的で安全であること,などが示されている。
- 参考スコア(独自算出の注目度): 22.594295184455
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Autonomous navigation in crowded, complex urban environments requires
interacting with other agents on the road. A common solution to this problem is
to use a prediction model to guess the likely future actions of other agents.
While this is reasonable, it leads to overly conservative plans because it does
not explicitly model the mutual influence of the actions of interacting agents.
This paper builds a reinforcement learning-based method named MIDAS where an
ego-agent learns to affect the control actions of other cars in urban driving
scenarios. MIDAS uses an attention-mechanism to handle an arbitrary number of
other agents and includes a "driver-type" parameter to learn a single policy
that works across different planning objectives. We build a simulation
environment that enables diverse interaction experiments with a large number of
agents and methods for quantitatively studying the safety, efficiency, and
interaction among vehicles. MIDAS is validated using extensive experiments and
we show that it (i) can work across different road geometries, (ii) results in
an adaptive ego policy that can be tuned easily to satisfy performance criteria
such as aggressive or cautious driving, (iii) is robust to changes in the
driving policies of external agents, and (iv) is more efficient and safer than
existing approaches to interaction-aware decision-making.
- Abstract(参考訳): 混雑した複雑な都市環境における自律的なナビゲーションには、道路上の他のエージェントと対話する必要がある。
この問題の一般的な解決策は、他のエージェントの将来の行動を予測するために予測モデルを使用することである。
これは合理的ではあるが、相互作用するエージェントの作用の相互影響を明示的にモデル化しないため、過度に保守的な計画につながる。
本稿では,都市走行シナリオにおいて,エゴエージェントが他の車両の制御行動に影響を与えることを学習するmidaという強化学習ベース手法を構築する。
MIDASは、他のエージェントの任意の数の処理に注意機構を使用し、異なる計画目標にまたがる単一のポリシーを学ぶために"ドライバタイプ"パラメータを含む。
車両の安全性,効率,インタラクションを定量的に研究するための,多数のエージェントや手法との多様なインタラクション実験を可能にするシミュレーション環境を構築した。
MIDASは広範囲な実験により検証され,その有効性を示す。
(i)異なる道路ジオメトリをまたぐことができる。
(ii)アグレッシブ運転や慎重運転などの性能基準を満たすために容易に調整できる適応的自我政策となる。
(iii)外部エージェントの運転方針の変化に頑健であり、
(iv) 対話認識意思決定に対する既存のアプローチよりも効率的かつ安全である。
関連論文リスト
- SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Fact-based Agent modeling for Multi-Agent Reinforcement Learning [6.431977627644292]
Fact-based Agent Modeling (FAM) 法は,Fact-based belief inference (FBI) ネットワークがローカル情報のみに基づいて,部分的に観測可能な環境下で他のエージェントをモデル化する手法である。
種々のマルチエージェント粒子環境(MPE)上でFAMを評価し,その結果を最先端のMARLアルゴリズムと比較した。
論文 参考訳(メタデータ) (2023-10-18T19:43:38Z) - Introducing Risk Shadowing For Decisive and Comfortable Behavior
Planning [0.0]
リスクシャドーイング(リスクシャドーイング)は,単一インタラクションを超越した状況理解手法である。
行動プランナの上流フィルタモジュールとしてリスクシャドーイングを使用することで、より決定的で快適な運転戦略を計画できることを示す。
論文 参考訳(メタデータ) (2023-07-20T09:16:01Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Decision Making for Autonomous Driving in Interactive Merge Scenarios
via Learning-based Prediction [39.48631437946568]
本稿では,他のドライバの動作から不確実性が生ずる移動トラフィックにマージする複雑なタスクに焦点を当てる。
我々はこの問題を部分的に観測可能なマルコフ決定プロセス(POMDP)とみなし、モンテカルロ木探索でオンラインに解決する。
POMDPの解決策は、接近する車に道を譲る、前方の車から安全な距離を維持する、あるいは交通に合流するといった、高いレベルの運転操作を行う政策である。
論文 参考訳(メタデータ) (2023-03-29T16:12:45Z) - Scene Transformer: A unified multi-task model for behavior prediction
and planning [42.758178896204036]
実世界の運転環境における全てのエージェントの行動予測モデルを定式化する。
近年の言語モデリングアプローチにインスパイアされた我々は、マスキング戦略をモデルに対するクエリとして使用しています。
我々は,行動予測のための自律走行データセットに対するアプローチを評価し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-06-15T20:20:44Z) - Diverse Critical Interaction Generation for Planning and Planner
Evaluation [19.08679318138525]
車両を所望のスタイルで個別に制御することで、多様なインタラクションを生み出すスタイルジェネレーティブモデルRouteGANを提案します。
スタイル係数を変更することで、モデルはオンラインプランナーとして異なる安全レベルの軌道を生成することができます。
論文 参考訳(メタデータ) (2021-03-01T10:52:36Z) - Instance-Aware Predictive Navigation in Multi-Agent Environments [93.15055834395304]
エージェント間の相互作用と将来のシーン構造を予測するIPC(Instance-Aware Predictive Control)アプローチを提案する。
我々は,ego中心の視点でエージェント間のインタラクションを推定するために,新しいマルチインスタンスイベント予測モジュールを採用する。
シーンレベルとインスタンスレベルの両方の予測状態をより有効活用するために、一連のアクションサンプリング戦略を設計します。
論文 参考訳(メタデータ) (2021-01-14T22:21:25Z) - SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文 参考訳(メタデータ) (2020-10-19T18:26:10Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。