論文の概要: SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving
- arxiv url: http://arxiv.org/abs/2010.09776v2
- Date: Sun, 1 Nov 2020 01:32:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 21:40:36.483569
- Title: SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving
- Title(参考訳): SMARTS: 自律運転のためのスケーラブルなマルチエージェント強化学習学校
- Authors: Ming Zhou, Jun Luo, Julian Villella, Yaodong Yang, David Rusu, Jiayu
Miao, Weinan Zhang, Montgomery Alban, Iman Fadakar, Zheng Chen, Aurora
Chongxi Huang, Ying Wen, Kimia Hassanzadeh, Daniel Graves, Dong Chen,
Zhengbang Zhu, Nhat Nguyen, Mohamed Elsayed, Kun Shao, Sanjeevan Ahilan,
Baokuan Zhang, Jiannan Wu, Zhengang Fu, Kasra Rezaee, Peyman Yadmellat,
Mohsen Rohani, Nicolas Perez Nieves, Yihan Ni, Seyedershad Banijamali,
Alexander Cowen Rivers, Zheng Tian, Daniel Palenicek, Haitham bou Ammar,
Hongbo Zhang, Wulong Liu, Jianye Hao, Jun Wang
- Abstract要約: マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
- 参考スコア(独自算出の注目度): 96.50297622371457
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent interaction is a fundamental aspect of autonomous driving in the
real world. Despite more than a decade of research and development, the problem
of how to competently interact with diverse road users in diverse scenarios
remains largely unsolved. Learning methods have much to offer towards solving
this problem. But they require a realistic multi-agent simulator that generates
diverse and competent driving interactions. To meet this need, we develop a
dedicated simulation platform called SMARTS (Scalable Multi-Agent RL Training
School). SMARTS supports the training, accumulation, and use of diverse
behavior models of road users. These are in turn used to create increasingly
more realistic and diverse interactions that enable deeper and broader research
on multi-agent interaction. In this paper, we describe the design goals of
SMARTS, explain its basic architecture and its key features, and illustrate its
use through concrete multi-agent experiments on interactive scenarios. We
open-source the SMARTS platform and the associated benchmark tasks and
evaluation metrics to encourage and empower research on multi-agent learning
for autonomous driving. Our code is available at
https://github.com/huawei-noah/SMARTS.
- Abstract(参考訳): マルチエージェントインタラクションは、現実世界における自動運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、多様なシナリオにおいて、多様な道路ユーザーと能力的に対話する方法の問題はほとんど解決されていない。
この問題を解決するには学習方法が大いに役立ちます。
しかしそれらは、多様な有能な運転インタラクションを生成する現実的なマルチエージェントシミュレータを必要とする。
そこで我々はSMARTS(Scalable Multi-Agent RL Training School)と呼ばれる専用シミュレーションプラットフォームを開発した。
SMARTSは、道路利用者の多様な行動モデルのトレーニング、蓄積、使用をサポートする。
これらは、より現実的で多様な相互作用を生み出すために使用され、マルチエージェントインタラクションのより深い研究を可能にする。
本稿では,スマートシステムの設計目標を説明し,その基本アーキテクチャとその重要な特徴を説明し,インタラクティブシナリオにおける具体的マルチエージェント実験を通じてその利用について述べる。
我々はSMARTSプラットフォームと関連するベンチマークタスクと評価指標をオープンソース化し、自動運転のためのマルチエージェント学習の研究を奨励し、強化する。
私たちのコードはhttps://github.com/huawei-noah/smartsで利用可能です。
関連論文リスト
- OpenWebVoyager: Building Multimodal Web Agents via Iterative Real-World Exploration, Feedback and Optimization [66.22117723598872]
マルチモーダルWebエージェントの開発を容易にするために設計されたオープンソースフレームワークを紹介する。
まず、基本モデルを模倣学習で訓練し、基礎能力を得る。
次に、エージェントにオープンウェブを探索させ、その軌道に関するフィードバックを収集する。
論文 参考訳(メタデータ) (2024-10-25T15:01:27Z) - Multi-Agent Reinforcement Learning for Autonomous Driving: A Survey [14.73689900685646]
強化学習(Reinforcement Learning, RL)は、シーケンシャルな意思決定のための強力なツールであり、人間の能力を超えるパフォーマンスを達成した。
マルチエージェントシステム領域におけるRLの拡張として、マルチエージェントRL(MARL)は制御ポリシーを学ぶだけでなく、環境内の他のすべてのエージェントとの相互作用についても考慮する必要がある。
シミュレーターは、RLの基本である現実的なデータを得るのに不可欠である。
論文 参考訳(メタデータ) (2024-08-19T03:31:20Z) - An Interactive Agent Foundation Model [49.77861810045509]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - From Multi-agent to Multi-robot: A Scalable Training and Evaluation
Platform for Multi-robot Reinforcement Learning [12.74238738538799]
マルチエージェント強化学習(MARL)は、過去数十年間、学術や産業から広く注目を集めてきた。
これらの手法が実際のシナリオ、特にマルチロボットシステムでどのように機能するかは未だ分かっていない。
本稿では,マルチロボット強化学習(MRRL)のためのスケーラブルなエミュレーションプラットフォームSMARTを提案する。
論文 参考訳(メタデータ) (2022-06-20T06:36:45Z) - An Introduction to Multi-Agent Reinforcement Learning and Review of its
Application to Autonomous Mobility [1.496194593196997]
マルチエージェント強化学習(MARL、Multi-Agent Reinforcement Learning)は、複数のエージェントが相互に相互作用する最適な解を見つけることを目的とした研究分野である。
この研究は、自律移動の研究者にこの分野の概要を提供することを目的としている。
論文 参考訳(メタデータ) (2022-03-15T06:40:28Z) - Evaluating the Robustness of Deep Reinforcement Learning for Autonomous
Policies in a Multi-agent Urban Driving Environment [3.8073142980733]
視覚に基づく自律運転における深層強化学習の比較のためのベンチマークフレームワークを提案する。
この実験は、視覚のみの高忠実度都市運転模擬環境で実施する。
その結果, 深層強化学習アルゴリズムのいくつかは, シングルエージェントとマルチエージェントのシナリオで一貫した性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2021-12-22T15:14:50Z) - MetaDrive: Composing Diverse Driving Scenarios for Generalizable
Reinforcement Learning [25.191567110519866]
我々は,強化学習アルゴリズムの研究のために,MetaDriveと呼ばれる新しい運転シミュレーションプラットフォームを開発した。
MetaDriveをベースとして、シングルエージェントとマルチエージェントの両方の設定でさまざまなRLタスクとベースラインを構築します。
論文 参考訳(メタデータ) (2021-09-26T18:34:55Z) - PsiPhi-Learning: Reinforcement Learning with Demonstrations using
Successor Features and Inverse Temporal Difference Learning [102.36450942613091]
時間差学習(ITD)と呼ばれる逆強化学習アルゴリズムを提案する。
Psi Phi$-learningと呼ばれるデモで強化学習のための新しいアルゴリズムに到達し、オンライン環境の相互作用から学習とITDをシームレスに統合する方法を示します。
論文 参考訳(メタデータ) (2021-02-24T21:12:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。