Fugu-MT 論文翻訳(概要): VMAS: A Vectorized Multi-Agent Simulator for Collective Robot Learning

論文の概要: VMAS: A Vectorized Multi-Agent Simulator for Collective Robot Learning

arxiv url: http://arxiv.org/abs/2207.03530v1
Date: Thu, 7 Jul 2022 18:48:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-11 14:54:17.306368
Title: VMAS: A Vectorized Multi-Agent Simulator for Collective Robot Learning
Title（参考訳）: VMAS: 集合ロボット学習のためのベクトル型マルチエージェントシミュレータ
Authors: Matteo Bettini, Ryan Kortvelesy, Jan Blumenkamp, Amanda Prorok
Abstract要約: ロボットコミュニティでは,MARL(Multi-Agent Reinforcement Learning)が注目されている。ベクトル化マルチエージェントシミュレータ(VMAS)を紹介する。 VMASは、効率的なMARLベンチマークのために設計されたオープンソースのフレームワークである。
参考スコア（独自算出の注目度）: 6.614755043607777
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While many multi-robot coordination problems can be solved optimally by exact algorithms, solutions are often not scalable in the number of robots. Multi-Agent Reinforcement Learning (MARL) is gaining increasing attention in the robotics community as a promising solution to tackle such problems. Nevertheless, we still lack the tools that allow us to quickly and efficiently find solutions to large-scale collective learning tasks. In this work, we introduce the Vectorized Multi-Agent Simulator (VMAS). VMAS is an open-source framework designed for efficient MARL benchmarking. It is comprised of a vectorized 2D physics engine written in PyTorch and a set of twelve challenging multi-robot scenarios. Additional scenarios can be implemented through a simple and modular interface. We demonstrate how vectorization enables parallel simulation on accelerated hardware without added complexity. When comparing VMAS to OpenAI MPE, we show how MPE's execution time increases linearly in the number of simulations while VMAS is able to execute 30,000 parallel simulations in under 10s, proving more than 100x faster. Using VMAS's RLlib interface, we benchmark our multi-robot scenarios using various Proximal Policy Optimization (PPO)-based MARL algorithms. VMAS's scenarios prove challenging in orthogonal ways for state-of-the-art MARL algorithms. The VMAS framework is available at https://github.com/proroklab/VectorizedMultiAgentSimulator. A video of VMAS scenarios and experiments is available at https://youtu.be/aaDRYfiesAY}{here}\footnote{\url{https://youtu.be/aaDRYfiesAY.
Abstract（参考訳）: 多くのマルチロボット調整問題は正確なアルゴリズムで最適に解けるが、解はしばしばロボットの数でスケーラブルではない。マルチエージェント強化学習(marl)は,このような課題に取り組むための有望なソリューションとして,ロボティクスコミュニティの注目を集めている。それでもなお,大規模な集団学習タスクのソリューションを迅速かつ効率的に見つけるためのツールが不足しています。本稿では,VMAS(Vectorized Multi-Agent Simulator)を紹介する。 VMASは、効率的なMARLベンチマークのために設計されたオープンソースのフレームワークである。 PyTorchで書かれたベクトル化された2D物理エンジンと、12の挑戦的なマルチロボットシナリオからなる。追加のシナリオは、シンプルでモジュール化されたインターフェイスで実装できる。我々は,ベクトル化が複雑化することなく,高速化ハードウェア上で並列シミュレーションを実現する方法を示した。 VMASとOpenAI MPEを比較すると、VMASは10秒未満で3万の並列シミュレーションを実行でき、100倍以上高速であるのに対して、MPEの実行時間がシミュレーション数で線形に増加することを示す。 VMASのRLlibインタフェースを用いて、PPO(Proximal Policy Optimization)ベースのMARLアルゴリズムを用いて、マルチロボットシナリオをベンチマークする。 VMASのシナリオは、最先端のMARLアルゴリズムの直交的な方法では困難である。 vmasフレームワークはhttps://github.com/proroklab/vectorized multiagentsimulatorで利用可能である。 VMASのシナリオと実験のビデオはhttps://youtu.be/aaDRYfiesAY}{here}\footnote{\url{https://youtu.be/aaDRYfiesAYで公開されている。

関連論文リスト

Assistax: A Hardware-Accelerated Reinforcement Learning Benchmark for Assistive Robotics [18.70896736010314]
ゲームは、関連する課題を提示し、実行しやすく、理解しやすいため、強化学習ベンチマークを支配しています。 Assistaxは、支援ロボットタスクに起因する課題に対処するために設計されたオープンソースのベンチマークである。オープンループのウォールタイムに関しては、AsistaxはCPUベースの代替よりもベクタライジングトレーニングの実行が速い場合、最大370タイムで動作します。
論文参考訳（メタデータ） (2025-07-29T09:49:11Z)
Advancing MAPF towards the Real World: A Scalable Multi-Agent Realistic Testbed (SMART) [37.17845947950689]
Scalable Multi-Agent Realistic Testbed (smart)は、マルチエージェントパス探索(MAPF)アルゴリズムを評価するための、現実的で効率的なソフトウェアツールである。我々は,実世界のシナリオにおけるMAPFアルゴリズムの実行に関する研究質問をSMARTを用いて探索し,実証する。
論文参考訳（メタデータ） (2025-03-03T05:26:59Z)
Parallelizing the stabilizer formalism for quantum machine learning applications [0.4749824105387292]
提案されたPythonの実装は、現在のシミュレータであるQiskitよりも高速で、4ビット60,2Kゲートの場合には4.23倍である。その結果,現在のシミュレータであるQiskitよりも高速で,4量子ビット,60,2Kゲートの4.23倍の高速化を実現している。
論文参考訳（メタデータ） (2025-02-15T06:10:07Z)
Synthesizing Post-Training Data for LLMs through Multi-Agent Simulation [48.17611255751571]
ポストトレーニングは、大きな言語モデルが人間の指示に従うことを可能にするために不可欠である。マルチエージェントシミュレーションを利用して、さまざまなテキストベースのシナリオを自動的に生成する。本稿では,シナリオ駆動型命令生成器MATRIX-Genを提案する。
論文参考訳（メタデータ） (2024-10-18T08:01:39Z)
GPUDrive: Data-driven, multi-agent driving simulation at 1 million FPS [4.172988187048097]
GPUDriveはMadrona Engine Game上に構築されたGPUアクセラレーションされたマルチエージェントシミュレータである。我々はGPUDriveを使うことで、Open Motionデータセットの多くのシーンで強化学習エージェントを効果的に訓練できることを示した。
論文参考訳（メタデータ） (2024-08-02T21:37:46Z)
Distributed Inference and Fine-tuning of Large Language Models Over The Internet [91.00270820533272]
大規模言語モデル(LLM)は、多くのNLPタスクで有用であり、サイズが向上する。これらのモデルはハイエンドのハードウェアを必要とするため、ほとんどの研究者にはアクセスできない。本研究では,システムスループットの最大化のためにデバイスを自動的に割り当てるフォールトトレラント推論アルゴリズムとロードバランシングプロトコルを開発する。
論文参考訳（メタデータ） (2023-12-13T18:52:49Z)
JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.343918678781]
我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文参考訳（メタデータ） (2023-11-16T18:58:43Z)
Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。 TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文参考訳（メタデータ） (2023-10-12T20:49:15Z)
VIMA: General Robot Manipulation with Multimodal Prompts [82.01214865117637]
ロボット操作タスクの幅広い範囲をマルチモーダルプロンプトで表現できることを示す。我々は,数千の手続き的に生成されたテーブルトップタスクからなる新しいシミュレーションベンチマークを開発した。我々は、これらのプロンプトを処理し、自動回帰的に運動動作を出力するトランスフォーマーベースのロボットエージェントVIMAを設計する。
論文参考訳（メタデータ） (2022-10-06T17:50:11Z)
Batch-efficient EigenDecomposition for Small and Medium Matrices [65.67315418971688]
EigenDecomposition (ED)は多くのコンピュータビジョンアルゴリズムとアプリケーションの中心にある。本稿では,コンピュータビジョンの応用シナリオに特化したQRベースのED手法を提案する。
論文参考訳（メタデータ） (2022-07-09T09:14:12Z)
From Multi-agent to Multi-robot: A Scalable Training and Evaluation Platform for Multi-robot Reinforcement Learning [12.74238738538799]
マルチエージェント強化学習(MARL)は、過去数十年間、学術や産業から広く注目を集めてきた。これらの手法が実際のシナリオ、特にマルチロボットシステムでどのように機能するかは未だ分かっていない。本稿では,マルチロボット強化学習(MRRL)のためのスケーラブルなエミュレーションプラットフォームSMARTを提案する。
論文参考訳（メタデータ） (2022-06-20T06:36:45Z)
WarpDrive: Extremely Fast End-to-End Deep Multi-Agent Reinforcement Learning on a GPU [15.337470862838794]
我々は、単一のGPU上でエンドツーエンドのマルチエージェントRLを実装する、柔軟で軽量で使いやすいオープンソースのRLフレームワークであるWarpDriveを紹介します。我々の設計ではシミュレーションとエージェントを並列に実行し、GPU上に1つのシミュレーションデータストアを配置して安全に更新する。 WarpDriveは、ベンチマークTagシミュレーションにおいて、2000の環境と1000のエージェント(CPU実装と比べて少なくとも100倍高いスループット)で290万の環境ステップ/秒を生成する。
論文参考訳（メタデータ） (2021-08-31T16:59:27Z)
Accelerating SLIDE Deep Learning on Modern CPUs: Vectorization, Quantizations, Memory Optimizations, and More [26.748770505062378]
SLIDEはスパースハッシュテーブルベースのバックプロパゲーションのC++実装である。 SLIDE の計算によって AVX (Advanced Vector Extensions-512) によるベクトル化が可能となることを示す。我々の実験は、大規模(数百万のパラメータ)のレコメンデーションとNLPモデルに焦点を当てている。
論文参考訳（メタデータ） (2021-03-06T02:13:43Z)
MPLP++: Fast, Parallel Dual Block-Coordinate Ascent for Dense Graphical Models [96.1052289276254]
この研究は、人気のあるDual Block-Coordinate Ascent原則に基づく新しいMAP-solverを導入している。驚いたことに、性能の低い解法に小さな変更を加えることで、既存の解法を大きなマージンで大幅に上回る新しい解法MPLP++を導出します。
論文参考訳（メタデータ） (2020-04-16T16:20:53Z)
Implementing a GPU-based parallel MAX-MIN Ant System [0.0]
我々はGPUベースの並列MMASの実装を改善するための新しいアイデアについて論じる。 MMAS実装は、最先端のGPUベースおよびマルチコアCPUベースの並列ACO実装と競合することを示す。
論文参考訳（メタデータ） (2020-01-18T14:18:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。