Fugu-MT 論文翻訳(概要): JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes

論文の概要: JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes

arxiv url: http://arxiv.org/abs/2505.06771v2
Date: Tue, 27 May 2025 02:07:54 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-28 14:37:19.371794
Title: JaxRobotarium: Training and Deploying Multi-Robot Policies in 10 Minutes
Title（参考訳）: JaxRobotarium: マルチロボットポリシーのトレーニングとデプロイを10分で行う
Authors: Shalin Anand Jain, Jiazhen Liu, Siva Kailas, Harish Ravichandar,
Abstract要約: マルチエージェント強化学習(MARL)は,マルチロボットシステムにおける複雑でスケーラブルな協調動作を学習するための,有望なソリューションである。私たちは、Robotarium用のJaxベースのエンドツーエンドシミュレーション、学習、デプロイメント、ベンチマークプラットフォームであるJaxRobotariumにコントリビュートしています。
参考スコア（独自算出の注目度）: 1.768052197741668
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-agent reinforcement learning (MARL) has emerged as a promising solution for learning complex and scalable coordination behaviors in multi-robot systems. However, established MARL platforms (e.g., SMAC and MPE) lack robotics relevance and hardware deployment, leaving multi-robot learning researchers to develop bespoke environments and hardware testbeds dedicated to the development and evaluation of their individual contributions. The Multi-Agent RL Benchmark and Learning Environment for the Robotarium (MARBLER) is an exciting recent step in providing a standardized robotics-relevant platform for MARL, by bridging the Robotarium testbed with existing MARL software infrastructure. However, MARBLER lacks support for parallelization and GPU/TPU execution, making the platform prohibitively slow compared to modern MARL environments and hindering adoption. We contribute JaxRobotarium, a Jax-powered end-to-end simulation, learning, deployment, and benchmarking platform for the Robotarium. JaxRobotarium enables rapid training and deployment of multi-robot RL (MRRL) policies with realistic robot dynamics and safety constraints, supporting parallelization and hardware acceleration. Our generalizable learning interface integrates easily with SOTA MARL libraries (e.g., JaxMARL). In addition, JaxRobotarium includes eight standardized coordination scenarios, including four novel scenarios that bring established MARL benchmark tasks (e.g., RWARE and Level-Based Foraging) to a robotics setting. We demonstrate that JaxRobotarium retains high simulation fidelity while achieving dramatic speedups over baseline (20x in training and 150x in simulation), and provides an open-access sim-to-real evaluation pipeline through the Robotarium testbed, accelerating and democratizing access to multi-robot learning research and evaluation. Our code is available at https://github.com/GT-STAR-Lab/JaxRobotarium.
Abstract（参考訳）: マルチエージェント強化学習(MARL)は,マルチロボットシステムにおける複雑でスケーラブルな協調動作を学習するための,有望なソリューションである。しかし、確立されたMARLプラットフォーム(例えば、SMACとMPE)は、ロボティクスの関連性やハードウェアのデプロイメントに欠けており、マルチロボット学習の研究者は、個々のコントリビューションの開発と評価専用ハードウェアテストベッドを開発する必要がある。 Multi-Agent RL Benchmark and Learning Environment for the Robotarium (MARBLER)は、既存のMARLソフトウェアインフラストラクチャでテストされたRobotariumをブリッジすることで、MARLの標準化されたロボティクス関連プラットフォームを提供する、エキサイティングな最近のステップである。しかし、MARBLERは並列化とGPU/TPU実行をサポートしていないため、現在のMARL環境と比べてプラットフォームが著しく遅くなり、採用を妨げている。私たちは、Robotarium用のJaxベースのエンドツーエンドシミュレーション、学習、デプロイメント、ベンチマークプラットフォームであるJaxRobotariumにコントリビュートしています。 JaxRobotariumは、現実的なロボットダイナミクスと安全制約を備えたマルチロボットRL(MRRL)ポリシーの迅速なトレーニングとデプロイを可能にし、並列化とハードウェアアクセラレーションをサポートする。我々の一般化可能な学習インタフェースは、SOTA MARLライブラリ(例えば、JaxMARL)と容易に統合できる。さらに、JaxRobotariumには8つの標準化された調整シナリオが含まれており、ロボティクス設定に確立されたMARLベンチマークタスク(例えば、RWAREとLevel-Based Foraging)をもたらす4つの新しいシナリオが含まれている。我々は,JaxRobotariumが,ベースライン上での劇的な高速化(20倍,シミュレーションで150倍)を達成しつつ,高いシミュレーション忠実性を保ちながら,Robotariumテストベッドを通じてオープンアクセスシム・トゥ・リアル評価パイプラインを提供し,マルチロボット学習研究と評価へのアクセスを促進・民主化していることを示す。私たちのコードはhttps://github.com/GT-STAR-Lab/JaxRobotarium.comで公開されています。

関連論文リスト

Isaac Lab: A GPU-Accelerated Simulation Framework for Multi-Modal Robot Learning [72.43357471969564]
Isaac Labは、高忠実度GPU並列物理、レンダリング、および環境の設計とロボットポリシーのトレーニングのためのモジュラーで構成可能なアーキテクチャを組み合わせる。我々は、全身制御、クロス・エボディメント・モビリティ、接触豊かで器用な操作、スキル獲得のための人間のデモの統合など、さまざまな課題へのその応用を強調した。アイザック・ラボの高度なシミュレーション能力、リッチセンシング、データセンターのスケール実行の組み合わせは、ロボット研究における次世代のブレークスルーを解き放つのに役立つと信じています。
論文参考訳（メタデータ） (2025-11-06T21:43:02Z)
Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.166320712764465]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文参考訳（メタデータ） (2025-09-18T13:12:16Z)
Assistax: A Hardware-Accelerated Reinforcement Learning Benchmark for Assistive Robotics [18.70896736010314]
ゲームは、関連する課題を提示し、実行しやすく、理解しやすいため、強化学習ベンチマークを支配しています。 Assistaxは、支援ロボットタスクに起因する課題に対処するために設計されたオープンソースのベンチマークである。オープンループのウォールタイムに関しては、AsistaxはCPUベースの代替よりもベクタライジングトレーニングの実行が速い場合、最大370タイムで動作します。
論文参考訳（メタデータ） (2025-07-29T09:49:11Z)
NavBench: A Unified Robotics Benchmark for Reinforcement Learning-Based Autonomous Navigation [16.554282855005766]
我々は、強化学習に基づくナビゲーションポリシーのトレーニングと評価のためのベンチマークであるNavBenchを紹介する。我々のフレームワークはタスク定義を標準化し、異なるロボットが様々なナビゲーション課題に取り組むことを可能にする。 NavBenchはシミュレーションと実世界のデプロイメントの一貫性を確保することで、RLベースのナビゲーション戦略の開発を簡単にする。
論文参考訳（メタデータ） (2025-05-20T15:48:23Z)
Sim-to-Real Transfer for Mobile Robots with Reinforcement Learning: from NVIDIA Isaac Sim to Gazebo and Real ROS 2 Robots [1.2773537446441052]
この記事では、イザックの地域計画と障害物回避への応用を実証することに焦点を当てる。ロボット・オペレーティング・システム(ROS)のナビゲーション・スタックであるNav2でエンドツーエンドのポリシーをベンチマークする。また、Isaacシミュレータで訓練されたポリシーを実世界のロボットにゼロショット転送可能であることを示すことで、sim-to-realトランスファープロセスをカバーしている。
論文参考訳（メタデータ） (2025-01-06T10:26:16Z)
IRASim: Learning Interactive Real-Robot Action Simulators [24.591694756757278]
本稿では,ロボットアームが与えられた動作軌跡を実行する様子をリアルに映像化するための新しい手法IRASimを提案する。提案手法の有効性を検証するため,3つの実ロボットデータセットに基づいて,新しいベンチマーク IRASim Benchmark を作成する。その結果, IRASimはすべての基準法より優れており, 人的評価に好適であることが示唆された。
論文参考訳（メタデータ） (2024-06-20T17:50:16Z)
RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文参考訳（メタデータ） (2024-02-22T15:12:00Z)
SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning [82.46975428739329]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文参考訳（メタデータ） (2024-01-29T10:01:10Z)
JaxMARL: Multi-Agent RL Environments and Algorithms in JAX [105.343918678781]
我々は、GPU対応の効率と多くの一般的なMARL環境のサポートを組み合わせた、最初のオープンソースPythonベースのライブラリであるJaxMARLを紹介します。我々の実験は、壁時計時間の観点から、JAXベースのトレーニングパイプラインが既存のアプローチの約14倍高速であることを示している。また、人気の高いStarCraft Multi-Agent ChallengeのJAXベースの近似的な再実装であるSMAXを紹介し、ベンチマークする。
論文参考訳（メタデータ） (2023-11-16T18:58:43Z)
From Multi-agent to Multi-robot: A Scalable Training and Evaluation Platform for Multi-robot Reinforcement Learning [12.74238738538799]
マルチエージェント強化学習(MARL)は、過去数十年間、学術や産業から広く注目を集めてきた。これらの手法が実際のシナリオ、特にマルチロボットシステムでどのように機能するかは未だ分かっていない。本稿では,マルチロボット強化学習(MRRL)のためのスケーラブルなエミュレーションプラットフォームSMARTを提案する。
論文参考訳（メタデータ） (2022-06-20T06:36:45Z)
Tiny Robot Learning: Challenges and Directions for Machine Learning in Resource-Constrained Robots [57.27442333662654]
機械学習(ML)は、コンピュータシステムにまたがる普及したツールとなっている。ティニー・ロボット・ラーニング(Tiny Robot Learning)とは、リソースに制約された低コストの自律ロボットにMLを配置する手法である。小型ロボット学習は、サイズ、重量、面積、パワー(SWAP)の制約によって困難にさらされる。本稿では,小型ロボットの学習空間を簡潔に調査し,重要な課題を詳述し,MLシステム設計における将来的な仕事の機会を提案する。
論文参考訳（メタデータ） (2022-05-11T19:36:15Z)
Distributed Reinforcement Learning for Robot Teams: A Review [10.92709534981466]
近年のセンサ,アクティベーション,計算の進歩により,マルチロボットシステムへの扉が開きつつある。コミュニティはモデルフリーのマルチエージェント強化学習を活用して、マルチロボットシステムのための効率的でスケーラブルなコントローラを開発した。最近の知見:分散MSSは、非定常性や部分観測可能性などの根本的な課題に直面している。
論文参考訳（メタデータ） (2022-04-07T15:34:19Z)
SurRoL: An Open-source Reinforcement Learning Centered and dVRK Compatible Platform for Surgical Robot Learning [78.76052604441519]
SurRoLは、ダ・ヴィンチ・リサーチキット(dVRK)と互換性のある外科ロボット学習のためのRL中心のシミュレーションプラットフォームである。プラットフォームには10の学習ベースの外科的タスクが構築されており、実際の自律的な外科的実行に共通している。シミュレーションにおいてRLアルゴリズムを用いてSurRoLの評価を行い、奥行き分析を行い、実際のdVRKにトレーニングされたポリシーをデプロイし、実世界でより優れた転送性を実現することを示す。
論文参考訳（メタデータ） (2021-08-30T07:43:47Z)
Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文参考訳（メタデータ） (2021-03-05T14:16:20Z)
RL STaR Platform: Reinforcement Learning for Simulation based Training of Robots [3.249853429482705]
強化学習(Reinforcement Learning, RL)は、宇宙ロボット工学における自律性と意思決定能力を高めるための、有望な分野である。本稿では,RL STaRプラットフォームについて紹介する。
論文参考訳（メタデータ） (2020-09-21T03:09:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。