論文の概要: VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
- arxiv url: http://arxiv.org/abs/2502.01932v2
- Date: Tue, 11 Feb 2025 03:00:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 13:59:04.893082
- Title: VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
- Title(参考訳): VolleyBots: モーションコントロールとストラテジックプレイを組み合わせたマルチDrone Volleyballゲーム用テストベッド
- Authors: Zelai Xu, Chao Yu, Ruize Zhang, Huining Yuan, Xiangmin Yi, Shilong Ji, Chuqi Wang, Wenhao Tang, Yu Wang,
- Abstract要約: VolleyBotsは新しいMARLテストベッドで、複数のドローンが協力し、物理的なダイナミクスの下でバレーボールを競う。
単流体ドリルから多流体協調・競争タスクまで,幅広いタスクスイートを提供する。
シミュレーションの結果、既存のアルゴリズムは単純なタスクを効果的に処理するが、低レベルの制御と高レベルの戦略の両方を必要とする複雑なタスクでは困難に直面することがわかった。
- 参考スコア(独自算出の注目度): 8.146787794899968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent reinforcement learning (MARL) has made significant progress, largely fueled by the development of specialized testbeds that enable systematic evaluation of algorithms in controlled yet challenging scenarios. However, existing testbeds often focus on purely virtual simulations or limited robot morphologies such as robotic arms, quadrupeds, and humanoids, leaving high-mobility platforms with real-world physical constraints like drones underexplored. To bridge this gap, we present VolleyBots, a new MARL testbed where multiple drones cooperate and compete in the sport of volleyball under physical dynamics. VolleyBots features a turn-based interaction model under volleyball rules, a hierarchical decision-making process that combines motion control and strategic play, and a high-fidelity simulation for seamless sim-to-real transfer. We provide a comprehensive suite of tasks ranging from single-drone drills to multi-drone cooperative and competitive tasks, accompanied by baseline evaluations of representative MARL and game-theoretic algorithms. Results in simulation show that while existing algorithms handle simple tasks effectively, they encounter difficulty in complex tasks that require both low-level control and high-level strategy. We further demonstrate zero-shot deployment of a simulation-learned policy to real-world drones, highlighting VolleyBots' potential to propel MARL research involving agile robotic platforms. The project page is at https://sites.google.com/view/thu-volleybots/home.
- Abstract(参考訳): マルチエージェント強化学習(MARL)は、制御されながら困難なシナリオにおけるアルゴリズムの体系的な評価を可能にする特別なテストベッドの開発によって、大きな進歩を遂げている。
しかし、既存のテストベッドは、純粋に仮想シミュレーションやロボットアーム、四足歩行、ヒューマノイドのような限定的なロボット形態に焦点を合わせており、ドローンのような現実世界の物理的な制約のある高機能プラットフォームを残している。
このギャップを埋めるために、VolleyBotsという新しいMARLテストベッドを紹介します。
VolleyBotsは、バレーボールルールの下でターンベースのインタラクションモデル、モーションコントロールと戦略プレイを組み合わせた階層的な意思決定プロセス、シームレスなシミュレートからリアルへの移行のための高忠実なシミュレーションを備えている。
代表的MARLとゲーム理論アルゴリズムのベースライン評価を伴って, 単流体ドリルから多流体協調・競争タスクまで, 総合的なタスクスイートを提供する。
シミュレーションの結果、既存のアルゴリズムは単純なタスクを効果的に処理するが、低レベルの制御と高レベルの戦略の両方を必要とする複雑なタスクでは困難に直面することがわかった。
さらに、シミュレーションで学習したポリシーを現実世界のドローンにゼロショットで展開し、VolleyBotsがアジャイルなロボットプラットフォームを含むMARL研究を促進する可能性を強調した。
プロジェクトのページはhttps://sites.google.com/view/thu-volleybots/homeにある。
関連論文リスト
- Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams [25.885025521590414]
完全自律型・分散型四足ロボットサッカーを可能にする階層型マルチエージェント強化学習(MARL)フレームワークを提案する。
第一に、歩行、ドリブル、蹴りなどの足の動きやボール操作のために、非常にダイナミックな低レベルスキルのセットを訓練する。
これらに加えて、高レベルの戦略計画方針は、Fictitious Self-Playを介してマルチエージェント・プロキシ・ポリシー最適化(MAPPO)を用いて訓練される。
論文 参考訳(メタデータ) (2025-05-20T02:20:54Z) - Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning [13.062481157503495]
我々は3v3マルチドローンバレーボールを習うことの課題に取り組む。
このタスクには、高レベルの戦略的調整と低レベルのアジャイル管理の両方が必要です。
階層型強化学習フレームワークである階層型自己学習を提案する。
論文 参考訳(メタデータ) (2025-05-07T11:04:36Z) - Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation [3.5253513747455303]
マルチエージェント強化学習において,いわゆる抽象シミュレータが利用できる範囲について検討する。
抽象シミュレーターは、ロボットの目標タスクを高レベルの抽象化でモデル化し、最適な意思決定に影響を与える可能性のある世界の多くの詳細を破棄する。
ポリシーは抽象シミュレーターで訓練され、個別に保持された低レベル知覚とモーションコントロールモジュールを用いて物理ロボットに転送される。
論文 参考訳(メタデータ) (2025-03-07T02:23:24Z) - A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。
我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。
その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-08T17:20:47Z) - $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Robot Air Hockey: A Manipulation Testbed for Robot Learning with Reinforcement Learning [34.055177769808914]
本稿では,ロボットエアホッケーに基づく動的対話型RLテストベッドを提案する。
我々のテストベッドは、RL能力の様々な評価を可能にします。
ロボットのエアホッケーテストベッドは、3つのドメインでシミュレート・トゥ・リアル・トランスファーをサポートする。
論文 参考訳(メタデータ) (2024-05-06T02:13:08Z) - Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning [17.906144781244336]
我々は,自己中心型RGBビジョンによる完全オンボード計算とセンシングにより,エンドツーエンドのロボットサッカーポリシーを訓練する。
本稿では,マルチエージェントロボットサッカーにおけるエンドツーエンドトレーニングの最初の実演を行う。
論文 参考訳(メタデータ) (2024-05-03T18:41:13Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z) - Evolving Multi-Objective Neural Network Controllers for Robot Swarms [0.0]
本研究では,ロボット群に対する制御器開発のための多目的進化型ニューラルネットワーク手法を提案する。
Swarmロボットコントローラは、低忠実度Pythonシミュレータでトレーニングされ、Webotsを使用して高忠実度シミュレーション環境でテストされる。
論文 参考訳(メタデータ) (2023-07-26T15:05:17Z) - HomeRobot: Open-Vocabulary Mobile Manipulation [107.05702777141178]
Open-Vocabulary Mobile Manipulation (OVMM) は、目に見えない環境で任意のオブジェクトを選択し、命令された場所に配置する問題である。
HomeRobotには2つのコンポーネントがある。シミュレーションコンポーネントは、新しい高品質のマルチルームホーム環境に、大規模で多様なキュレートされたオブジェクトセットを使用する。
論文 参考訳(メタデータ) (2023-06-20T14:30:32Z) - Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning [26.13655448415553]
Deep Reinforcement Learning (Deep RL)は、低コストでミニチュアなヒューマノイドロボットのための洗練された安全な運動スキルを合成することができる。
我々はDeep RLを使って、20個の関節を持つヒューマノイドロボットを訓練し、1対1(1v1)のサッカーゲームを単純化した。
結果として得られるエージェントは、急激な転倒回復、歩行、回転、蹴りなど、堅牢でダイナミックな動きのスキルを示す。
論文 参考訳(メタデータ) (2023-04-26T16:25:54Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - DIAMBRA Arena: a New Reinforcement Learning Platform for Research and
Experimentation [91.3755431537592]
本研究は、強化学習研究と実験のための新しいプラットフォームであるDIAMBRA Arenaを提示する。
高品質な環境のコレクションが,OpenAI Gym標準に完全に準拠したPython APIを公開している。
これらは、離散的なアクションと観測を生のピクセルと追加の数値で構成したエピソディックなタスクである。
論文 参考訳(メタデータ) (2022-10-19T14:39:10Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a
Platform [0.0]
物理シミュレーションプラットフォーム(ROS-RL)の一種であるGazeboに基づく強化学習フレームワークを提案する。
我々は,自律着陸問題に対処するために,3つの連続行動空間強化学習アルゴリズムをフレームワークに使用した。
論文 参考訳(メタデータ) (2022-09-07T06:33:57Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z) - From Motor Control to Team Play in Simulated Humanoid Football [56.86144022071756]
我々は、現実的な仮想環境でサッカーをするために、物理的にシミュレートされたヒューマノイドアバターのチームを訓練する。
一連の段階において、プレイヤーはまず、現実的な人間のような動きを実行するために、完全に関節化された身体を制御することを学習する。
その後、ドリブルやシューティングといった中級のサッカーのスキルを身につける。
最後に、彼らは他の人を意識し、チームとしてプレーし、ミリ秒のタイムスケールで低レベルのモーターコントロールのギャップを埋める。
論文 参考訳(メタデータ) (2021-05-25T20:17:10Z) - Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team
Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。
この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。
1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文 参考訳(メタデータ) (2021-05-18T17:27:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。