論文の概要: VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
- arxiv url: http://arxiv.org/abs/2502.01932v3
- Date: Sat, 17 May 2025 11:20:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:10.423547
- Title: VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play
- Title(参考訳): VolleyBots: モーションコントロールとストラテジックプレイを組み合わせたマルチDrone Volleyballゲーム用テストベッド
- Authors: Zelai Xu, Ruize Zhang, Chao Yu, Huining Yuan, Xiangmin Yi, Shilong Ji, Chuqi Wang, Wenhao Tang, Feng Gao, Wenbo Ding, Xinlei Chen, Yu Wang,
- Abstract要約: われわれはVolleyBotsという新しいロボットスポーツテストベッドを紹介した。複数のドローンが協力し、物理的なダイナミクスの下でバレーボールのスポーツで競う。
VolleyBotsは、競争的で協力的なゲームプレイ、ターンベースのインタラクション構造、アジャイル3D操作という、統合されたプラットフォームに3つの機能を統合する。
- 参考スコア(独自算出の注目度): 26.51145484716405
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot sports, characterized by well-defined objectives, explicit rules, and dynamic interactions, present ideal scenarios for demonstrating embodied intelligence. In this paper, we present VolleyBots, a novel robot sports testbed where multiple drones cooperate and compete in the sport of volleyball under physical dynamics. VolleyBots integrates three features within a unified platform: competitive and cooperative gameplay, turn-based interaction structure, and agile 3D maneuvering. Competitive and cooperative gameplay challenges each drone to coordinate with its teammates while anticipating and countering opposing teams' tactics. Turn-based interaction demands precise timing, accurate state prediction, and management of long-horizon temporal dependencies. Agile 3D maneuvering requires rapid accelerations, sharp turns, and precise 3D positioning despite the quadrotor's underactuated dynamics. These intertwined features yield a complex problem combining motion control and strategic play, with no available expert demonstrations. We provide a comprehensive suite of tasks ranging from single-drone drills to multi-drone cooperative and competitive tasks, accompanied by baseline evaluations of representative multi-agent reinforcement learning (MARL) and game-theoretic algorithms. Simulation results show that on-policy reinforcement learning (RL) methods outperform off-policy methods in single-agent tasks, but both approaches struggle in complex tasks that combine motion control and strategic play. We additionally design a hierarchical policy which achieves a 69.5% percent win rate against the strongest baseline in the 3 vs 3 task, underscoring its potential as an effective solution for tackling the complex interplay between low-level control and high-level strategy. The project page is at https://sites.google.com/view/thu-volleybots.
- Abstract(参考訳): ロボットスポーツは、明確に定義された目的、明示的な規則、動的相互作用によって特徴づけられ、具体的知性を示す理想的なシナリオを提供する。
本稿では,複数のドローンが協力し,体力下でのバレーボール競技に出場する,新しいロボットスポーツテストベッドであるVolleyBotsを紹介する。
VolleyBotsは、競争的で協力的なゲームプレイ、ターンベースのインタラクション構造、アジャイル3D操作という、統合されたプラットフォームに3つの機能を統合する。
競争的で協力的なゲームプレイでは、各ドローンがチームメイトと協調し、相手チームの戦術を予想し、対抗しながら挑戦する。
ターンベースのインタラクションは、正確なタイミング、正確な状態予測、長期の時間的依存関係の管理を必要とする。
アジャイルの3D操作には、急激な加速、鋭い旋回、正確な3D位置決めが必要です。
これらの絡み合った特徴は、モーションコントロールと戦略プレイを組み合わせた複雑な問題をもたらし、専門家によるデモンストレーションは得られない。
本稿では, 汎用マルチエージェント強化学習(MARL)とゲーム理論アルゴリズムのベースライン評価を伴って, 単流体ドリルから多流体協調・競争タスクまで, 総合的なタスクスイートを提供する。
シミュレーションの結果,RL法は単一エージェントタスクにおいて非政治的手法よりも優れることがわかったが,どちらの手法もモーションコントロールと戦略プレイを組み合わせた複雑なタスクに苦戦している。
また、3対3のタスクにおいて最強のベースラインに対して69.5%の勝利率を達成する階層的な政策を設計し、低レベルの制御と高レベルの戦略の間の複雑な相互作用に対処するための効果的な解決策としての可能性を示す。
プロジェクトのページはhttps://sites.google.com/view/thu-volleybotsにある。
関連論文リスト
- Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation [3.5253513747455303]
マルチエージェント強化学習において,いわゆる抽象シミュレータが利用できる範囲について検討する。
抽象シミュレーターは、ロボットの目標タスクを高レベルの抽象化でモデル化し、最適な意思決定に影響を与える可能性のある世界の多くの詳細を破棄する。
ポリシーは抽象シミュレーターで訓練され、個別に保持された低レベル知覚とモーションコントロールモジュールを用いて物理ロボットに転送される。
論文 参考訳(メタデータ) (2025-03-07T02:23:24Z) - A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。
我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。
その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-08T17:20:47Z) - $π_0$: A Vision-Language-Action Flow Model for General Robot Control [77.32743739202543]
本稿では,インターネット規模のセマンティック知識を継承するために,事前学習された視覚言語モデル(VLM)上に構築された新しいフローマッチングアーキテクチャを提案する。
我々は,事前訓練後のタスクをゼロショットで実行し,人からの言語指導に追従し,微調整で新たなスキルを習得する能力の観点から,我々のモデルを評価した。
論文 参考訳(メタデータ) (2024-10-31T17:22:30Z) - Robot Air Hockey: A Manipulation Testbed for Robot Learning with Reinforcement Learning [34.055177769808914]
本稿では,ロボットエアホッケーに基づく動的対話型RLテストベッドを提案する。
我々のテストベッドは、RL能力の様々な評価を可能にします。
ロボットのエアホッケーテストベッドは、3つのドメインでシミュレート・トゥ・リアル・トランスファーをサポートする。
論文 参考訳(メタデータ) (2024-05-06T02:13:08Z) - Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning [17.906144781244336]
我々は,自己中心型RGBビジョンによる完全オンボード計算とセンシングにより,エンドツーエンドのロボットサッカーポリシーを訓練する。
本稿では,マルチエージェントロボットサッカーにおけるエンドツーエンドトレーニングの最初の実演を行う。
論文 参考訳(メタデータ) (2024-05-03T18:41:13Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Evolving Multi-Objective Neural Network Controllers for Robot Swarms [0.0]
本研究では,ロボット群に対する制御器開発のための多目的進化型ニューラルネットワーク手法を提案する。
Swarmロボットコントローラは、低忠実度Pythonシミュレータでトレーニングされ、Webotsを使用して高忠実度シミュレーション環境でテストされる。
論文 参考訳(メタデータ) (2023-07-26T15:05:17Z) - HomeRobot: Open-Vocabulary Mobile Manipulation [107.05702777141178]
Open-Vocabulary Mobile Manipulation (OVMM) は、目に見えない環境で任意のオブジェクトを選択し、命令された場所に配置する問題である。
HomeRobotには2つのコンポーネントがある。シミュレーションコンポーネントは、新しい高品質のマルチルームホーム環境に、大規模で多様なキュレートされたオブジェクトセットを使用する。
論文 参考訳(メタデータ) (2023-06-20T14:30:32Z) - Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning [26.13655448415553]
Deep Reinforcement Learning (Deep RL)は、低コストでミニチュアなヒューマノイドロボットのための洗練された安全な運動スキルを合成することができる。
我々はDeep RLを使って、20個の関節を持つヒューマノイドロボットを訓練し、1対1(1v1)のサッカーゲームを単純化した。
結果として得られるエージェントは、急激な転倒回復、歩行、回転、蹴りなど、堅牢でダイナミックな動きのスキルを示す。
論文 参考訳(メタデータ) (2023-04-26T16:25:54Z) - A Deep Reinforcement Learning Strategy for UAV Autonomous Landing on a
Platform [0.0]
物理シミュレーションプラットフォーム(ROS-RL)の一種であるGazeboに基づく強化学習フレームワークを提案する。
我々は,自律着陸問題に対処するために,3つの連続行動空間強化学習アルゴリズムをフレームワークに使用した。
論文 参考訳(メタデータ) (2022-09-07T06:33:57Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z) - From Motor Control to Team Play in Simulated Humanoid Football [56.86144022071756]
我々は、現実的な仮想環境でサッカーをするために、物理的にシミュレートされたヒューマノイドアバターのチームを訓練する。
一連の段階において、プレイヤーはまず、現実的な人間のような動きを実行するために、完全に関節化された身体を制御することを学習する。
その後、ドリブルやシューティングといった中級のサッカーのスキルを身につける。
最後に、彼らは他の人を意識し、チームとしてプレーし、ミリ秒のタイムスケールで低レベルのモーターコントロールのギャップを埋める。
論文 参考訳(メタデータ) (2021-05-25T20:17:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。