論文の概要: R2D-RL: A RoboCup 2D Soccer Environment for Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.18786v1
- Date: Wed, 17 Jun 2026 07:57:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.054245
- Title: R2D-RL: A RoboCup 2D Soccer Environment for Multi-Agent Reinforcement Learning
- Title(参考訳): R2D-RL:マルチエージェント強化学習のためのロボカップ2Dサッカー環境
- Authors: Haobin Qin, Baofeng Zhang, Hidehisa Akiyama, Keisuke Fujii,
- Abstract要約: RoboCup 2D Soccer Simulation (RCSS2D)は、成熟したロボット・ソクラシー・プラットフォームを提供する。
R2D-RLはRCSS2DとHELIOSベースのプレイヤークライアントをPython MARLインターフェースに接続する強化学習環境である。
私たちは、ベースライン結果とともに、フロントゴールシナリオと11-vs-11フルフィールドベンチマークを提供します。
- 参考スコア(独自算出の注目度): 5.368091808102033
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Robot soccer is a challenging testbed for multi-agent reinforcement learning because it combines partial observability, cooperative and adversarial interaction, sparse rewards, and long-horizon tactical behavior. RoboCup 2D Soccer Simulation (RCSS2D) provides a mature robot-soccer platform, but its competition-oriented server-client architecture is difficult to use directly with modern Python-based MARL workflows. We introduce R2D-RL, a reinforcement learning environment that connects RCSS2D and HELIOS-based player clients to a Python MARL interface through shared-memory communication and cycle-level synchronization. R2D-RL supports full-field and scenario-based training with configurable opponents, Base discrete and Hybrid parameterized action spaces, action masks, expected possession value (EPV)-based reward shaping, and parallel execution. We provide front-goal scenarios and an 11-vs-11 full-field benchmark, together with baseline results.
- Abstract(参考訳): ロボットサッカーは、部分的な可観測性、協調的および敵対的相互作用、スパース報酬、長期的戦術行動を組み合わせた多エージェント強化学習のための挑戦的なテストベッドである。
RoboCup 2D Soccer Simulation (RCSS2D)は、成熟したロボット・サクサ・プラットフォームを提供するが、競合指向のサーバ・クライアント・アーキテクチャは、最新のPythonベースのMARLワークフローを直接使用するのは難しい。
R2D-RLはRCSS2DとHELIOSベースのプレイヤークライアントを共有メモリ通信とサイクルレベルの同期を通じてPython MARLインターフェースに接続する強化学習環境である。
R2D-RLは、設定可能な相手、ベース離散およびハイブリッドパラメータ化アクションスペース、アクションマスク、EPVベースの報酬形成、並列実行によるフルフィールドおよびシナリオベースのトレーニングをサポートする。
私たちは、ベースライン結果とともに、フロントゴールシナリオと11-vs-11フルフィールドベンチマークを提供します。
関連論文リスト
- ARC-RL: A Reinforcement Learning Playground Inspired by ARC Raiders [11.905134977931075]
ARC-RLは、ARCレイダーに触発されたロボット形態を特徴とする4つのMuJoCo連続制御環境のスイートである。
4つのロボットは、統一された観察テンプレート、アクションコンベンション、シミュレーションケイデンス、および単一のクローズドフォームマルチコンポーネント報酬関数を共有している。
論文 参考訳(メタデータ) (2026-05-19T07:54:40Z) - Seeing Together: Multi-Robot Cooperative Egocentric Spatial Reasoning with Multimodal Large Language Models [76.29781698910202]
本研究では, きめ細かい協調的空間推論のための枠組みを提案する。
SP-CoRは、動的に認識されるマルチロボットフレームサンプリング、スペクトルおよび物理誘導型ビューフュージョン、および物理に整合した即時蒸留を組み合わせた。
ハビタットでは+3.87%、iGibsonでは+7.12%、微調整ベースラインでは+3.87%である。
論文 参考訳(メタデータ) (2026-05-18T14:04:26Z) - Efficient Multi-turn RL for GUI Agents via Decoupled Training and Adaptive Data Curation [65.3648667980258]
視覚言語モデル(VLM)に基づくGUIエージェントは複雑なタスクの自動化を約束するが、強化学習(RL)の適用において大きな課題に直面している。
異種モジュールを高度に非結合的に協調するGUIエージェントのための非結合エージェントRLトレーニングフレームワークであるDARTを提案する。
OSWorldのベンチマークでは、DART-GUI-7Bは42.13%のタスク成功率、14.61%の絶対ゲイン、オープンソースSOTAよりも7.34%高い。
論文 参考訳(メタデータ) (2025-09-28T13:19:20Z) - RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics [67.11221574129937]
空間参照は、3D物理世界と相互作用するエンボディロボットの基本的な能力である。
本稿では,まず空間的理解を正確に行うことのできる3次元VLMであるRoboReferを提案する。
RoboReferは、強化微調整による一般化された多段階空間推論を推進している。
論文 参考訳(メタデータ) (2025-06-04T17:59:27Z) - Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams [18.20205072720915]
完全自律型・分散型四足ロボットサッカーを可能にする階層型マルチエージェント強化学習(MARL)フレームワークを提案する。
第一に、歩行、ドリブル、蹴りなどの足の動きやボール操作のために、非常にダイナミックな低レベルスキルのセットを訓練する。
これらに加えて、高レベルの戦略計画方針は、Fictitious Self-Playを介してマルチエージェント・プロキシ・ポリシー最適化(MAPPO)を用いて訓練される。
論文 参考訳(メタデータ) (2025-05-20T02:20:54Z) - RobocupGym: A challenging continuous control benchmark in Robocup [7.926196208425107]
本稿では,オープンソースのrcssserver3dサッカーサーバをベースとしたRobocupベースのRL環境を提案する。
各タスクでは、RLエージェントがシミュレートされたロボットを制御し、ボールや他のエージェントと対話することができる。
論文 参考訳(メタデータ) (2024-07-03T15:26:32Z) - Robot Air Hockey: A Manipulation Testbed for Robot Learning with Reinforcement Learning [34.055177769808914]
本稿では,ロボットエアホッケーに基づく動的対話型RLテストベッドを提案する。
我々のテストベッドは、RL能力の様々な評価を可能にします。
ロボットのエアホッケーテストベッドは、3つのドメインでシミュレート・トゥ・リアル・トランスファーをサポートする。
論文 参考訳(メタデータ) (2024-05-06T02:13:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。