論文の概要: Cooperative-Competitive Team Play of Real-World Craft Robots
- arxiv url: http://arxiv.org/abs/2602.21119v1
- Date: Tue, 24 Feb 2026 17:15:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.857696
- Title: Cooperative-Competitive Team Play of Real-World Craft Robots
- Title(参考訳): 実世界のクラフトロボットの協調的競争チームプレイ
- Authors: Rui Zhao, Xihui Li, Yizheng Zhang, Yuzhen Liu, Zhong Zhang, Yufeng Zhang, Cheng Zhou, Zhengyou Zhang, Lei Han,
- Abstract要約: 我々はシミュレーション、分散学習フレームワーク、物理ロボットコンポーネントを含む総合的なロボットシステムを開発する。
そこで我々は,このプラットフォーム上で協調的かつ競争的な政策を効果的に訓練するための強化学習手法を提案し,評価する。
実環境におけるマルチロボットカー競争ゲームと協調作業による実験により,本手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 21.285783193272987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent deep Reinforcement Learning (RL) has made significant progress in developing intelligent game-playing agents in recent years. However, the efficient training of collective robots using multi-agent RL and the transfer of learned policies to real-world applications remain open research questions. In this work, we first develop a comprehensive robotic system, including simulation, distributed learning framework, and physical robot components. We then propose and evaluate reinforcement learning techniques designed for efficient training of cooperative and competitive policies on this platform. To address the challenges of multi-agent sim-to-real transfer, we introduce Out of Distribution State Initialization (OODSI) to mitigate the impact of the sim-to-real gap. In the experiments, OODSI improves the Sim2Real performance by 20%. We demonstrate the effectiveness of our approach through experiments with a multi-robot car competitive game and a cooperative task in real-world settings.
- Abstract(参考訳): マルチエージェント深層強化学習(RL)は,近年,知的ゲームプレイングエージェントの開発において大きな進歩を遂げている。
しかし、マルチエージェントRLを用いた集合ロボットの効率的な訓練や、学習方針の現実世界への移動は、オープンな研究課題のままである。
本研究ではまず,シミュレーション,分散学習フレームワーク,物理ロボットコンポーネントなどを含む総合的なロボットシステムを開発する。
そこで我々は,このプラットフォーム上で協調的かつ競争的な政策を効果的に訓練するための強化学習手法を提案し,評価する。
マルチエージェントのsim-to-real転送の課題に対処するために、sim-to-realギャップの影響を軽減するために、out of Distribution State Initialization (OODSI)を導入する。
実験では、OODSIはSim2Realのパフォーマンスを20%改善した。
実環境におけるマルチロボットカー競争ゲームと協調作業による実験により,本手法の有効性を実証する。
関連論文リスト
- Dyna-Mind: Learning to Simulate from Experience for Better AI Agents [62.21219817256246]
私たちは、現在のAIエージェントは、行動する前に、別の未来を精神的にシミュレートする能力である「悪意ある試行錯誤」を必要としていると論じます。
我々は、(V)LMエージェントに対して、そのようなシミュレーションを推論に組み込むように明示的に教える2段階のトレーニングフレームワークであるDyna-Mindを紹介した。
論文 参考訳(メタデータ) (2025-10-10T17:30:18Z) - Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents [57.35214204211501]
本稿では,AIエージェントの性能向上のための推論と行動を伴う内的世界モデルとプランニングを統合した思考フレームワークDyna-Thinkを提案する。
DITは、R1の思考プロセスを再構築し、提案された(計画された)行動に関連する世界モデルシミュレーションの実行に集中し、この再構成データを用いてポリシーを訓練する。
DDTは2段階のトレーニングプロセスを使用して、まず状態予測や批判生成といった目的を通じてエージェントの世界モデリング能力を改善し、次にポリシートレーニングを通じてエージェントのアクションを改善する。
論文 参考訳(メタデータ) (2025-05-31T00:10:18Z) - Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation [3.5253513747455303]
マルチエージェント強化学習において,いわゆる抽象シミュレータが利用できる範囲について検討する。
抽象シミュレーターは、ロボットの目標タスクを高レベルの抽象化でモデル化し、最適な意思決定に影響を与える可能性のある世界の多くの詳細を破棄する。
ポリシーは抽象シミュレーターで訓練され、個別に保持された低レベル知覚とモーションコントロールモジュールを用いて物理ロボットに転送される。
論文 参考訳(メタデータ) (2025-03-07T02:23:24Z) - Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge [93.4434417387526]
ロボット工学における鍵となるベンチマークタスクとして,Open Vocabulary Mobile Manipulationを提案する。
我々は,この課題に対する解決策を評価するために,シミュレーションと実世界のコンポーネントを兼ね備えたNeurIPS 2023コンペティションを組織した。
シミュレーションと実環境設定の両方で使用される結果と方法論を詳述する。
論文 参考訳(メタデータ) (2024-07-09T15:15:01Z) - Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。
シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文 参考訳(メタデータ) (2023-03-30T17:58:36Z) - rSoccer: A Framework for Studying Reinforcement Learning in Small and
Very Small Size Robot Soccer [0.0]
本稿では,強化学習実験に最適化されたIEEE Very Small Size SoccerとSmall Size Leagueのオープンソースシミュレータを紹介する。
また,単一エージェントおよびマルチエージェントロボットサッカースキルを評価するためのベンチマークタスクのセットを用いて,OpenAI Gym環境を作成するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-15T01:30:21Z) - robo-gym -- An Open Source Toolkit for Distributed Deep Reinforcement
Learning on Real and Simulated Robots [0.5161531917413708]
本稿では,ロボットによる深層強化学習を向上するためのオープンソースのツールキット,robo-gymを提案する。
シミュレーションにおけるトレーニングからロボットへのシームレスな移動を可能にするシミュレーション環境と実環境の統一的なセットアップを実証する。
産業用ロボットを特徴とする2つの実世界アプリケーションを用いて,本フレームワークの能力と有効性を示す。
論文 参考訳(メタデータ) (2020-07-06T13:51:33Z) - Real-World Human-Robot Collaborative Reinforcement Learning [6.089774484591287]
本研究では,人間ロボットによる協調型迷路ゲームの現実的な構成について述べる。
ロボットエージェントの制御には深層強化学習を用い,実戦30分以内の結果を得た。
本研究では,人間とロボットエージェント間の時間的相互政治学習の結果を提示し,各参加者のエージェントがゲームプレイの表現として機能することを示す。
論文 参考訳(メタデータ) (2020-03-02T19:34:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。