Fugu-MT 論文翻訳(概要): Cooperative-Competitive Team Play of Real-World Craft Robots

論文の概要: Cooperative-Competitive Team Play of Real-World Craft Robots

arxiv url: http://arxiv.org/abs/2602.21119v1
Date: Tue, 24 Feb 2026 17:15:37 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.857696
Title: Cooperative-Competitive Team Play of Real-World Craft Robots
Title（参考訳）: 実世界のクラフトロボットの協調的競争チームプレイ
Authors: Rui Zhao, Xihui Li, Yizheng Zhang, Yuzhen Liu, Zhong Zhang, Yufeng Zhang, Cheng Zhou, Zhengyou Zhang, Lei Han,
Abstract要約: 我々はシミュレーション、分散学習フレームワーク、物理ロボットコンポーネントを含む総合的なロボットシステムを開発する。そこで我々は,このプラットフォーム上で協調的かつ競争的な政策を効果的に訓練するための強化学習手法を提案し,評価する。実環境におけるマルチロボットカー競争ゲームと協調作業による実験により,本手法の有効性を実証する。
参考スコア（独自算出の注目度）: 21.285783193272987
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-agent deep Reinforcement Learning (RL) has made significant progress in developing intelligent game-playing agents in recent years. However, the efficient training of collective robots using multi-agent RL and the transfer of learned policies to real-world applications remain open research questions. In this work, we first develop a comprehensive robotic system, including simulation, distributed learning framework, and physical robot components. We then propose and evaluate reinforcement learning techniques designed for efficient training of cooperative and competitive policies on this platform. To address the challenges of multi-agent sim-to-real transfer, we introduce Out of Distribution State Initialization (OODSI) to mitigate the impact of the sim-to-real gap. In the experiments, OODSI improves the Sim2Real performance by 20%. We demonstrate the effectiveness of our approach through experiments with a multi-robot car competitive game and a cooperative task in real-world settings.
Abstract（参考訳）: マルチエージェント深層強化学習(RL)は,近年,知的ゲームプレイングエージェントの開発において大きな進歩を遂げている。しかし、マルチエージェントRLを用いた集合ロボットの効率的な訓練や、学習方針の現実世界への移動は、オープンな研究課題のままである。本研究ではまず,シミュレーション,分散学習フレームワーク,物理ロボットコンポーネントなどを含む総合的なロボットシステムを開発する。そこで我々は,このプラットフォーム上で協調的かつ競争的な政策を効果的に訓練するための強化学習手法を提案し,評価する。マルチエージェントのsim-to-real転送の課題に対処するために、sim-to-realギャップの影響を軽減するために、out of Distribution State Initialization (OODSI)を導入する。実験では、OODSIはSim2Realのパフォーマンスを20%改善した。実環境におけるマルチロボットカー競争ゲームと協調作業による実験により,本手法の有効性を実証する。

関連論文リスト

Dyna-Mind: Learning to Simulate from Experience for Better AI Agents [62.21219817256246]
私たちは、現在のAIエージェントは、行動する前に、別の未来を精神的にシミュレートする能力である「悪意ある試行錯誤」を必要としていると論じます。我々は、(V)LMエージェントに対して、そのようなシミュレーションを推論に組み込むように明示的に教える2段階のトレーニングフレームワークであるDyna-Mindを紹介した。
論文参考訳（メタデータ） (2025-10-10T17:30:18Z)
Dyna-Think: Synergizing Reasoning, Acting, and World Model Simulation in AI Agents [57.35214204211501]
本稿では,AIエージェントの性能向上のための推論と行動を伴う内的世界モデルとプランニングを統合した思考フレームワークDyna-Thinkを提案する。 DITは、R1の思考プロセスを再構築し、提案された(計画された)行動に関連する世界モデルシミュレーションの実行に集中し、この再構成データを用いてポリシーを訓練する。 DDTは2段階のトレーニングプロセスを使用して、まず状態予測や批判生成といった目的を通じてエージェントの世界モデリング能力を改善し、次にポリシートレーニングを通じてエージェントのアクションを改善する。
論文参考訳（メタデータ） (2025-05-31T00:10:18Z)
Multi-Robot Collaboration through Reinforcement Learning and Abstract Simulation [3.5253513747455303]
マルチエージェント強化学習において,いわゆる抽象シミュレータが利用できる範囲について検討する。抽象シミュレーターは、ロボットの目標タスクを高レベルの抽象化でモデル化し、最適な意思決定に影響を与える可能性のある世界の多くの詳細を破棄する。ポリシーは抽象シミュレーターで訓練され、個別に保持された低レベル知覚とモーションコントロールモジュールを用いて物理ロボットに転送される。
論文参考訳（メタデータ） (2025-03-07T02:23:24Z)
A Retrospective on the Robot Air Hockey Challenge: Benchmarking Robust, Reliable, and Safe Learning Techniques for Real-world Robotics [53.33976793493801]
私たちは、NeurIPS 2023カンファレンスでRobot Air Hockey Challengeを組織しました。我々は、シム・トゥ・リアルギャップ、低レベルの制御問題、安全性問題、リアルタイム要件、実世界のデータの限られた可用性など、ロボット工学における実践的な課題に焦点を当てる。その結果、学習に基づくアプローチと事前知識を組み合わせたソリューションは、実際のデプロイメントが困難である場合にデータのみに依存するソリューションよりも優れていることがわかった。
論文参考訳（メタデータ） (2024-11-08T17:20:47Z)
Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge [93.4434417387526]
ロボット工学における鍵となるベンチマークタスクとして,Open Vocabulary Mobile Manipulationを提案する。我々は,この課題に対する解決策を評価するために,シミュレーションと実世界のコンポーネントを兼ね備えたNeurIPS 2023コンペティションを組織した。シミュレーションと実環境設定の両方で使用される結果と方法論を詳述する。
論文参考訳（メタデータ） (2024-07-09T15:15:01Z)
SERL: A Software Suite for Sample-Efficient Robotic Reinforcement Learning [82.46975428739329]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文参考訳（メタデータ） (2024-01-29T10:01:10Z)
Learning Human-to-Robot Handovers from Point Clouds [63.18127198174958]
視覚に基づく人間ロボットハンドオーバの制御ポリシーを学習する最初のフレームワークを提案する。シミュレーションベンチマーク,sim-to-sim転送,sim-to-real転送において,ベースラインよりも大きな性能向上を示した。
論文参考訳（メタデータ） (2023-03-30T17:58:36Z)
rSoccer: A Framework for Studying Reinforcement Learning in Small and Very Small Size Robot Soccer [0.0]
本稿では,強化学習実験に最適化されたIEEE Very Small Size SoccerとSmall Size Leagueのオープンソースシミュレータを紹介する。また,単一エージェントおよびマルチエージェントロボットサッカースキルを評価するためのベンチマークタスクのセットを用いて,OpenAI Gym環境を作成するためのフレームワークを提案する。
論文参考訳（メタデータ） (2021-06-15T01:30:21Z)
robo-gym -- An Open Source Toolkit for Distributed Deep Reinforcement Learning on Real and Simulated Robots [0.5161531917413708]
本稿では,ロボットによる深層強化学習を向上するためのオープンソースのツールキット,robo-gymを提案する。シミュレーションにおけるトレーニングからロボットへのシームレスな移動を可能にするシミュレーション環境と実環境の統一的なセットアップを実証する。産業用ロボットを特徴とする2つの実世界アプリケーションを用いて,本フレームワークの能力と有効性を示す。
論文参考訳（メタデータ） (2020-07-06T13:51:33Z)
Real-World Human-Robot Collaborative Reinforcement Learning [6.089774484591287]
本研究では,人間ロボットによる協調型迷路ゲームの現実的な構成について述べる。ロボットエージェントの制御には深層強化学習を用い,実戦30分以内の結果を得た。本研究では,人間とロボットエージェント間の時間的相互政治学習の結果を提示し,各参加者のエージェントがゲームプレイの表現として機能することを示す。
論文参考訳（メタデータ） (2020-03-02T19:34:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。