論文の概要: CRoSS: A Continual Robotic Simulation Suite for Scalable Reinforcement Learning with High Task Diversity and Realistic Physics Simulation
- arxiv url: http://arxiv.org/abs/2602.04868v1
- Date: Wed, 04 Feb 2026 18:54:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.695863
- Title: CRoSS: A Continual Robotic Simulation Suite for Scalable Reinforcement Learning with High Task Diversity and Realistic Physics Simulation
- Title(参考訳): CRoSS:高タスク多様性とリアル物理シミュレーションによるスケーラブル強化学習のための連続ロボットシミュレーションスイート
- Authors: Yannick Denker, Alexander Gepperth,
- Abstract要約: 継続的な強化学習では、エージェントは以前取得したポリシーを忘れずに一連のタスクから学ぶ必要がある。
本稿では,ガゼボシミュレータで現実的にシミュレーションされたロボットをベースとしたCRLのための新しいベンチマークスイートを提案する。
- 参考スコア(独自算出の注目度): 46.950823663585425
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continual reinforcement learning (CRL) requires agents to learn from a sequence of tasks without forgetting previously acquired policies. In this work, we introduce a novel benchmark suite for CRL based on realistically simulated robots in the Gazebo simulator. Our Continual Robotic Simulation Suite (CRoSS) benchmarks rely on two robotic platforms: a two-wheeled differential-drive robot with lidar, camera and bumper sensor, and a robotic arm with seven joints. The former represent an agent in line-following and object-pushing scenarios, where variation of visual and structural parameters yields a large number of distinct tasks, whereas the latter is used in two goal-reaching scenarios with high-level cartesian hand position control (modeled after the Continual World benchmark), and low-level control based on joint angles. For the robotic arm benchmarks, we provide additional kinematics-only variants that bypass the need for physical simulation (as long as no sensor readings are required), and which can be run two orders of magnitude faster. CRoSS is designed to be easily extensible and enables controlled studies of continual reinforcement learning in robotic settings with high physical realism, and in particular allow the use of almost arbitrary simulated sensors. To ensure reproducibility and ease of use, we provide a containerized setup (Apptainer) that runs out-of-the-box, and report performances of standard RL algorithms, including Deep Q-Networks (DQN) and policy gradient methods. This highlights the suitability as a scalable and reproducible benchmark for CRL research.
- Abstract(参考訳): 継続的強化学習(CRL)では、エージェントは以前取得したポリシーを忘れずに一連のタスクから学習する必要がある。
本研究では,ガゼボシミュレータにおいて,現実的にシミュレーションされたロボットをベースとしたCRLのための新しいベンチマークスイートを提案する。
私たちのCRoSS(Continuous Robotic Simulation Suite)ベンチマークでは、ライダーとカメラとバンパーセンサーを備えた2輪ディファレンシャルドライブロボットと、7つのジョイントを備えたロボットアームの2つのプラットフォームに依存しています。
前者はラインフォローとオブジェクトプッシングのシナリオにおいてエージェントを表しており、視覚的パラメータと構造的パラメータのバリエーションは多数の異なるタスクを生成するが、後者は2つのゴール取得シナリオで、高レベルカルテジアン手の位置制御(Continuous Worldベンチマークをモデルとした)と、関節角度に基づく低レベル制御で使用される。
ロボットアームのベンチマークでは、物理的なシミュレーション(センサーの読み取りが不要な場合)を回避し、2桁の速度で実行できるキネマティクスのみのバリエーションが提供される。
CRoSSは容易に拡張できるように設計されており、高物理リアリズムを持つロボット環境で連続的な強化学習の制御が可能であり、特にほぼ任意のシミュレートされたセンサーの使用が可能である。
再現性と使いやすさを確保するため、コンテナ化されたセットアップ(Apptainer)を提供し、Deep Q-Networks(DQN)やポリシーグラデーションメソッドを含む標準RLアルゴリズムのパフォーマンスを報告する。
これはCRL研究のためのスケーラブルで再現可能なベンチマークとしての適合性を強調している。
関連論文リスト
- Bridging the Sim-to-Real Gap with multipanda ros2: A Real-Time ROS2 Framework for Multimanual Systems [22.26675117934127]
我々はFranka Roboticsロボットのマルチロボット制御のためのオープンソースのROS2アーキテクチャであるmultipanda_ros2$を提示する。
我々のコアコントリビューションは、対話制御やロボット環境モデリングなど、リアルタイムトルク制御における重要な課題に対処する。
論文 参考訳(メタデータ) (2026-02-02T16:11:12Z) - RobotArena $\infty$: Scalable Robot Benchmarking via Real-to-Sim Translation [47.79800816696372]
操作ポリシーの現実的なテストは、大規模に労働集約的で、再現が難しい。
既存のシミュレーションベンチマークも同様に制限されており、同じ合成ドメイン内でポリシーをトレーニングおよびテストしている。
本稿では,VLA評価を大規模にシミュレーションした拡張環境に移行することで,これらの課題を克服する新しいベンチマークフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-27T17:41:38Z) - Robot Control Stack: A Lean Ecosystem for Robot Learning at Scale [11.166320712764465]
VLA(Vision-Language-Action Model)は、専門的なアーキテクチャと専門家ポリシーのタスクに適したコンポーネントを、大規模なデータ収集とセットアップ固有の微調整に置き換える。
従来のロボットソフトウェアフレームワークはボトルネックとなり、ロボットシミュレーションは、実世界の実験への移行を限定的にサポートする。
我々は、大規模なジェネラリストポリシーによるロボット学習の研究を支援するために、ゼロから設計されたリーンエコシステムであるRobot Control Stack (RCS)を紹介した。
論文 参考訳(メタデータ) (2025-09-18T13:12:16Z) - Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation [34.47272224723296]
ロボット,触覚センサ,物体を精度と前例のない速度でモデル化するために,IPCとABDを統合した高性能なシミュレーションプラットフォームであるTaccelを提案する。
並列化が制限されたサブリアルタイム速度で動作する従来のシミュレータとは異なり、Taccelは正確な物理シミュレーションとリアルな触覚信号を提供する。
これらの能力は、触覚ロボットの研究と開発を拡大するための強力なツールとして、Taccelを位置づけている。
論文 参考訳(メタデータ) (2025-04-17T12:57:11Z) - Digital Twin Synchronization: Bridging the Sim-RL Agent to a Real-Time Robotic Additive Manufacturing Control [2.5709786140685633]
この研究は、産業ロボット工学応用のためのソフトアクター・クライトとデジタルツインの統合を推進している。
システムアーキテクチャはUnityのシミュレーション環境とROS2を組み合わせて、シームレスなデジタル双対同期を実現する。
その結果、シミュレートされた環境と物理的環境の両方において、迅速な政策収束と堅牢なタスク実行が示された。
論文 参考訳(メタデータ) (2025-01-29T22:06:53Z) - Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning [24.223788665601678]
2つのxArm6ロボットがU字型組立タスクを、シミュレーションで90%以上、実際のハードウェアで50%の確率で解決する。
以上の結果から,本システムは今後,深部RLおよびSim2Real転送バイマニュアルポリアの研究を刺激していきたいと願っている。
論文 参考訳(メタデータ) (2023-03-27T01:25:24Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Integrated Benchmarking and Design for Reproducible and Accessible
Evaluation of Robotic Agents [61.36681529571202]
本稿では,開発とベンチマークを統合した再現性ロボット研究の新しい概念について述べる。
このセットアップの中心的なコンポーネントの1つはDuckietown Autolabであり、これは比較的低コストで再現可能な標準化されたセットアップである。
本研究では,インフラを用いて実施した実験の再現性を解析し,ロボットのハードウェアや遠隔実験室間でのばらつきが低いことを示す。
論文 参考訳(メタデータ) (2020-09-09T15:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。