Fugu-MT 論文翻訳(概要): HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning

論文の概要: HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning

arxiv url: http://arxiv.org/abs/2606.08610v1
Date: Sun, 07 Jun 2026 12:49:33 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-09 14:42:06.297386
Title: HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning
Title（参考訳）: エージェントロボット強化学習のためのハーネスフレームワークHARBOR
Authors: Zechu Li, Yufeng Jin, Xiaoyang Liu, Puze Liu, Vignesh Prasad, Carlo D'Eramo, Georgia Chalvatzaki,
Abstract要約: 強化学習(Reinforcement Learning, RL)は、ロボット学習、特にシミュレート・トゥ・リアルな設定において強力なパラダイムとなっているが、アルゴリズムを取り巻くエンジニアリングパイプラインによって広く採用されている。本稿では,ロボットRL自動化をハーネスエンジニアリングの課題とするエージェントフレームワークであるHARBORを紹介する。 HARBORは、シミュレーションRLワークフローをエンドツーエンドで自動化し、報酬を設計し、デフォルトの設定に合わせてアルゴリズムを調整または改善し、実用的なトークンとウォールクロックコストでエンジニアリングの労力を削減することを実証する。
参考スコア（独自算出の注目度）: 21.762004279152674
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Reinforcement learning (RL) has become a powerful paradigm for robot learning, particularly in sim-to-real settings, but its broader adoption remains limited by the engineering pipeline surrounding the algorithms. Building tasks, shaping rewards, and tuning hyperparameters require substantial expert effort, making RL workflows costly and difficult to scale. We introduce HARBOR, an agentic framework that frames robot RL automation as a harness-engineering problem: given a simulator codebase and a task specification, it automates the workflow from environment setup to policy training in simulation. HARBOR decomposes such high-level objectives into bounded stages executed by specialized agents through standardized commands, persistent artifacts, executable gates, and reusable knowledge, and scales iteration via decentralized parallel trials and experience learning across runs. We evaluate HARBOR across 6 benchmarks and 16 tasks in total, spanning manipulation, locomotion, and bimanual dexterous control. We demonstrate that HARBOR automates the simulation RL workflow end-to-end, designs rewards, tunes algorithms to match or improve over default configurations, and reduces engineering effort at practical token and wall-clock cost; the resulting policies can also be transferred to real robots.
Abstract（参考訳）: 強化学習(Reinforcement Learning, RL)は、ロボット学習、特にシミュレート・トゥ・リアルな設定において強力なパラダイムとなっているが、アルゴリズムを取り巻くエンジニアリングパイプラインによって広く採用されている。タスクの構築、報酬形成、ハイパーパラメータのチューニングには相当な専門的な作業が必要で、RLワークフローのコストとスケールが難しくなる。本稿では,ロボットRL自動化をハーネスエンジニアリングの課題とするエージェントフレームワークであるHARBORを紹介した。シミュレータのコードベースとタスク仕様から,環境設定からシミュレーションにおけるポリシートレーニングまで,ワークフローを自動化する。 HARBORは、これらの高レベルな目的を、標準化されたコマンド、永続的なアーティファクト、実行可能ゲート、再利用可能な知識を通じて、特別なエージェントによって実行される有界なステージに分解し、分散並列トライアルと実行時の経験学習を通じてイテレーションをスケールする。 HARBORは6つのベンチマークと16のタスクにまたがって評価され、操作、移動、両手動のデキスタラス制御が可能である。 HARBORは、シミュレーションRLワークフローをエンドツーエンドで自動化し、報酬を設計し、デフォルトの設定に合わせてアルゴリズムを調整し、実用的なトークンやウォールクロックコストでのエンジニアリングの労力を削減する。

論文の概要: HARBOR: A Harness Framework for Agentic Robot Reinforcement Learning

関連論文リスト