論文の概要: RoboNaldo: Accurate, Stable and Powerful Humanoid Soccer Shooting via Motion-Guided Curriculum Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.11092v3
- Date: Thu, 11 Jun 2026 16:22:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.326686
- Title: RoboNaldo: Accurate, Stable and Powerful Humanoid Soccer Shooting via Motion-Guided Curriculum Reinforcement Learning
- Title(参考訳): RoboNaldo:Motion-Guided Curriculum Reinforcement Learningによる高精度で安定的で強力なヒューマノイドサッカーシューティング
- Authors: Yichao Zhong, Yidan Lu, Yuhang Lu, Tianyang Tang, Haoguang Mai, Yixuan Pan, Tianyu Li, Li Chen, Jingbo Wang, Zhongyu Li, Peng Lu, Hongyang Li,
- Abstract要約: エリートヒューマノイドサッカーシューティングは、全身の安定性、高インパルスの全身の相互作用、ターゲットへの精度を必要とする。
高速なヒューマノイドインタラクションのための運動誘導型カリキュラムフレームワークであるRoboNaldoを紹介する。
シミュレーションでは、RoboNaldoは48.6%低いフリーキックショットエラーと2.96倍の撮影速度を示した。
- 参考スコア(独自算出の注目度): 29.003533673238135
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Elite humanoid soccer shooting requires whole-body stability, high-impulse whole-body interactions, and accuracy to targets. Motion tracking-driven reinforcement learning (RL) provides stability in whole-body movement coordination, but a fixed reference makes it hard to adapt to varied ball positions and strike timings; in contrast, task reward-driven RL struggles to explore and discover valid kicks from scratch. We therefore introduce RoboNaldo, a three-stage motion-guided curriculum RL framework for high-impulse humanoid interaction. A single human-kick reference is used as a scaffold and progressively shifts optimization towards shooting performance. The curriculum first learns a stable whole-body kicking prior, then adapts the kick to free-kick settings where the ball is stationary at random positions, and finally extends it to moving-ball shooting through a locomotion-command and kick-trigger interface. A high-level heuristic planner controls this interface during training, while alternative high-level controllers can drive the same low-level policy at inference. In simulation, RoboNaldo demonstrates free-kick shot error 48.6% lower and shoot velocity 2.96x than prior work baselines. In real world on a Unitree G1 with onboard perception, RoboNaldo attains 0.73 m and 0.86 m average target shooting error from 3 m away in free-kick and moving-ball cases, accordingly. And the post-contact ball velocity reaches 13.10 m/s, which is 59-71% of reported professional open-play shot speed. Project page: https://opendrivelab.com/RoboNaldo.
- Abstract(参考訳): エリートヒューマノイドサッカーシューティングは、全身の安定性、高インパルスの全身の相互作用、ターゲットへの精度を必要とする。
モーショントラッキング駆動強化学習(RL)は、全身運動調整の安定性を提供するが、固定基準により、ボールの位置や打球タイミングへの適応が難しくなり、対照的にタスク報酬駆動RLは、スクラッチから有効なキックを探索し発見するのに苦労する。
そこで我々は,高インパルスヒューマノイド相互作用のための3段階運動誘導型カリキュラムRLフレームワークRoboNaldoを紹介した。
単一のヒューマンキック参照が足場として使用され、徐々に最適化をシューティングパフォーマンスにシフトさせる。
カリキュラムはまず、前もって安定した全身蹴りを学習し、その後、ボールがランダムな位置に静止しているフリーキック設定にキックを適応し、最後に、移動式シューティングに移動式コマンドとキックトリガーインターフェースで拡張する。
高レベルのヒューリスティックプランナーがトレーニング中にこのインターフェースを制御し、代替の高レベルのコントローラが推論時に同じ低レベルのポリシーを駆動する。
シミュレーションでは、RoboNaldoは48.6%低いフリーキックショットエラーと2.96倍の撮影速度を示した。
実際のUnitree G1での知覚では、RoboNaldoは3m離れたフリーキックと移動ボールのケースから平均0.73mと0.86mの目標射撃誤差を達成している。
そして、接触後のボール速度は13.10m/sに達し、これはプロのオープンプレイショットの59-71%である。
プロジェクトページ: https://opendrivelab.com/RoboNaldo.com
関連論文リスト
- Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - Learning Soccer Skills for Humanoid Robots: A Progressive Perception-Action Framework [50.6604971348824]
サッカーはヒューマノイドロボットにとって重要な課題であり、密に統合された知覚アクション機能を必要としている。
本稿では,サッカースキル獲得を3段階に分割するプログレッシブアーキテクチャであるパーセプション・アクション統合意思決定(PAiD)を提案する。
ユニトリーG1の実験では、多種多様な条件下で頑健な性能を持つ高忠実な人間のような蹴りが実証された。
論文 参考訳(メタデータ) (2026-02-05T05:05:03Z) - Learning Agile Striker Skills for Humanoid Soccer Robots from Noisy Sensory Input [28.158114356214863]
本稿では,ヒューマノイドロボットが頑健な連続的球技の実行を可能にする強化学習システムを提案する。
このシステムは典型的な教師教育の枠組みを拡張している。
鍵となる設計要素は、シム・トゥ・リアルギャップを閉じ、知覚の不確実性の下で性能を維持するために重要である。
論文 参考訳(メタデータ) (2025-12-06T21:27:50Z) - Learning Sim-to-Real Humanoid Locomotion in 15 Minutes [51.500643119683225]
本稿では,FastSACとFastTD3という,非政治的RLアルゴリズムに基づくシンプルで実用的なレシピを提案する。
我々の単純なレシピは、何千もの並列環境において、政治外のRLアルゴリズムを大規模に安定化させる。
我々は,Unitree G1 と Booster T1 ロボット上でのヒューマノイド移動制御器のエンドツーエンドの迅速な学習を実演する。
論文 参考訳(メタデータ) (2025-12-01T18:55:17Z) - Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning [26.13655448415553]
Deep Reinforcement Learning (Deep RL)は、低コストでミニチュアなヒューマノイドロボットのための洗練された安全な運動スキルを合成することができる。
我々はDeep RLを使って、20個の関節を持つヒューマノイドロボットを訓練し、1対1(1v1)のサッカーゲームを単純化した。
結果として得られるエージェントは、急激な転倒回復、歩行、回転、蹴りなど、堅牢でダイナミックな動きのスキルを示す。
論文 参考訳(メタデータ) (2023-04-26T16:25:54Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。