論文の概要: Learning Agile Striker Skills for Humanoid Soccer Robots from Noisy Sensory Input
- arxiv url: http://arxiv.org/abs/2512.06571v2
- Date: Wed, 10 Dec 2025 21:53:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.174994
- Title: Learning Agile Striker Skills for Humanoid Soccer Robots from Noisy Sensory Input
- Title(参考訳): ノイズセンサー入力によるヒューマノイドサッカーロボットのアジャイルストライカースキルの学習
- Authors: Zifan Xu, Myoungkyu Seo, Dongmyeong Lee, Hao Fu, Jiaheng Hu, Jiaxun Cui, Yuqian Jiang, Zhihan Wang, Anastasiia Brund, Joydeep Biswas, Peter Stone,
- Abstract要約: 本稿では,ヒューマノイドロボットが頑健な連続的球技の実行を可能にする強化学習システムを提案する。
このシステムは典型的な教師教育の枠組みを拡張している。
鍵となる設計要素は、シム・トゥ・リアルギャップを閉じ、知覚の不確実性の下で性能を維持するために重要である。
- 参考スコア(独自算出の注目度): 28.158114356214863
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning fast and robust ball-kicking skills is a critical capability for humanoid soccer robots, yet it remains a challenging problem due to the need for rapid leg swings, postural stability on a single support foot, and robustness under noisy sensory input and external perturbations (e.g., opponents). This paper presents a reinforcement learning (RL)-based system that enables humanoid robots to execute robust continual ball-kicking with adaptability to different ball-goal configurations. The system extends a typical teacher-student training framework -- in which a "teacher" policy is trained with ground truth state information and the "student" learns to mimic it with noisy, imperfect sensing -- by including four training stages: (1) long-distance ball chasing (teacher); (2) directional kicking (teacher); (3) teacher policy distillation (student); and (4) student adaptation and refinement (student). Key design elements -- including tailored reward functions, realistic noise modeling, and online constrained RL for adaptation and refinement -- are critical for closing the sim-to-real gap and sustaining performance under perceptual uncertainty. Extensive evaluations in both simulation and on a real robot demonstrate strong kicking accuracy and goal-scoring success across diverse ball-goal configurations. Ablation studies further highlight the necessity of the constrained RL, noise modeling, and the adaptation stage. This work presents a system for learning robust continual humanoid ball-kicking under imperfect perception, establishing a benchmark task for visuomotor skill learning in humanoid whole-body control.
- Abstract(参考訳): 高速でロバストなボールキック技術を学ぶことは、ヒューマノイドサッカーロボットにとって重要な能力であるが、急速脚スイング、単一支持脚での姿勢安定性、ノイズの多い感覚入力と外的摂動(例えば、相手)下での頑丈さなど、依然として困難な問題である。
本稿では,人間型ロボットが多種多様なボールゴール構成に適応して頑健な連続的なボールキックを実行することができる強化学習(RL)システムを提案する。
このシステムは、(1)長距離球追跡(Teacher)、(2)方向蹴(Teacher)、(3)教師政策の蒸留(Student)、(4)学生適応と洗練(student)の4つの訓練段階を含む、典型的な教師学生訓練フレームワークを拡張している。
調整された報酬関数、現実的なノイズモデリング、適応と改善のためのオンライン制約付きRLなど、重要なデザイン要素は、シモン・トゥ・リアルのギャップを閉じ、知覚的不確実性の下でパフォーマンスを維持するために重要である。
シミュレーションおよび実ロボットにおける広範囲な評価は、多種多様なボールゴール構成における強力な蹴り精度とゴールスコア化の成功を示す。
アブレーション研究は、制約付きRL、ノイズモデリング、適応段階の必要性をさらに強調している。
本研究は, ヒューマノイド全体制御において, 不完全知覚下で頑健な連続的ヒューマノイドボールキッキングを学習するシステムを構築し, バイスモータスキル学習のためのベンチマークタスクを構築した。
関連論文リスト
- Learning Soccer Skills for Humanoid Robots: A Progressive Perception-Action Framework [50.6604971348824]
サッカーはヒューマノイドロボットにとって重要な課題であり、密に統合された知覚アクション機能を必要としている。
本稿では,サッカースキル獲得を3段階に分割するプログレッシブアーキテクチャであるパーセプション・アクション統合意思決定(PAiD)を提案する。
ユニトリーG1の実験では、多種多様な条件下で頑健な性能を持つ高忠実な人間のような蹴りが実証された。
論文 参考訳(メタデータ) (2026-02-05T05:05:03Z) - KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills [58.73043119128804]
そこで本研究では,Kungfuやダンスなどの人体動作を高度に制御することを目的とした,物理学に基づくヒューマノイド制御フレームワークを提案する。
動作処理では,運動の抽出,フィルタリング,修正,再ターゲティングを行うパイプラインを設計し,物理的制約の遵守を確実にする。
動作模倣では、二段階最適化問題を定式化し、追従精度の許容度を動的に調整する。
実験では,高ダイナミックな動作のセットを模倣するために全身制御ポリシーを訓練する。
論文 参考訳(メタデータ) (2025-06-15T13:58:53Z) - HuB: Learning Extreme Humanoid Balance [21.986188490182993]
Humanoid Balance(ヒューマノイドバランス)は,参照運動の洗練,バランス対応政策学習,シミュレート・トゥ・リアルトレーニングを統合した統合フレームワークである。
準静的バランスタスクにおけるUnitree G1ヒューマノイドロボットのアプローチを検証する。
論文 参考訳(メタデータ) (2025-05-12T07:31:42Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Robotic Table Tennis: A Case Study into a High Speed Learning System [30.30242337602385]
本研究では,人間と数百の卓球アライグが可能な実世界のロボット学習システムを提案する。
本システムは,高度に最適化された知覚サブシステム,高速低遅延ロボットコントローラ,現実世界の損傷を防ぐシミュレーションパラダイムを組み込んだ。
論文 参考訳(メタデータ) (2023-09-06T18:56:20Z) - Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning [26.13655448415553]
Deep Reinforcement Learning (Deep RL)は、低コストでミニチュアなヒューマノイドロボットのための洗練された安全な運動スキルを合成することができる。
我々はDeep RLを使って、20個の関節を持つヒューマノイドロボットを訓練し、1対1(1v1)のサッカーゲームを単純化した。
結果として得られるエージェントは、急激な転倒回復、歩行、回転、蹴りなど、堅牢でダイナミックな動きのスキルを示す。
論文 参考訳(メタデータ) (2023-04-26T16:25:54Z) - Hierarchical Reinforcement Learning for Precise Soccer Shooting Skills
using a Quadrupedal Robot [76.04391023228081]
本研究では,四足歩行ロボットが実世界において,強化学習を用いて精度の高い射撃技術を実現できるという課題に対処する。
本研究では, 深層強化学習を活用して頑健な動作制御政策を訓練する階層的枠組みを提案する。
提案するフレームワークをA1四足歩行ロボットに展開し、実世界のランダムなターゲットに向けて正確にボールを発射できるようにする。
論文 参考訳(メタデータ) (2022-08-01T22:34:51Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - Learning to Play Table Tennis From Scratch using Muscular Robots [34.34824536814943]
この研究は、(a)人為的ロボットアームを用いた安全クリティカルな動的タスクを初めて学習し、(b)PAM駆動システムで精度の高い要求問題を学び、(c)本物のボールなしで卓球をするようにロボットを訓練する。
ビデオとデータセットは muscleTT.embodied.ml で入手できる。
論文 参考訳(メタデータ) (2020-06-10T16:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。