論文の概要: HierKick: Hierarchical Reinforcement Learning for Vision-Guided Soccer Robot Control
- arxiv url: http://arxiv.org/abs/2603.00948v1
- Date: Sun, 01 Mar 2026 06:41:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.79458
- Title: HierKick: Hierarchical Reinforcement Learning for Vision-Guided Soccer Robot Control
- Title(参考訳): HierKick:視覚誘導型サッカーロボット制御のための階層型強化学習
- Authors: Yizhi Chen, Zheng Zhang, Zhanxiang Cao, Yihe Chen, Shengcheng Fu, Liyun Yan, Yang Zhang, Jiali Liu, Haoyang Li, Yue Gao,
- Abstract要約: 本稿では,デュアル周波数階層RLに基づく視覚誘導型サッカーロボット制御フレームワークを提案する。
このフレームワークは、リアルタイム検出のためにYOLOv8を統合する5Hzのハイレベルポリシーを備えた階層的な制御アーキテクチャを採用している。
実験の結果、このフレームワークの成功率はIsaacGymの95.2%、Mujocoの89.8%、現実世界の80%であることがわかった。
- 参考スコア(独自算出の注目度): 16.609566040900944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Controlling soccer robots involves multi-time-scale decision-making, which requires balancing long-term tactical planning and short-term motion execution. Traditional end-to-end reinforcement learning (RL) methods face challenges in complex dynamic environments. This paper proposes HierKick, a vision-guided soccer robot control framework based on dual-frequency hierarchical RL. The framework adopts a hierarchical control architecture featuring a 5 Hz high-level policy that integrates YOLOv8 for real-time detection and selects tasks via a coach model, and a pre-trained 50 Hz low-level controller for precise joint control. Through this architecture, the framework achieves the four steps of approaching, aligning, dribbling, and kicking. Experimental results show that the success rates of this framework are 95.2\% in IsaacGym, 89.8\% in Mujoco, and 80\% in the real world. HierKick provides an effective hierarchical paradigm for robot control in complex environments, extendable to multi-time-scale tasks, with its modular design and skill reuse offering a new path for intelligent robot control.
- Abstract(参考訳): サッカーロボットの制御には、長期的戦略計画と短期的な動作実行のバランスを必要とする複数段階の意思決定が含まれる。
従来のエンドツーエンド強化学習(RL)手法は複雑な動的環境において課題に直面している。
本稿では,二周波階層RLに基づく視覚誘導型サッカーロボットHierKickを提案する。
このフレームワークは、リアルタイム検出のためにYOLOv8を統合し、コーチモデルを介してタスクを選択する5Hzの高レベルポリシーと、正確な関節制御のための50Hzの低レベルコントローラを備えた階層型制御アーキテクチャを採用している。
このアーキテクチャを通じて、フレームワークは接近、整列、ドリブル、キックの4つのステップを達成する。
実験の結果、このフレームワークの成功率はIsaacGymで95.2\%、Mujocoで89.8\%、現実世界で80%であることがわかった。
HierKickは、複雑な環境でのロボット制御に効果的な階層的パラダイムを提供し、そのモジュール設計とスキル再利用により、インテリジェントなロボット制御のための新しいパスを提供する。
関連論文リスト
- Ctrl-World: A Controllable Generative World Model for Robot Manipulation [53.71061464925014]
汎用ロボットポリシーは、幅広い操作スキルを実行することができる。
未知の物体や命令で 彼らの能力を評価し 改善することは 重要な課題です
世界モデルは、イマジネーション空間内でポリシーの展開を可能にすることで、有望でスケーラブルな代替手段を提供する。
論文 参考訳(メタデータ) (2025-10-11T09:13:10Z) - Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams [18.20205072720915]
完全自律型・分散型四足ロボットサッカーを可能にする階層型マルチエージェント強化学習(MARL)フレームワークを提案する。
第一に、歩行、ドリブル、蹴りなどの足の動きやボール操作のために、非常にダイナミックな低レベルスキルのセットを訓練する。
これらに加えて、高レベルの戦略計画方針は、Fictitious Self-Playを介してマルチエージェント・プロキシ・ポリシー最適化(MAPPO)を用いて訓練される。
論文 参考訳(メタデータ) (2025-05-20T02:20:54Z) - Learning Multi-Agent Loco-Manipulation for Long-Horizon Quadrupedal Pushing [33.689150109924526]
本稿では,複数の四足歩行ロボットによる障害物対応長軸プッシュの課題に取り組む。
階層型多エージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-11T16:27:25Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Creating a Dynamic Quadrupedal Robotic Goalkeeper with Reinforcement
Learning [18.873152528330063]
本稿では,4足歩行ロボットが実世界でサッカーのゴールキーピングタスクを実行できる強化学習(RL)フレームワークを提案する。
四足歩行を用いたサッカーのゴールキーピングは難しい問題であり、非常にダイナミックな移動と、正確で高速な非包括的(ボール)操作を組み合わせたものである。
提案するフレームワークをMini Cheetah四脚ロボットにデプロイし,実世界における高速移動球のアジャイルインターセプションにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-10T04:54:55Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。