論文の概要: RoboStriker: Hierarchical Decision-Making for Autonomous Humanoid Boxing
- arxiv url: http://arxiv.org/abs/2601.22517v1
- Date: Fri, 30 Jan 2026 03:51:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.028433
- Title: RoboStriker: Hierarchical Decision-Making for Autonomous Humanoid Boxing
- Title(参考訳): RoboStriker: 自律的ヒューマノイドボクシングのための階層的意思決定
- Authors: Kangning Yin, Zhe Cao, Wentao Dong, Weishuai Zeng, Tianyi Zhang, Qiang Zhang, Jingbo Wang, Jiangmiao Pang, Ming Zhou, Weinan Zhang,
- Abstract要約: RoboStrikerは、完全に自律的なヒューマノイドボクシングを可能にする階層的な3段階のフレームワークである。
このフレームワークは、まず、人間のモーションキャプチャーデータに基づいてシングルエージェントモーショントラッカーをトレーニングすることにより、ボクシングスキルの包括的なレパートリーを学習する。
最終段階では、Latent-Space Neural Fictitious Self-Play (LS-NFSP)を導入する。
- 参考スコア(独自算出の注目度): 43.240817529539356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Achieving human-level competitive intelligence and physical agility in humanoid robots remains a major challenge, particularly in contact-rich and highly dynamic tasks such as boxing. While Multi-Agent Reinforcement Learning (MARL) offers a principled framework for strategic interaction, its direct application to humanoid control is hindered by high-dimensional contact dynamics and the absence of strong physical motion priors. We propose RoboStriker, a hierarchical three-stage framework that enables fully autonomous humanoid boxing by decoupling high-level strategic reasoning from low-level physical execution. The framework first learns a comprehensive repertoire of boxing skills by training a single-agent motion tracker on human motion capture data. These skills are subsequently distilled into a structured latent manifold, regularized by projecting the Gaussian-parameterized distribution onto a unit hypersphere. This topological constraint effectively confines exploration to the subspace of physically plausible motions. In the final stage, we introduce Latent-Space Neural Fictitious Self-Play (LS-NFSP), where competing agents learn competitive tactics by interacting within the latent action space rather than the raw motor space, significantly stabilizing multi-agent training. Experimental results demonstrate that RoboStriker achieves superior competitive performance in simulation and exhibits sim-to-real transfer. Our website is available at RoboStriker.
- Abstract(参考訳): ヒューマノイドロボットにおける人間レベルの競争力と身体的機敏性を達成することは、特にボクシングのような接触に富み、非常にダイナミックなタスクにおいて大きな課題である。
MARL(Multi-Agent Reinforcement Learning)は、戦略的相互作用のための原則的なフレームワークを提供するが、そのヒューマノイド制御への直接的適用は、高次元接触ダイナミクスと強力な物理運動先行の欠如によって妨げられる。
低レベルの物理的実行から高レベルの戦略的推論を分離することで、完全に自律的なヒューマノイドボクシングを可能にする階層的な3段階フレームワークであるRoboStrikerを提案する。
このフレームワークは、まず、人間のモーションキャプチャーデータに基づいてシングルエージェントモーショントラッカーをトレーニングすることにより、ボクシングスキルの包括的なレパートリーを学習する。
これらのスキルはその後、構成された潜在多様体に蒸留され、ガウスパラメータ分布を単位超球面に射影することで正規化される。
このトポロジカル制約は、物理的に可算な運動の部分空間への探索を効果的に制限する。
最終段階では、Latent-Space Neural Fictitious Self-Play (LS-NFSP)を導入する。
実験結果から,RoboStrikerはシミュレーションにおいて優れた競争性能を示し,sim-to-real転送を示す。
私たちのウェブサイトはRoboStrikerで閲覧できます。
関連論文リスト
- Diff-Muscle: Efficient Learning for Musculoskeletal Robotic Table Tennis [21.901628569185515]
筋骨格型ロボット制御アルゴリズムであるDiff-Muscleを提案する。
具体的には、K-MAC(Kinematics-based muscle Actuation Controller)と高次軌道計画を統合した階層型強化学習フレームワークを提案する。
実験の結果,Diff-Muscleは筋肉の活性化を最小限に抑えつつ,成功率において最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2026-03-09T17:00:28Z) - Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - A Kung Fu Athlete Bot That Can Do It All Day: Highly Dynamic, Balance-Challenging Motion Dataset and Autonomous Fall-Resilient Tracking [5.968082051565195]
武道の特徴は、急激な中心シフト、複雑な調整、急激な姿勢転換である。
KungFuAthleteは、プロアスリートの日々のトレーニングビデオから派生した、ハイダイナミックな武道運動データセットである。
本研究では,高ダイナミックなモーショントラッキングとフォールリカバリを共同で学習できる新しいトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2026-02-14T07:49:56Z) - HAIC: Humanoid Agile Object Interaction Control via Dynamics-Aware World Model [56.4392302336014]
本稿では,外部状態推定を伴わない多種多様なオブジェクトダイナミクス間のロバストな相互作用のためのフレームワークであるHAICを提案する。
我々の重要な貢献は、主観的歴史のみから高次対象状態(速度、加速度)を推定するダイナミクス予測器である。
ヒューマノイドロボットの実験では、HAICはアジャイルタスクで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-02-12T09:34:35Z) - Learning Human-Like Badminton Skills for Humanoid Robots [25.27775061243493]
ロボットを「ミミック」から「ストライカー」に進化させるための進歩的強化学習フレームワークを提案する。
提案手法は,人体データに先立って頑健なモータを確立し,それをコンパクトなモデルベース状態表現に蒸留し,逆方向の先立って動的に安定化する。
シミュレーションでは、リフトやドロップショットを含む多様なスキルの習得を通じて、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2026-02-09T08:09:52Z) - Learning Soccer Skills for Humanoid Robots: A Progressive Perception-Action Framework [50.6604971348824]
サッカーはヒューマノイドロボットにとって重要な課題であり、密に統合された知覚アクション機能を必要としている。
本稿では,サッカースキル獲得を3段階に分割するプログレッシブアーキテクチャであるパーセプション・アクション統合意思決定(PAiD)を提案する。
ユニトリーG1の実験では、多種多様な条件下で頑健な性能を持つ高忠実な人間のような蹴りが実証された。
論文 参考訳(メタデータ) (2026-02-05T05:05:03Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。