論文の概要: Diff-Muscle: Efficient Learning for Musculoskeletal Robotic Table Tennis
- arxiv url: http://arxiv.org/abs/2603.08617v1
- Date: Mon, 09 Mar 2026 17:00:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.117077
- Title: Diff-Muscle: Efficient Learning for Musculoskeletal Robotic Table Tennis
- Title(参考訳): Diff-Muscle: 筋骨格型ロボットテーブルテニスの学習
- Authors: Wentao Zhao, Jun Guo, Kangyao Huang, Xin Liu, Huaping Liu,
- Abstract要約: 筋骨格型ロボット制御アルゴリズムであるDiff-Muscleを提案する。
具体的には、K-MAC(Kinematics-based muscle Actuation Controller)と高次軌道計画を統合した階層型強化学習フレームワークを提案する。
実験の結果,Diff-Muscleは筋肉の活性化を最小限に抑えつつ,成功率において最先端のベースラインを著しく上回ることがわかった。
- 参考スコア(独自算出の注目度): 21.901628569185515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Musculoskeletal robots provide superior advantages in flexibility and dexterity, positioning them as a promising frontier towards embodied intelligence. However, current research is largely confined to relative simple tasks, restricting the exploration of their full potential in multi-segment coordination. Furthermore, efficient learning remains a challenge, primarily due to the high-dimensional action space and inherent overactuated structures. To address these challenges, we propose Diff-Muscle, a musculoskeletal robot control algorithm that leverages differential flatness to reformulate policy learning from the redundant muscle-activation space into a significantly lower-dimensional joint space. Furthermore, we utilize the highly dynamic robotic table tennis task to evaluate our algorithm. Specifically, we propose a hierarchical reinforcement learning framework that integrates a Kinematics-based Muscle Actuation Controller (K-MAC) with high-level trajectory planning, enabling a musculoskeletal robot to perform dexterous and precise rallies. Experimental results demonstrate that Diff-Muscle significantly outperforms state-of-the-art baselines in success rates while maintaining minimal muscle activation. Notably, the proposed framework successfully enables the musculoskeletal robots to achieve continuous rallies in a challenging dual-robot setting.
- Abstract(参考訳): 筋骨格ロボットは、柔軟性と器質性において優れた優位性を提供し、それらをエンボディドインテリジェンスへの有望なフロンティアとして位置づけている。
しかし、現在の研究は比較的単純なタスクに限られており、多セグメント協調におけるその潜在能力の探索が制限されている。
さらに、効率的な学習は、主に高次元の行動空間と固有の過剰な構造のために、依然として課題である。
これらの課題に対処するため,筋骨格型ロボット制御アルゴリズムであるDiff-Muscleを提案する。
さらに,高ダイナミックなテーブルテニスタスクを用いて,アルゴリズムの評価を行った。
具体的には、キネマティクスをベースとした筋運動制御(K-MAC)と高レベルの軌道計画を統合する階層的強化学習フレームワークを提案する。
実験の結果,Diff-Muscleは筋肉の活性化を最小限に抑えつつ,成功率において最先端のベースラインを著しく上回ることがわかった。
提案手法により, 筋骨格ロボットは, 挑戦的なデュアルロボット設定において, 連続的なラリーを達成できる。
関連論文リスト
- Perceptive Humanoid Parkour: Chaining Dynamic Human Skills via Motion Matching [77.28042137892943]
本稿では,人間型ロボットの長期的視覚的パーキングを自律的に行うためのモジュール型フレームワークであるPerceptive Humanoid Parkour(PHP)を提案する。
本研究は、これらの合成動作に対する運動追跡強化学習専門家の政策を訓練し、それらを深度に基づく多スキル学生政策に抽出する。
我々は,Unitree G1ヒューマノイドロボットを用いた実世界実験により,我々のフレームワークを検証した。
論文 参考訳(メタデータ) (2026-02-17T18:59:11Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.26816599309778]
動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文 参考訳(メタデータ) (2025-02-24T14:53:45Z) - Learning Diverse Robot Striking Motions with Diffusion Models and Kinematically Constrained Gradient Guidance [0.3613661942047476]
私たちは、オフラインで制約付きで、多様なアジャイルの振る舞いを表現する、新しい拡散モデリングアプローチを開発しています。
エアホッケーとリアル卓球の2つの課題領域において, KCGG を評価することで, 時間クリティカルなロボット作業に対するアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2024-09-23T20:26:51Z) - Bridging the gap between Learning-to-plan, Motion Primitives and Safe Reinforcement Learning [20.158498233576143]
キノダイナミック制約の下での軌道計画は、高度なロボティクス応用の基礎となる。
キノダイナミックプランニングの最近の進歩は、複雑な制約の下で複雑な動きを学習・計画技術が生成できることを実証している。
本稿では,学習から計画までの手法と強化学習を組み合わせることで,動作プリミティブのブラックボックス学習と最適化の新たな統合を実現する。
論文 参考訳(メタデータ) (2024-08-26T07:44:53Z) - I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning [8.97654258232601]
有界残留強化学習(I-CTRL)によるヒューマノイドロボットの制御フレームワークの開発
I-CTRLは5つのロボットにまたがるシンプルでユニークな報酬で、動きの模倣に優れています。
本フレームワークでは,大規模動作データセットを管理するための自動優先度スケジューラを導入している。
論文 参考訳(メタデータ) (2024-05-14T16:12:27Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Learning with Muscles: Benefits for Data-Efficiency and Robustness in
Anthropomorphic Tasks [13.545245521356218]
人間は、さまざまな動作において、堅牢性、汎用性、新しいタスクの学習という点でロボットより優れています。
我々は、高非線形筋力は、学習に好適な固有の安定性を提供する上で大きな役割を果たすと仮定する。
論文 参考訳(メタデータ) (2022-07-08T15:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。