論文の概要: SRL: Combining SLIP Model and Reinforcement Learning for Agile Robotic Jumping
- arxiv url: http://arxiv.org/abs/2606.18625v1
- Date: Wed, 17 Jun 2026 02:41:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.97633
- Title: SRL: Combining SLIP Model and Reinforcement Learning for Agile Robotic Jumping
- Title(参考訳): SRL: SLIPモデルと強化学習を組み合わせたアジャイルロボットジャンプ
- Authors: Xiaowen Hu, Linqi Ye, Yudi Zhu, Chenyue Shao, Rankun Li, Qingdu Li, Yan Peng,
- Abstract要約: SLIPに基づくフィードフォワード制御信号とRLによるリアルタイムフィードバックを統合したSpring-loaded Reinforcement Learning (SRL)を提案する。
SRLは様々なタスク要件や環境の複雑さに対して堅牢な適応性を示し、実際の展開の可能性を強調している。
- 参考スコア(独自算出の注目度): 6.344868277741761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic jumping is pivotal in applications such as search and rescue and logistics, where crossing obstacles and enhancing mobility efficiency are critical. The Spring-Loaded Inverted Pendulum (SLIP) model leverages simplified spring-mass dynamics that naturally encode biologically plausible hopping motions, yet its performance degrades on irregular terrain due to idealized assumptions regarding contact and joint dynamics. Meanwhile, Reinforcement Learning (RL) can adapt to diverse and complex environments but often requires extensive data from unguided exploration. The complementary strengths of SLIP's physically grounded baseline and RL's adaptive capabilities motivate a hybrid framework that overcomes these individual limitations. We therefore propose Spring-loaded Reinforcement Learning (SRL), which integrates SLIP-based feedforward control signals with RL-driven real-time feedback, enabling continuous optimization of robotic jumping. Experimental results demonstrate that SRL can achieve more stable jumps with much less training time than the baseline method, maintaining an average position tracking error below 0.1 m and velocity tracking errors within +/-3% of the target values. Through bipedal and quadrupedal simulations of ground and stair jumping, as well as sim-to-sim and sim-to-real validations, SRL exhibits robust adaptability to various task requirements and environmental complexities, underscoring its potential for real-world deployment.
- Abstract(参考訳): ロボットジャンプは、横断障害や移動効率の向上が重要となる探索・救助・物流などの応用において重要である。
Spring-Loaded Inverted Pendulum (SLIP) モデルは、生物学的に可塑性ホッピング運動を自然に符号化する単純化されたスプリング質量力学を利用するが、その性能は接触力学と関節力学に関する理想的な仮定により不規則な地形に低下する。
一方、強化学習(Reinforcement Learning, RL)は多様で複雑な環境に適応できるが、多くの場合、誘導されていない探索から広範なデータを必要とする。
SLIPの物理的基盤とRLの適応能力の相補的な強みは、これらの個々の制限を克服するハイブリッドフレームワークを動機付けている。
そこで我々は,SLIPに基づくフィードフォワード制御信号とRL駆動のリアルタイムフィードバックを統合し,ロボットジャンプの連続的な最適化を可能にするSpring-loaded Reinforcement Learning (SRL)を提案する。
実験の結果,SRLはベースライン法よりもトレーニング時間が少なく,平均位置追尾誤差が0.1m以下であり,目標値の+/-3%以内の速度追尾誤差が維持できることがわかった。
2足歩行と4足歩行のシミュレーション、シム・トゥ・シム・トゥ・シム・トゥ・リアル・バリデーションを通じて、SRLは様々なタスク要件や環境複雑さへの堅牢な適応性を示し、実際の展開の可能性を強調している。
関連論文リスト
- ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning [6.13534373131836]
本稿では,ケーブルサスペンションシステムの自律逆飛行を初めて成功させた,ロバストなRLフレームワークであるASTERについて述べる。
我々は、複雑な軌道を横断する顕著な俊敏性、正確な姿勢アライメント、ロバストなゼロショット・シム・トゥ・リアルトランスファーを示す。
論文 参考訳(メタデータ) (2026-03-11T12:40:29Z) - Scaling Agent Learning via Experience Synthesis [100.42712232390532]
強化学習は、対話を通じて自己改善を行うことで、自律的なエージェントに力を与えることができる。
しかし、コストのかかるロールアウト、タスクの多様性の制限、信頼性の低い報奨信号、インフラストラクチャの複雑さによって、その実践的採用は依然として困難である。
私たちはDreamGymを紹介します。DreamGymはスケーラビリティを念頭において多様なエクスペリエンスを合成するために設計された最初の統合フレームワークです。
論文 参考訳(メタデータ) (2025-11-05T18:58:48Z) - Human-in-the-loop Online Rejection Sampling for Robotic Manipulation [55.99788088622936]
Hi-ORSは、オンライン微調整中に負の報酬を得たサンプルをフィルタリングすることで、値推定を安定化する。
Hi-ORSは、わずか1.5時間でコンタクトリッチな操作をマスターするためのpiベースのポリシーを微調整する。
論文 参考訳(メタデータ) (2025-10-30T11:53:08Z) - RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - Offline Robotic World Model: Learning Robotic Policies without a Physics Simulator [50.191655141020505]
強化学習(Reinforcement Learning, RL)は、ロボット制御において目覚ましい能力を示してきたが、高いサンプルの複雑さ、安全性の懸念、そしてシム・トゥ・リアルのギャップのため、依然として困難である。
物理シミュレータに頼らずに政策学習を改善するために不確実性を明示的に推定するモデルベースアプローチであるオフラインロボット世界モデル(RWM-O)を導入する。
論文 参考訳(メタデータ) (2025-04-23T12:58:15Z) - Multi-fidelity Reinforcement Learning Control for Complex Dynamical Systems [42.2790464348673]
複雑なシステムの不安定性を制御するための多要素強化学習フレームワークを提案する。
提案手法が物理学における2つの複雑な力学に与える影響を実証する。
論文 参考訳(メタデータ) (2025-04-08T00:50:15Z) - CHEQ-ing the Box: Safe Variable Impedance Learning for Robotic Polishing [5.467140383171385]
本研究では, 可変インピーダンスを有するロボット研磨のためのハイブリッドRLアルゴリズムCHEQの実験的検討を行った。
ハードウェア上では、CHEQは効果的な研磨動作を実現し、8時間のトレーニングを必要とせず、5回の障害しか発生しない。
その結果、ハードウェア上で直接訓練された実世界のコンタクトリッチなタスクに対して、適応型ハイブリッドRLの可能性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-01-14T10:13:41Z) - Physics Enhanced Residual Policy Learning (PERPL) for safety cruising in mixed traffic platooning under actuator and communication delay [8.172286651098027]
線形制御モデルは、その単純さ、使いやすさ、安定性解析のサポートにより、車両制御に広範囲に応用されている。
一方、強化学習(RL)モデルは適応性を提供するが、解釈可能性や一般化能力の欠如に悩まされる。
本稿では,物理インフォームドポリシによって強化されたRL制御系の開発を目標とする。
論文 参考訳(メタデータ) (2024-09-23T23:02:34Z) - Grow Your Limits: Continuous Improvement with Real-World RL for Robotic
Locomotion [66.69666636971922]
本稿では,ロボットの学習過程における探索を調節するポリシー正規化フレームワークであるAPRLを提案する。
APRLは四足歩行ロボットを、数分で完全に現実世界を歩けるように効率よく学習する。
論文 参考訳(メタデータ) (2023-10-26T17:51:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。