論文の概要: Variable Stiffness for Robust Locomotion through Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2502.09436v1
- Date: Thu, 13 Feb 2025 16:00:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-14 13:44:50.552874
- Title: Variable Stiffness for Robust Locomotion through Reinforcement Learning
- Title(参考訳): 強化学習によるロバストロコモーションの可変剛性
- Authors: Dario Spoljaric, Yashuai Yan, Dongheui Lee,
- Abstract要約: 本稿では,関節位置とともに動作空間に可変剛性を統合する新しい制御パラダイムを提案する。
脚ごとの剛性(PLS)をグループ化する可変剛性ポリシは,速度トラッキングやプッシュリカバリにおいて,位置ベース制御よりも優れていた。
- 参考スコア(独自算出の注目度): 8.577291729956137
- License:
- Abstract: Reinforcement-learned locomotion enables legged robots to perform highly dynamic motions but often accompanies time-consuming manual tuning of joint stiffness. This paper introduces a novel control paradigm that integrates variable stiffness into the action space alongside joint positions, enabling grouped stiffness control such as per-joint stiffness (PJS), per-leg stiffness (PLS) and hybrid joint-leg stiffness (HJLS). We show that variable stiffness policies, with grouping in per-leg stiffness (PLS), outperform position-based control in velocity tracking and push recovery. In contrast, HJLS excels in energy efficiency. Furthermore, our method showcases robust walking behaviour on diverse outdoor terrains by sim-to-real transfer, although the policy is sorely trained on a flat floor. Our approach simplifies design by eliminating per-joint stiffness tuning while keeping competitive results with various metrics.
- Abstract(参考訳): 強化学習ロコモーションにより、脚のあるロボットは、非常にダイナミックな動作を行うことができるが、しばしば関節の硬さを手作業で調整する時間を要する。
本稿では, 関節位置に沿った動作空間に可変剛性を統合する新しい制御パラダイムを導入し, 関節側剛性(PJS), 脚側剛性(PLS), 関節側剛性(HJLS)などの群状剛性制御を実現する。
脚ごとの剛性(PLS)をグループ化する可変剛性ポリシは,速度トラッキングやプッシュリカバリにおいて,位置ベース制御よりも優れていた。
対照的に、HJLSはエネルギー効率が優れている。
さらに,本手法は,平らな床で厳密に訓練されているにもかかわらず,実地移動による多様な屋外地形における頑健な歩行行動を示す。
提案手法は, 各種測定値との競合性を保ちながら, 接合部ごとの剛性調整をなくし, 設計を単純化する。
関連論文リスト
- Real-time Diverse Motion In-betweening with Space-time Control [4.910937238451485]
本研究では,キネマティックキャラクタのための多種多様な相互動作を生成するためのデータ駆動型フレームワークを提案する。
本手法は,移動動作と非構造動作の両方を合成し,リッチで汎用的で高品質なアニメーション生成を可能にする。
論文 参考訳(メタデータ) (2024-09-30T22:45:53Z) - Subequivariant Reinforcement Learning Framework for Coordinated Motion Control [10.58763656852918]
CoordiGraphは、物理から準同変原理を活用して、強化学習による運動制御の調整を強化する新しいアーキテクチャである。
多様な環境における高度なエージェントによる広範囲な実験を通じて、我々はアプローチのメリットを強調した。
論文 参考訳(メタデータ) (2024-03-22T10:39:22Z) - Differentiable Simulation of Soft Multi-body Systems [99.4302215142673]
我々は、Projective Dynamics内でトップダウン行列アセンブリアルゴリズムを開発する。
筋肉,関節トルク,空気圧管によって駆動される軟口蓋体に対して,異なる制御機構を導出する。
論文 参考訳(メタデータ) (2022-05-03T20:03:22Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z) - Consolidating Kinematic Models to Promote Coordinated Mobile
Manipulations [96.03270112422514]
我々は,移動体ベース,アーム,移動体操作で操作する物体の運動学を統合する仮想キネマティックチェイン(VKC)を構築した。
移動操作タスクは、構築されたVKCの状態を変更して表現され、移動計画問題に変換することができる。
論文 参考訳(メタデータ) (2021-08-03T02:59:41Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - ADD: Analytically Differentiable Dynamics for Multi-Body Systems with
Frictional Contact [26.408218913234872]
剛体および変形可能な物体に対する摩擦接触を処理できる微分可能な動的解法を提案する。
本手法は, 摩擦接触の非平滑な性質に起因した主な困難を回避できる。
論文 参考訳(メタデータ) (2020-07-02T09:51:36Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。