論文の概要: Variable Stiffness for Robust Locomotion through Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2502.09436v2
- Date: Tue, 22 Apr 2025 06:55:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-23 19:51:40.222469
- Title: Variable Stiffness for Robust Locomotion through Reinforcement Learning
- Title(参考訳): 強化学習によるロバストロコモーションの可変剛性
- Authors: Dario Spoljaric, Yashuai Yan, Dongheui Lee,
- Abstract要約: 本稿では,関節位置とともに動作空間に可変剛性を統合する新しい制御パラダイムを提案する。
脚ごとの剛性(PLS)をグループ化する可変剛性ポリシは,速度トラッキングやプッシュリカバリにおいて,位置ベース制御よりも優れていた。
- 参考スコア(独自算出の注目度): 8.577291729956137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement-learned locomotion enables legged robots to perform highly dynamic motions but often accompanies time-consuming manual tuning of joint stiffness. This paper introduces a novel control paradigm that integrates variable stiffness into the action space alongside joint positions, enabling grouped stiffness control such as per-joint stiffness (PJS), per-leg stiffness (PLS) and hybrid joint-leg stiffness (HJLS). We show that variable stiffness policies, with grouping in per-leg stiffness (PLS), outperform position-based control in velocity tracking and push recovery. In contrast, HJLS excels in energy efficiency. Despite the fact that our policy is trained on flat floor only, our method showcases robust walking behaviour on diverse outdoor terrains, indicating robust sim-to-real transfer. Our approach simplifies design by eliminating per-joint stiffness tuning while keeping competitive results with various metrics.
- Abstract(参考訳): 強化学習ロコモーションにより、脚のあるロボットは、非常にダイナミックな動作を行うことができるが、しばしば関節の硬さを手作業で調整する時間を要する。
本稿では, 関節位置に沿った動作空間に可変剛性を統合する新しい制御パラダイムを導入し, 関節側剛性(PJS), 脚側剛性(PLS), 関節側剛性(HJLS)などの群状剛性制御を実現する。
脚ごとの剛性(PLS)をグループ化する可変剛性ポリシは,速度トラッキングやプッシュリカバリにおいて,位置ベース制御よりも優れていた。
対照的に、HJLSはエネルギー効率が優れている。
我々の方針は平らな床でのみ訓練されているにもかかわらず、様々な屋外の地形で頑丈な歩行行動を示し、ロバストなシミュレート・トゥ・リアルな移動を示す。
提案手法は, 各種測定値との競合性を保ちながら, 接合部ごとの剛性調整をなくし, 設計を単純化する。
関連論文リスト
- MULE: Multi-terrain and Unknown Load Adaptation for Effective Quadrupedal Locomotion [1.479858319622657]
四足歩行ロボットは、様々な地形にまたがる荷積み作業にますます利用されている。
本研究では,四足歩行ロボットが様々なペイロードと多様な地形に適応できる適応強化学習フレームワークを提案する。
提案手法はIsaac Gymの大規模シミュレーション実験と,Unitree Go1の4倍体上での実際のハードウェア展開により検証する。
論文 参考訳(メタデータ) (2025-05-01T12:41:35Z) - Coordinating Spinal and Limb Dynamics for Enhanced Sprawling Robot Mobility [0.047116288835793156]
柔軟性のある脊椎は、脊椎に沿って波状の動きを通して身体を揺らぎ、不均一な地形や障害物を航行するのを助ける。
表面の不規則や摩擦の変動といった環境の不確実性は、体-肢の協調を著しく阻害する。
深い強化学習は、非決定論的環境を扱うための有望なフレームワークを提供する。
本研究では,サンショウウオのようなロボットを用いた学習型制御戦略と生物学的にインスパイアされた歩行設計手法について比較検討した。
論文 参考訳(メタデータ) (2025-04-18T23:08:48Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - GainAdaptor: Learning Quadrupedal Locomotion with Dual Actors for Adaptable and Energy-Efficient Walking on Various Terrains [0.8739101659113157]
深部強化学習(DRL)は、課題のある環境で脚のあるロボットを制御する革新的なソリューションとして登場した。
本稿では、地形適応性とエネルギー効率を向上させるために、共同PDゲインを自律的に調整する適応利得制御フレームワークGainAdaptorを提案する。
本手法の有効性を,Unitree Go1ロボットを用いた実験により検証し,様々な地形における移動性能の向上を実証した。
論文 参考訳(メタデータ) (2024-12-12T18:06:22Z) - Deep-Learning Control of Lower-Limb Exoskeletons via simplified Therapist Input [0.0]
部分補助性外骨格は歩行回復に有意な可能性を秘めている。
外骨格における相互作用トルクの制御は階層的な制御構造に依存している。
この研究は、外骨格における階層制御の限界に対処する3段階のデータ駆動型アプローチを提案する。
論文 参考訳(メタデータ) (2024-12-10T22:52:44Z) - Differentiable Simulation of Soft Multi-body Systems [99.4302215142673]
我々は、Projective Dynamics内でトップダウン行列アセンブリアルゴリズムを開発する。
筋肉,関節トルク,空気圧管によって駆動される軟口蓋体に対して,異なる制御機構を導出する。
論文 参考訳(メタデータ) (2022-05-03T20:03:22Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Next Steps: Learning a Disentangled Gait Representation for Versatile
Quadruped Locomotion [69.87112582900363]
現在のプランナーは、ロボットが動いている間、キー歩行パラメータを連続的に変更することはできない。
本研究では、特定の歩行を構成する重要な姿勢位相を捉える潜在空間を学習することにより、この制限に対処する。
本研究では, 歩幅, 歩幅, 立位など, 歩行パラメータに直接対応した駆動信号マップの具体的特性を示す。
論文 参考訳(メタデータ) (2021-12-09T10:02:02Z) - Learning to Jump from Pixels [23.17535989519855]
我々は、高度にアジャイルな視覚的誘導行動の合成法であるDepth-based Impulse Control (DIC)を提案する。
DICは、モデルフリー学習の柔軟性を提供するが、地面反応力の明示的なモデルベース最適化により、振る舞いを規則化する。
提案手法をシミュレーションと実世界の両方で評価する。
論文 参考訳(メタデータ) (2021-10-28T17:53:06Z) - Consolidating Kinematic Models to Promote Coordinated Mobile
Manipulations [96.03270112422514]
我々は,移動体ベース,アーム,移動体操作で操作する物体の運動学を統合する仮想キネマティックチェイン(VKC)を構築した。
移動操作タスクは、構築されたVKCの状態を変更して表現され、移動計画問題に変換することができる。
論文 参考訳(メタデータ) (2021-08-03T02:59:41Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - ADD: Analytically Differentiable Dynamics for Multi-Body Systems with
Frictional Contact [26.408218913234872]
剛体および変形可能な物体に対する摩擦接触を処理できる微分可能な動的解法を提案する。
本手法は, 摩擦接触の非平滑な性質に起因した主な困難を回避できる。
論文 参考訳(メタデータ) (2020-07-02T09:51:36Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。