論文の概要: AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control
- arxiv url: http://arxiv.org/abs/2503.21401v1
- Date: Thu, 27 Mar 2025 11:47:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:50:51.354975
- Title: AcL: Action Learner for Fault-Tolerant Quadruped Locomotion Control
- Title(参考訳): AcL:フォールトトレラント四足歩行制御のための動作学習装置
- Authors: Tianyu Xu, Yaoyu Cheng, Pinxi Shen, Lin Zhao, Electrical, Computer Engineering, National University of Singapore, Singapore, Mechanical Engineering, National University of Singapore, Singapore,
- Abstract要約: Action Learner (AcL) は、教師による新しい強化学習フレームワークである。
AcLにより、四足歩行者は、複数の関節断層の下での安定した歩行に自律的に歩行を適応することができる。
我々は,単関節および二重関節の故障下で,実際のGo2四足歩行ロボット上でAcLを検証する。
- 参考スコア(独自算出の注目度): 4.631835206629522
- License:
- Abstract: Quadrupedal robots can learn versatile locomotion skills but remain vulnerable when one or more joints lose power. In contrast, dogs and cats can adopt limping gaits when injured, demonstrating their remarkable ability to adapt to physical conditions. Inspired by such adaptability, this paper presents Action Learner (AcL), a novel teacher-student reinforcement learning framework that enables quadrupeds to autonomously adapt their gait for stable walking under multiple joint faults. Unlike conventional teacher-student approaches that enforce strict imitation, AcL leverages teacher policies to generate style rewards, guiding the student policy without requiring precise replication. We train multiple teacher policies, each corresponding to a different fault condition, and subsequently distill them into a single student policy with an encoder-decoder architecture. While prior works primarily address single-joint faults, AcL enables quadrupeds to walk with up to four faulty joints across one or two legs, autonomously switching between different limping gaits when faults occur. We validate AcL on a real Go2 quadruped robot under single- and double-joint faults, demonstrating fault-tolerant, stable walking, smooth gait transitions between normal and lamb gaits, and robustness against external disturbances.
- Abstract(参考訳): 四足歩行ロボットは、万能な移動技術を学ぶことができるが、1つ以上の関節が力を失うと弱いままである。
対照的に、犬や猫は怪我をするときにライピング・ゲイトを取り入れ、体調に適応する能力を示す。
このような適応性に触発されて,四足歩行を自律的に安定歩行に適応させる新しい教師学生強化学習フレームワークであるAcL(Action Learner)を提案する。
厳密な模倣を強制する従来の教師学生のアプローチとは異なり、AcLは教師のポリシーを活用して、正確な複製を必要とせず、生徒の政策を指導する。
我々は,異なる障害条件に対応する複数の教師ポリシーを訓練し,それをエンコーダ・デコーダアーキテクチャで単一学生ポリシーに抽出する。
それまでの作業は主に単関節の障害に対処するが、AcLは四足歩行を最大4本の障害のある関節で1本または2本足で歩けるようにし、障害発生時に異なる歩行歩行を自律的に切り替える。
単関節および二重関節の障害下での実際のGo2四足歩行ロボット上でのAcLの有効性を検証し,耐故障性,歩行安定性,正常歩行と子羊歩行のスムーズな歩行遷移,外乱に対する堅牢性を示した。
関連論文リスト
- Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [88.06408322210025]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Safe Reinforcement Learning for Legged Locomotion [18.57681606310315]
本研究では,ロボットが安全でない状態に入るのを防ぐ安全回復政策と,タスクを完了させるために最適化された学習者ポリシーとを切り替える安全な強化学習フレームワークを提案する。
シミュレーションおよび実四足歩行ロボットを用いた4つの移動作業において,提案手法を検証した。
提案手法は, シミュレーションにおける基準法よりも48.6%減少し, 同等あるいは優れた報奨が得られている。
論文 参考訳(メタデータ) (2022-03-05T01:49:16Z) - Learning Free Gait Transition for Quadruped Robots via Phase-Guided
Controller [4.110347671351065]
本稿では,四足歩行ロボットが様々な歩行で操作するための簡単な制御方針を学習するための新しい枠組みを提案する。
中犬サイズの四足歩行ロボットであるBlack Pantherは、自然環境下での速度コマンドを円滑かつ堅牢に追跡しながら、学習したすべてのモータースキルを実行することができる。
論文 参考訳(メタデータ) (2022-01-01T15:15:42Z) - Learning Quadruped Locomotion Policies using Logical Rules [2.008081703108095]
四足歩行ロボットの歩行仕様と効率的なポリシー学習を実現することを目的としている。
我々の手法はRM-based Locomotion Learning (RMLL)と呼ばれ、実行時の歩行周波数の調整をサポートする。
実際の四足歩行ロボットを用いて,これらの学習方針を実証する。
論文 参考訳(メタデータ) (2021-07-23T00:37:32Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Bridging the Imitation Gap by Adaptive Insubordination [88.35564081175642]
教官が特権情報にアクセスして意思決定を行う場合、この情報は模倣学習中に疎外されることを示す。
本稿では,このギャップに対処するため,適応的不規則化(ADVISOR)を提案する。
ADVISORは、トレーニング中の模倣と報酬に基づく強化学習損失を動的に重み付け、模倣と探索をオンザフライで切り替えることを可能にする。
論文 参考訳(メタデータ) (2020-07-23T17:59:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。