論文の概要: Teacher Motion Priors: Enhancing Robot Locomotion over Challenging Terrain
- arxiv url: http://arxiv.org/abs/2504.10390v1
- Date: Mon, 14 Apr 2025 16:36:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:49:59.528254
- Title: Teacher Motion Priors: Enhancing Robot Locomotion over Challenging Terrain
- Title(参考訳): 教師の運動に先立ち、ロボットのロコモーションの強化
- Authors: Fangcheng Jin, Yuqi Wang, Peixin Ma, Guodong Yang, Pan Zhao, En Li, Zhengtao Zhang,
- Abstract要約: 本稿では,教師の学生パラダイムに基づく教師事前の枠組みを紹介する。
模倣と補助的なタスク学習を統合し、学習効率と一般化を改善する。
このフレームワークはヒューマノイドロボット上で検証され、動的地形における移動安定性を大幅に向上させる。
- 参考スコア(独自算出の注目度): 6.7297018009524
- License:
- Abstract: Achieving robust locomotion on complex terrains remains a challenge due to high dimensional control and environmental uncertainties. This paper introduces a teacher prior framework based on the teacher student paradigm, integrating imitation and auxiliary task learning to improve learning efficiency and generalization. Unlike traditional paradigms that strongly rely on encoder-based state embeddings, our framework decouples the network design, simplifying the policy network and deployment. A high performance teacher policy is first trained using privileged information to acquire generalizable motion skills. The teacher's motion distribution is transferred to the student policy, which relies only on noisy proprioceptive data, via a generative adversarial mechanism to mitigate performance degradation caused by distributional shifts. Additionally, auxiliary task learning enhances the student policy's feature representation, speeding up convergence and improving adaptability to varying terrains. The framework is validated on a humanoid robot, showing a great improvement in locomotion stability on dynamic terrains and significant reductions in development costs. This work provides a practical solution for deploying robust locomotion strategies in humanoid robots.
- Abstract(参考訳): 複雑な地形における堅牢な移動を達成することは、高次元の制御と環境の不確実性のために依然として困難である。
本稿では,模擬と補助的タスク学習を統合し,学習効率と一般化を向上する,教員のパラダイムに基づく教師事前フレームワークを提案する。
エンコーダベースの状態埋め込みに強く依存する従来のパラダイムとは異なり、私たちのフレームワークはネットワーク設計を分離し、ポリシーネットワークとデプロイメントを簡素化します。
ハイパフォーマンスな教師ポリシーは、まず特権情報を用いて訓練され、一般化可能な運動スキルを取得する。
教師の行動分布は, ノイズの多い主観的データのみに依存する学生政策に伝達され, 分布シフトによる性能劣化を軽減するために, 生成的対向機構を介して伝達される。
さらに、補助的なタスク学習は、生徒の政策の特徴表現を強化し、収束を加速し、様々な地形への適応性を向上させる。
このフレームワークはヒューマノイドロボット上で検証され、動的地形における移動安定性の大幅な向上と開発コストの大幅な削減を示す。
この研究は、ヒューマノイドロボットに堅牢な移動戦略を展開するための実用的なソリューションを提供する。
関連論文リスト
- Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
私たちは世界モデルを学ぶための新しいフレームワークを紹介します。
スケーラブルで堅牢なフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Deep Reinforcement Learning-based Obstacle Avoidance for Robot Movement in Warehouse Environments [6.061908707850057]
本稿では,移動ロボット障害物回避アルゴリズムである倉庫環境に基づく深層強化学習を提案する。
深部強化学習アルゴリズムにおける値関数ネットワークの学習能力不足に対して、歩行者間の相互作用情報を歩行者角度グリッドを介して抽出する。
歩行者の空間行動に基づいて、強化学習の報酬関数を設計し、その角度が過度に変化する状態に対して、ロボットを罰する。
論文 参考訳(メタデータ) (2024-09-23T12:42:35Z) - I-CTRL: Imitation to Control Humanoid Robots Through Constrained Reinforcement Learning [8.97654258232601]
有界残留強化学習(I-CTRL)によるヒューマノイドロボットの制御フレームワークの開発
I-CTRLは5つのロボットにまたがるシンプルでユニークな報酬で、動きの模倣に優れています。
本フレームワークでは,大規模動作データセットを管理するための自動優先度スケジューラを導入している。
論文 参考訳(メタデータ) (2024-05-14T16:12:27Z) - DriveAdapter: Breaking the Coupling Barrier of Perception and Planning
in End-to-End Autonomous Driving [64.57963116462757]
最先端の手法は通常、教師-学生のパラダイムに従う。
学生モデルは、生のセンサーデータのみにアクセスし、教師モデルによって収集されたデータに基づいて行動クローニングを行う。
本稿では,学生(知覚)と教師(計画)モジュール間の機能アライメント目的関数を持つアダプタを用いたDriveAdapterを提案する。
論文 参考訳(メタデータ) (2023-08-01T09:21:53Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - An Adaptable Approach to Learn Realistic Legged Locomotion without
Examples [38.81854337592694]
本研究は,バネ装荷逆振り子モデルを用いて学習プロセスを導くことで,移動における現実性を保証するための汎用的アプローチを提案する。
モデルのない設定であっても、2足歩行ロボットと4足歩行ロボットに対して、学習したポリシーが現実的でエネルギー効率のよい移動歩行を生成できることを示す実験結果を示す。
論文 参考訳(メタデータ) (2021-10-28T10:14:47Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Rapidly Adaptable Legged Robots via Evolutionary Meta-Learning [65.88200578485316]
本稿では,ロボットが動的変化に迅速に適応できるメタ学習手法を提案する。
提案手法は高雑音環境における動的変化への適応性を著しく改善する。
我々は、動的に変化しながら歩くことを学習する四足歩行ロボットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2020-03-02T22:56:27Z) - Learning Whole-body Motor Skills for Humanoids [25.443880385966114]
本稿では,多種多様なプッシュリカバリとバランス行動のための運動スキルを習得するDeep Reinforcement Learningの階層的枠組みを提案する。
この方針は、ロボットモデルの現実的な設定と、学習したスキルを実際のロボットに簡単に伝達できる低レベルのインピーダンス制御を備えた物理シミュレーターで訓練されている。
論文 参考訳(メタデータ) (2020-02-07T19:40:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。