論文の概要: Learning Quadruped Locomotion Policies with Reward Machines
- arxiv url: http://arxiv.org/abs/2107.10969v1
- Date: Fri, 23 Jul 2021 00:37:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 21:54:59.199097
- Title: Learning Quadruped Locomotion Policies with Reward Machines
- Title(参考訳): リワードマシンを用いた四足歩行政策の学習
- Authors: David DeFazio and Shiqi Zhang
- Abstract要約: 本研究では,Reward Machine フレームワーク内での四足歩行学習に,公式形式の人間の知識が適用可能であることを示す。
シミュレーション実験の結果, RMに基づくアプローチにより, 多様な移動スタイルを容易に定義できることが示唆された。
- 参考スコア(独自算出の注目度): 8.10957945489613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legged robots have been shown to be effective in navigating unstructured
environments. Although there has been much success in learning locomotion
policies for quadruped robots, there is little research on how to incorporate
human knowledge to facilitate this learning process. In this paper, we
demonstrate that human knowledge in the form of LTL formulas can be applied to
quadruped locomotion learning within a Reward Machine (RM) framework.
Experimental results in simulation show that our RM-based approach enables
easily defining diverse locomotion styles, and efficiently learning locomotion
policies of the defined styles.
- Abstract(参考訳): 脚のあるロボットは非構造環境の航行に有効であることが示されている。
四足歩行ロボットのロコモーションポリシーの学習は成功したが、この学習プロセスを促進するために人間の知識を組み込む方法についてはほとんど研究されていない。
本稿では,LTL式形式の人間の知識が,リワードマシン(RM)フレームワーク内の4つの移動学習に適用可能であることを実証する。
シミュレーション実験の結果,提案手法は多様なロコモーションスタイルを容易に定義でき,ロコモーションポリシーを効率的に学習できることがわかった。
関連論文リスト
- Gaitor: Learning a Unified Representation Across Gaits for Real-World Quadruped Locomotion [61.01039626207952]
本稿では,移動歩行における乱れと2次元表現を学習するGaitorについて紹介する。
ゲイターの潜伏空間は容易に解釈可能であり、歩行遷移の間、新しい目に見えない歩行が出現することを発見した。
我々は,ANYmal Cプラットフォーム上でのシミュレーションと実世界におけるGaitorの評価を行った。
論文 参考訳(メタデータ) (2024-05-29T19:02:57Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Generalized Animal Imitator: Agile Locomotion with Versatile Motion Prior [14.114972332185044]
本稿では,様々なアジャイルロコモーションタスクを組み込んだ強化学習フレームワークであるVersatile Motion Prior (VIM)を紹介する。
本フレームワークは,動物の動作や手作業による動作を模倣することにより,多様なアジャイルの低レベルスキルを学習することを可能にする。
シミュレーション環境と実環境の両方にまたがるVIMフレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-02T17:59:24Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Legs as Manipulator: Pushing Quadrupedal Agility Beyond Locomotion [34.33972863987201]
我々は四足歩行ロボットを訓練し、前脚を使って壁を登り、ボタンを押し、現実世界でオブジェクトインタラクションを行う。
これらのスキルはカリキュラムを用いてシミュレーションで訓練され,提案したsim2real 変種を用いて実世界へ移行する。
我々は,本手法をシミュレーションと実世界の双方で評価し,短距離および長距離のタスクの実行を成功させたことを示す。
論文 参考訳(メタデータ) (2023-03-20T17:59:58Z) - VIMA: General Robot Manipulation with Multimodal Prompts [82.01214865117637]
ロボット操作タスクの幅広い範囲をマルチモーダルプロンプトで表現できることを示す。
我々は,数千の手続き的に生成されたテーブルトップタスクからなる新しいシミュレーションベンチマークを開発した。
我々は、これらのプロンプトを処理し、自動回帰的に運動動作を出力するトランスフォーマーベースのロボットエージェントVIMAを設計する。
論文 参考訳(メタデータ) (2022-10-06T17:50:11Z) - Learning Free Gait Transition for Quadruped Robots via Phase-Guided
Controller [4.110347671351065]
本稿では,四足歩行ロボットが様々な歩行で操作するための簡単な制御方針を学習するための新しい枠組みを提案する。
中犬サイズの四足歩行ロボットであるBlack Pantherは、自然環境下での速度コマンドを円滑かつ堅牢に追跡しながら、学習したすべてのモータースキルを実行することができる。
論文 参考訳(メタデータ) (2022-01-01T15:15:42Z) - Minimizing Energy Consumption Leads to the Emergence of Gaits in Legged
Robots [71.61319876928009]
実四足歩行ロボットにおいて,エネルギー消費を最小化するための学習が自然移動歩行の出現に重要な役割を担っていることを示す。
創発的な足跡は理想的な地形で構築されており、馬や羊のものと似ている。
同じアプローチは、動物運動制御の発見と一致した荒地における非構造的な歩行につながる。
論文 参考訳(メタデータ) (2021-10-25T17:59:58Z) - Fast and Efficient Locomotion via Learned Gait Transitions [35.86279693549959]
四足歩行ロボットのための効率的な制御器の開発に焦点をあてる。
特徴ある移動経路と自然な歩行遷移が自動的に現れる階層的学習フレームワークを考案する。
学習した階層型コントローラは,ベースラインコントローラよりも広い移動速度でエネルギーを消費することがわかった。
論文 参考訳(メタデータ) (2021-04-09T23:53:28Z) - Robust High-speed Running for Quadruped Robots via Deep Reinforcement
Learning [7.264355680723856]
そこで,本稿では,環境障害にともなうできるだけ速く走行するタスクのために,カルタゴ空間における足場位置の学習について検討する。
他のアクション空間と比較して、より少ない報酬形成、より優れたサンプル効率、ギャロッピングやバウンディングなどの自然歩行の出現を観察する。
公称4倍の質量の100%以上の負荷で荒れた地形の上を走るという困難なタスクであっても、政策はわずか数百万の時間ステップで学ぶことができます。
論文 参考訳(メタデータ) (2021-03-11T06:13:09Z) - Learning Agile Robotic Locomotion Skills by Imitating Animals [72.36395376558984]
動物の多様でアジャイルな運動スキルを再現することは、ロボット工学における長年の課題である。
そこで本研究では,現実世界の動物を模倣することで,足のロボットがアジャイルな運動能力を学ぶことができる模倣学習システムを提案する。
論文 参考訳(メタデータ) (2020-04-02T02:56:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。