論文の概要: Learning Stable Manoeuvres in Quadruped Robots from Expert
Demonstrations
- arxiv url: http://arxiv.org/abs/2007.14290v1
- Date: Tue, 28 Jul 2020 15:02:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 02:11:49.700079
- Title: Learning Stable Manoeuvres in Quadruped Robots from Expert
Demonstrations
- Title(参考訳): エキスパートデモによる四足歩行ロボットの安定動作の学習
- Authors: Sashank Tirumala, Sagar Gubbi, Kartik Paigwar, Aditya Sagi, Ashish
Joglekar, Shalabh Bhatnagar, Ashitava Ghosal, Bharadwaj Amrutur, Shishir
Kolathaya
- Abstract要約: 鍵となる問題は、連続的な標的線速度と角速度の変化する脚軌道を生成することである。
この問題に対処する2つのアプローチを提案する。
我々は、目標速度、半径を計測し、それらを新しいコマンドに変換するニューラルネットワークベースのフィルタを開発した。
- 参考スコア(独自算出の注目度): 3.893720742556156
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the research into development of quadruped robots picking up pace,
learning based techniques are being explored for developing locomotion
controllers for such robots. A key problem is to generate leg trajectories for
continuously varying target linear and angular velocities, in a stable manner.
In this paper, we propose a two pronged approach to address this problem.
First, multiple simpler policies are trained to generate trajectories for a
discrete set of target velocities and turning radius. These policies are then
augmented using a higher level neural network for handling the transition
between the learned trajectories. Specifically, we develop a neural
network-based filter that takes in target velocity, radius and transforms them
into new commands that enable smooth transitions to the new trajectory. This
transformation is achieved by learning from expert demonstrations. An
application of this is the transformation of a novice user's input into an
expert user's input, thereby ensuring stable manoeuvres regardless of the
user's experience. Training our proposed architecture requires much less expert
demonstrations compared to standard neural network architectures. Finally, we
demonstrate experimentally these results in the in-house quadruped Stoch 2.
- Abstract(参考訳): 四足歩行ロボットの開発研究により、学習に基づく技術が研究され、ロボット用ロコモーションコントローラの開発が進められている。
鍵となる問題は、連続的に変化する目標線形および角速度に対する脚軌跡を安定して生成することである。
本稿では,この問題に対処する2つのアプローチを提案する。
まず、複数のより単純なポリシーを訓練し、個別の目標速度と旋回半径の軌道を生成する。
これらのポリシーは、学習した軌跡間の遷移を処理するために、より高いレベルのニューラルネットワークを使用して強化される。
具体的には、ターゲットの速度、半径を計測し、新しい軌道への滑らかな遷移を可能にする新しいコマンドに変換するニューラルネットワークベースのフィルタを開発する。
このトランスフォーメーションは、専門家によるデモンストレーションから学ぶことで達成される。
このアプリケーションは、初心者の入力を専門家の入力に変換することで、ユーザエクスペリエンスに関わらず安定した操作を可能にする。
提案されたアーキテクチャをトレーニングするには、標準的なニューラルネットワークアーキテクチャに比べて、専門家によるデモをはるかに少なくする必要があります。
最後に、これらの結果を社内の四足式ストーチ2で実験的に実証する。
関連論文リスト
- Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Multi-Objective Algorithms for Learning Open-Ended Robotic Problems [1.0124625066746598]
四足歩行は、自動運転車の普及に不可欠な複雑でオープンな問題である。
従来の強化学習アプローチは、トレーニングの不安定性とサンプルの非効率のため、しばしば不足する。
自動カリキュラム学習機構として多目的進化アルゴリズムを活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-11T16:26:42Z) - Lessons from Learning to Spin "Pens" [51.9182692233916]
本研究では,ペンのような物体を回転させる能力を示すことによって,学習に基づく手動操作システムの境界を推し進める。
まず、強化学習を用いて、特権情報でオラクルポリシーを訓練し、シミュレーションにおいて高忠実度軌道データセットを生成する。
次に、これらの実世界の軌道を用いて感覚運動のポリシーを微調整し、実世界の力学に適応させる。
論文 参考訳(メタデータ) (2024-07-26T17:56:01Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Barkour: Benchmarking Animal-level Agility with Quadruped Robots [70.97471756305463]
脚付きロボットのアジリティを定量化するための障害物コースであるBarkourベンチマークを導入する。
犬の機敏性の競争に触発され、様々な障害と時間に基づくスコアリング機構から構成される。
ベンチマークに対処する2つの方法を提案する。
論文 参考訳(メタデータ) (2023-05-24T02:49:43Z) - Learning and Adapting Agile Locomotion Skills by Transferring Experience [71.8926510772552]
本稿では,既存のコントローラから新しいタスクを学習するために経験を移譲することで,複雑なロボティクススキルを訓練するためのフレームワークを提案する。
提案手法は,複雑なアジャイルジャンプ行動の学習,後肢を歩いたまま目標地点への移動,新しい環境への適応を可能にする。
論文 参考訳(メタデータ) (2023-04-19T17:37:54Z) - Learn Fast, Segment Well: Fast Object Segmentation Learning on the iCub
Robot [20.813028212068424]
我々は、新しいオブジェクトや異なるドメインの存在下で、オブジェクトセグメンテーションモデルに適応できる様々な技術について研究する。
データをストリーム化するロボットアプリケーションのための高速なインスタンスセグメンテーション学習のためのパイプラインを提案する。
提案したパイプラインを2つのデータセットでベンチマークし、実際のロボットであるiCubヒューマノイドにデプロイする。
論文 参考訳(メタデータ) (2022-06-27T17:14:04Z) - Rapid Locomotion via Reinforcement Learning [15.373208553045416]
我々はMIT Mini Cheetahで記録的な俊敏性を実現するエンドツーエンドの学習コントローラを提案する。
このシステムは、草、氷、砂利などの自然の地形で速く動き、乱れに強く反応する。
論文 参考訳(メタデータ) (2022-05-05T17:55:11Z) - Generative Adversarial Imitation Learning for End-to-End Autonomous
Driving on Urban Environments [0.8122270502556374]
GAIL(Generative Adversarial Imitation Learning)は、報酬関数を明示的に定義することなくポリシーを訓練することができる。
両モデルとも,訓練終了後に開始から終了まで,専門家の軌道を模倣できることを示す。
論文 参考訳(メタデータ) (2021-10-16T15:04:13Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。