論文の概要: Exploiting Ergonomic Priors in Human-to-Robot Task Transfer
- arxiv url: http://arxiv.org/abs/2003.00544v1
- Date: Sun, 1 Mar 2020 18:30:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 13:21:18.591984
- Title: Exploiting Ergonomic Priors in Human-to-Robot Task Transfer
- Title(参考訳): 人間とロボットのタスク伝達におけるエルゴノミクスの先駆者
- Authors: Jeevan Manavalan, Prabhakar Ray, Matthew Howard
- Abstract要約: 制約された動きデータからヌル空間ポリシーを学習するために,実演によるプログラミングに基づく手法を提案する。
本手法の有効性を3リンクシミュレーションと実世界実験で実証した。
シミュレーションされた3DoFロボットマニピュレータ制御問題において,この手法は最先端のアプローチよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 3.60953887026184
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, there has been a booming shift in the development of
versatile, autonomous robots by introducing means to intuitively teach robots
task-oriented behaviour by demonstration. In this paper, a method based on
programming by demonstration is proposed to learn null space policies from
constrained motion data. The main advantage to using this is generalisation of
a task by retargeting a systems redundancy as well as the capability to fully
replace an entire system with another of varying link number and lengths while
still accurately repeating a task subject to the same constraints. The
effectiveness of the method has been demonstrated in a 3-link simulation and a
real world experiment using a human subject as the demonstrator and is verified
through task reproduction on a 7DoF physical robot. In simulation, the method
works accurately with even as little as five data points producing errors less
than 10^-14. The approach is shown to outperform the current state-of-the-art
approach in a simulated 3DoF robot manipulator control problem where motions
are reproduced using learnt constraints. Retargeting of a systems null space
component is also demonstrated in a task where controlling how redundancy is
resolved allows for obstacle avoidance. Finally, the approach is verified in a
real world experiment using demonstrations from a human subject where the
learnt task space trajectory is transferred onto a 7DoF physical robot of a
different embodiment.
- Abstract(参考訳): 近年,ロボットによるタスク指向動作を直感的に教える手法を導入することで,多目的自律型ロボットの開発が急激な変化を遂げている。
本稿では,制約付き動きデータからヌル空間ポリシーを学習するために,実演によるプログラミングに基づく手法を提案する。
これを使用する主な利点は、システムの冗長性を再ターゲティングすることによるタスクの一般化と、システム全体を異なるリンク数と長さで完全に置き換えると同時に、同じ制約を受けるタスクを正確に繰り返す能力である。
本手法の有効性は,3リンクシミュレーションと実世界実験で実証され,実物ロボットのタスク再現により検証されている。
シミュレーションでは、10^-14未満の誤差を生み出す5つのデータポイントでも正確に動作する。
本手法は,学習制約を用いて動作を再現するシミュレーション3DoFロボットマニピュレータ制御問題において,最先端のアプローチよりも優れていることを示す。
システムのヌル空間コンポーネントの再ターゲティングも、冗長性の解決方法を制御するタスクにおいて、障害物回避を可能にする。
最後に、このアプローチは、異なる実施形態の7dofの物理的ロボットに学習されたタスク空間の軌道を転送する人間の被験者による実世界実験で検証される。
関連論文リスト
- Zero-Cost Whole-Body Teleoperation for Mobile Manipulation [8.71539730969424]
MoMa-Teleopは、ベースモーションを強化学習エージェントに委譲する新しい遠隔操作手法である。
提案手法は,様々なロボットやタスクに対して,タスク完了時間が大幅に短縮されることを実証する。
論文 参考訳(メタデータ) (2024-09-23T15:09:45Z) - Unsupervised Learning of Effective Actions in Robotics [0.9374652839580183]
ロボット工学における現在の最先端のアクション表現は、ロボットのアクションに対する適切な効果駆動学習を欠いている。
連続運動空間の離散化と「アクションプロトタイプ」生成のための教師なしアルゴリズムを提案する。
シミュレーションされた階段登上補強学習課題について,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-04-03T13:28:52Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Learning Bipedal Robot Locomotion from Human Movement [0.791553652441325]
本研究では、実世界の二足歩行ロボットに、モーションキャプチャーデータから直接の動きを教えるための強化学習に基づく手法を提案する。
本手法は,シミュレーション環境下でのトレーニングから,物理ロボット上での実行へシームレスに移行する。
本研究では,ダイナミックウォークサイクルから複雑なバランスや手振りに至るまでの動作を内製したヒューマノイドロボットについて実演する。
論文 参考訳(メタデータ) (2021-05-26T00:49:37Z) - Coarse-to-Fine Imitation Learning: Robot Manipulation from a Single
Demonstration [8.57914821832517]
視覚的模倣学習のためのシンプルな新しい手法を導入し,新しいロボット操作タスクを1人の人間による実演から学習できるようにする。
提案手法は、状態推定問題として模倣学習をモデル化し、状態がエンドエフェクタのポーズとして定義される。
テスト時、エンドエフェクタは線形経路を通って推定状態に移動し、元のデモのエンドエフェクタ速度を単に再生する。
論文 参考訳(メタデータ) (2021-05-13T16:36:55Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Low Dimensional State Representation Learning with Reward-shaped Priors [7.211095654886105]
本研究では,観測結果から低次元状態空間への写像の学習を目的とした手法を提案する。
このマッピングは、環境とタスクの事前知識を組み込むために形作られた損失関数を用いて教師なしの学習で学習される。
本手法は,シミュレーション環境における移動ロボットナビゲーションタスクおよび実ロボット上でのテストを行う。
論文 参考訳(メタデータ) (2020-07-29T13:00:39Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。