論文の概要: Robot Program Parameter Inference via Differentiable Shadow Program
Inversion
- arxiv url: http://arxiv.org/abs/2103.14452v1
- Date: Fri, 26 Mar 2021 13:16:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 17:33:55.896642
- Title: Robot Program Parameter Inference via Differentiable Shadow Program
Inversion
- Title(参考訳): 微分可能影プログラムインバージョンによるロボットプログラムパラメータ推定
- Authors: Benjamin Alt, Darko Katic, Rainer J\"akel, Asil Kaan Bozcuoglu,
Michael Beetz
- Abstract要約: 本稿では,データから直接最適なスキルパラメータを推測する新しい手法であるShadow Program Inversion(SPI)を提案する。
産業シナリオと家庭シナリオにおける3つの異なるロボットとスキルフレームワークの手法を評価した。
- 参考スコア(独自算出の注目度): 11.412702366904913
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Challenging manipulation tasks can be solved effectively by combining
individual robot skills, which must be parameterized for the concrete physical
environment and task at hand. This is time-consuming and difficult for human
programmers, particularly for force-controlled skills. To this end, we present
Shadow Program Inversion (SPI), a novel approach to infer optimal skill
parameters directly from data. SPI leverages unsupervised learning to train an
auxiliary differentiable program representation ("shadow program") and realizes
parameter inference via gradient-based model inversion. Our method enables the
use of efficient first-order optimizers to infer optimal parameters for
originally non-differentiable skills, including many skill variants currently
used in production. SPI zero-shot generalizes across task objectives, meaning
that shadow programs do not need to be retrained to infer parameters for
different task variants. We evaluate our methods on three different robots and
skill frameworks in industrial and household scenarios. Code and examples are
available at https://innolab.artiminds.com/icra2021.
- Abstract(参考訳): 具体的な物理的環境や手前のタスクにパラメータ化する必要がある個々のロボットスキルを組み合わせることで、操作タスクの混在を効果的に解決することができる。
これは、人間プログラマ、特に力量制御スキルにとって、時間がかかり難い。
そこで我々は,データから直接最適なスキルパラメータを推測する新しい手法であるShadow Program Inversion (SPI)を提案する。
SPIは教師なし学習を活用して、補助的微分可能なプログラム表現(シャドウプログラム)を訓練し、勾配に基づくモデル反転によるパラメータ推論を実現する。
本手法は,実運用で使用されている多くのスキル変種を含む,元々の非微分可能スキルの最適パラメータを推定する効率的な一階最適化器の利用を可能にする。
SPIゼロショットはタスクの目的をまたいだ一般化であり、異なるタスクの変数のパラメータを推論するためにシャドウプログラムを再訓練する必要はない。
産業シナリオと家庭シナリオにおける3つの異なるロボットとスキルフレームワークの手法を評価した。
コードとサンプルはhttps://innolab.artiminds.com/icra2021。
関連論文リスト
- On the Effectiveness of LayerNorm Tuning for Continual Learning in
Vision Transformers [47.77328392236625]
最新のリハーサルなし連続学習手法は、視覚変換器の特異性を利用してタスク固有のプロンプトを学習する。
そこで、まずタスク固有のパラメータを最適化し、次に推論時間の同じ選択手順で分類器を訓練する。
提案手法は, 計算コストを抑えながら, より優れた結果が得られるか, あるいは, 技術水準に匹敵する結果が得られる。
論文 参考訳(メタデータ) (2023-08-18T15:11:16Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Learning Reward Functions for Robotic Manipulation by Observing Humans [92.30657414416527]
我々は、ロボット操作ポリシーのタスク非依存報酬関数を学習するために、幅広い操作タスクを解く人間のラベル付きビデオを使用する。
学習された報酬は、タイムコントラストの目的を用いて学習した埋め込み空間におけるゴールまでの距離に基づいている。
論文 参考訳(メタデータ) (2022-11-16T16:26:48Z) - Polyhistor: Parameter-Efficient Multi-Task Adaptation for Dense Vision
Tasks [36.34331439747556]
本稿では,複数のタスクにまたがる情報をトレーニング可能なパラメータで共有するために,PolyhistorとPolyhistor-Liteを提案する。
具体的には、Polyhistorは、トレーニング可能なパラメータの10%しか使用せず、最先端技術と比較して、競争精度を達成している。
論文 参考訳(メタデータ) (2022-10-07T00:25:02Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - Skill-based Multi-objective Reinforcement Learning of Industrial Robot
Tasks with Planning and Knowledge Integration [0.4949816699298335]
本稿では,タスクレベルの計画と,スキルベースシステムにおけるシナリオ固有のパラメータの学習を併用する手法を提案する。
2つの異なる接触豊富なタスクのスキルパラメータを学習することで、アプローチの有効性と汎用性を実証する。
論文 参考訳(メタデータ) (2022-03-18T16:03:27Z) - Learning of Parameters in Behavior Trees for Movement Skills [0.9562145896371784]
振舞い木(BT)は、モジュラーと構成可能なスキルをサポートするポリシー表現を提供することができる。
本稿では,BTポリシーのパラメータをシミュレーションで学習し,追加のトレーニングを伴わずに物理ロボットに一般化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-27T13:46:39Z) - Replicate or Relocate? Non-Uniform Access in Parameter Servers [74.89066750738971]
ホットスポットパラメータを複製し、アクセス頻度の低いパラメータを再配置し、非決定性を管理する専門技術を採用しているPSであるLapse2を紹介します。
私たちの実験研究では、Lapse2は既存の単一技術PSを最大1桁上回った。
論文 参考訳(メタデータ) (2021-04-01T14:52:32Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z) - Bayesian Optimization for Developmental Robotics with Meta-Learning by
Parameters Bounds Reduction [6.19424794628672]
本稿では,長期記憶と推論モジュールに基づく開発フレームワークを提案する(ベイジアン最適化,視覚的類似性,パラメータ境界縮小)。
シミュレーションでは8つの異なるオブジェクトのビンピッキングタスク(シミュレーションでは7つ,実際のセットアップでは1つ,他の類似したオブジェクトからのエクスペリエンスを伴わないメタラーニング)を作成するために,非常に小さな最適化予算にもかかわらず,成果を達成できた。
論文 参考訳(メタデータ) (2020-07-30T10:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。