論文の概要: Grasping with Chopsticks: Combating Covariate Shift in Model-free
Imitation Learning for Fine Manipulation
- arxiv url: http://arxiv.org/abs/2011.06719v1
- Date: Fri, 13 Nov 2020 01:54:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 00:36:56.176430
- Title: Grasping with Chopsticks: Combating Covariate Shift in Model-free
Imitation Learning for Fine Manipulation
- Title(参考訳): くちばしを用いたグラスピング : モデルフリー模倣学習における共変量シフトによるマニピュレーション
- Authors: Liyiming Ke, Jingqiang Wang, Tapomayukh Bhattacharjee, Byron Boots and
Siddhartha Srinivasa
- Abstract要約: 本報告では,ロボットマニピュレータの開発について述べる。
微調整のための正確なモデルがないため、モデルなしの模倣学習を探索する。
我々は,有界雑音を付加して合成補正ラベルを生成し,パラメトリック法と非パラメトリック法を組み合わせて誤りの蓄積を防止する。
- 参考スコア(独自算出の注目度): 29.906142521230336
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Billions of people use chopsticks, a simple yet versatile tool, for fine
manipulation of everyday objects. The small, curved, and slippery tips of
chopsticks pose a challenge for picking up small objects, making them a
suitably complex test case. This paper leverages human demonstrations to
develop an autonomous chopsticks-equipped robotic manipulator. Due to the lack
of accurate models for fine manipulation, we explore model-free imitation
learning, which traditionally suffers from the covariate shift phenomenon that
causes poor generalization. We propose two approaches to reduce covariate
shift, neither of which requires access to an interactive expert or a model,
unlike previous approaches. First, we alleviate single-step prediction errors
by applying an invariant operator to increase the data support at critical
steps for grasping. Second, we generate synthetic corrective labels by adding
bounded noise and combining parametric and non-parametric methods to prevent
error accumulation. We demonstrate our methods on a real chopstick-equipped
robot that we built, and observe the agent's success rate increase from 37.3%
to 80%, which is comparable to the human expert performance of 82.6%.
- Abstract(参考訳): 何十億という人々が、日常のオブジェクトを細かく操作するために、シンプルで多用途なツールであるチョップスティックを使っている。
小さく、湾曲し、滑りやすい先端は、小さな物体を拾うのに難題となり、非常に複雑なテストケースとなる。
本稿では,ロボットマニピュレータの開発に人間による実演を利用する。
ファインマニピュレーションのための正確なモデルがないため、従来は一般化の貧弱な共変シフト現象に苦しむモデルフリー模倣学習を探求する。
従来のアプローチと異なり,インタラクティブなエキスパートやモデルへのアクセスを必要とせず,共変量シフトを減らすための2つのアプローチを提案する。
まず,可変演算子を適用した単段予測誤差を軽減し,把握のための重要なステップにおけるデータサポートを増加させる。
第2に,有界雑音を付加して合成補正ラベルを生成し,パラメトリック法と非パラメトリック法を組み合わせて誤差蓄積を防止する。
本研究は,本研究で開発した実機を用いたロボットの手法を実証し,エージェントの成功率を37.3%から80%に増やし,82.6%の人間エキスパート性能に匹敵する結果を得た。
関連論文リスト
- Offline Imitation Learning Through Graph Search and Retrieval [57.57306578140857]
模倣学習は、ロボットが操作スキルを取得するための強力な機械学習アルゴリズムである。
本稿では,グラフ検索と検索により,最適下実験から学習する,シンプルで効果的なアルゴリズムGSRを提案する。
GSRは、ベースラインに比べて10%から30%高い成功率、30%以上の熟練を達成できる。
論文 参考訳(メタデータ) (2024-07-22T06:12:21Z) - Counting Objects in a Robotic Hand [6.057565013011719]
多目的グリップを行うロボットは、グリップ後に手にあるオブジェクトの数を検出する必要がある。
本稿では,データ駆動型コントラスト学習に基づくカウント分類器を提案する。
提案手法は,実際の3つのオブジェクトに対して96%以上の精度を実現した。
論文 参考訳(メタデータ) (2024-04-09T21:46:14Z) - One ACT Play: Single Demonstration Behavior Cloning with Action Chunking
Transformers [11.875194596371484]
人間は1つか2つのデモを見ただけで、複雑なタスクを完了させることを学ぶことができる。
我々の研究は、行動クローニングを使用して、人間の1つのデモンストレーションのみを与えられたタスクを学ぶことで、この能力をエミュレートすることを目指している。
本研究では,行動チャンキングエージェントが推論時に使用する時間的アンサンブル法に新たな付加法を開発した。
論文 参考訳(メタデータ) (2023-09-18T21:50:26Z) - Confidence-Based Model Selection: When to Take Shortcuts for
Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。
我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文 参考訳(メタデータ) (2023-06-19T18:48:15Z) - Distributional Instance Segmentation: Modeling Uncertainty and High
Confidence Predictions with Latent-MaskRCNN [77.0623472106488]
本稿では,潜在符号を用いた分散インスタンス分割モデルのクラスについて検討する。
ロボットピッキングへの応用として,高い精度を実現するための信頼性マスク手法を提案する。
本手法は,新たにリリースした曖昧なシーンのデータセットを含め,ロボットシステムにおける致命的なエラーを著しく低減できることを示す。
論文 参考訳(メタデータ) (2023-05-03T05:57:29Z) - Encouraging Neural Machine Translation to Satisfy Terminology
Constraints [3.3108924994485096]
語彙制約を満たすためにニューラルマシン翻訳を奨励する新しいアプローチを提案する。
本手法は,トレーニング段階において動作し,推論段階における計算オーバーヘッドの増大を回避する。
論文 参考訳(メタデータ) (2021-06-07T15:46:07Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z) - Regularizers for Single-step Adversarial Training [49.65499307547198]
本稿では,1ステップの対数学習手法を用いて,ロバストモデル学習を支援する3種類の正則化器を提案する。
正規化器は、ロバストモデルと擬ロバストモデルとを区別する特性を利用することにより、勾配マスキングの効果を緩和する。
論文 参考訳(メタデータ) (2020-02-03T09:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。