論文の概要: EasyInsert: A Data-Efficient and Generalizable Insertion Policy
- arxiv url: http://arxiv.org/abs/2505.16187v1
- Date: Thu, 22 May 2025 03:46:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.018344
- Title: EasyInsert: A Data-Efficient and Generalizable Insertion Policy
- Title(参考訳): EasyInsert: 効率的で汎用的なインストールポリシー
- Authors: Guanghe Li, Junming Zhao, Shengjie Wang, Yang Gao,
- Abstract要約: EasyInsertは、プラグとソケットの間の相対的なポーズ(デルタポーズ)が挿入を成功させるのに十分である、という人間の直感を利用するフレームワークである。
EasyInsertは、予測されたデルタポーズに基づいた粗い実行手順に従い、様々な挿入タスクを成功させる。
実際の実験では、5時間のトレーニングデータしか持たないが、EasyInsertは、目に見えない15のオブジェクトのうち13のオブジェクトに対して、ゼロショット挿入で90%以上成功している。
- 参考スコア(独自算出の注目度): 13.020234602939812
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Insertion task is highly challenging that requires robots to operate with exceptional precision in cluttered environments. Existing methods often have poor generalization capabilities. They typically function in restricted and structured environments, and frequently fail when the plug and socket are far apart, when the scene is densely cluttered, or when handling novel objects. They also rely on strong assumptions such as access to CAD models or a digital twin in simulation. To address this, we propose EasyInsert, a framework which leverages the human intuition that relative pose (delta pose) between plug and socket is sufficient for successful insertion, and employs efficient and automated real-world data collection with minimal human labor to train a generalizable model for relative pose prediction. During execution, EasyInsert follows a coarse-to-fine execution procedure based on predicted delta pose, and successfully performs various insertion tasks. EasyInsert demonstrates strong zero-shot generalization capability for unseen objects in cluttered environments, handling cases with significant initial pose deviations while maintaining high sample efficiency and requiring little human effort. In real-world experiments, with just 5 hours of training data, EasyInsert achieves over 90% success in zero-shot insertion for 13 out of 15 unseen novel objects, including challenging objects like Type-C cables, HDMI cables, and Ethernet cables. Furthermore, with only one human demonstration and 4 minutes of automatically collected data for fine-tuning, it reaches over 90% success rate for all 15 objects.
- Abstract(参考訳): 設置作業は非常に困難で、ロボットは散らばった環境で例外的な精度で操作する必要がある。
既存の手法は、しばしば一般化能力に乏しい。
通常、制限された、構造された環境で機能し、プラグとソケットが遠く離れているとき、シーンが密に散らばっているとき、または新しい物体を扱うとき、しばしば失敗する。
また、CADモデルへのアクセスやシミュレーションにおけるデジタルツインといった強い仮定にも依存している。
そこで我々は,プラグとソケット間の相対的なポーズ(デルタポーズ)が挿入に十分である,という人間の直感を活用するフレームワークEasyInsertを提案する。
EasyInsertは、予測されたデルタポーズに基づいた粗い実行手順に従い、様々な挿入タスクを成功させる。
EasyInsertは、散らばった環境で見えないオブジェクトに対して強力なゼロショットの一般化機能を示し、高いサンプル効率を維持し、人間の努力をほとんど必要とせず、重要な初期ポーズのずれのあるケースを扱う。
実世界の実験では、わずか5時間のトレーニングデータで、EasyInsertは、Type-Cケーブル、HDMIケーブル、イーサネットケーブルなどの挑戦的なオブジェクトを含む15の新規オブジェクトのうち13の、ゼロショット挿入で90%以上成功している。
さらに、人間のデモが1つだけで、微調整のためのデータを自動的に収集する4分で、15のオブジェクトすべてに対して90%以上の成功率に達する。
関連論文リスト
- Attribute-Based Robotic Grasping with Data-Efficient Adaptation [19.683833436076313]
属性に基づくロボットグルーピングを学習するエンド・ツー・エンドのエンコーダ・デコーダネットワークを提案する。
提案手法は,未知のオブジェクトに対して,成功率を81%以上獲得する。
論文 参考訳(メタデータ) (2025-01-04T00:37:17Z) - Test-Time Alignment via Hypothesis Reweighting [56.71167047381817]
大規模な事前訓練されたモデルは、しばしば未指定のタスクで苦労する。
テストタイムのユーザ意図にモデルを整合させるという課題に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-11T23:02:26Z) - Semi-Supervised Neural Processes for Articulated Object Interactions [10.847409934374205]
本稿では,少数のオブジェクトのみにラベル付きインタラクションデータが存在するシナリオを対象とした適応型報酬予測モデルであるSemi-Supervised Neural Process (SSNP)を紹介する。
両方のタイプのデータを共同でトレーニングすることで、モデルはより効果的に一般化可能な機能に集中することができる。
SSNPの有効性は、ドアオープンタスクを通じて示され、他の半教師付き手法よりも優れた性能を示し、他の適応型モデルと比較して、わずかなデータしか使用しない。
論文 参考訳(メタデータ) (2024-11-28T21:20:06Z) - Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach [87.8330887605381]
本稿では,学習可能なパラメータをわずかに限定して,事前学習した視覚変換器を下流認識タスクに適用する方法を示す。
学習可能で軽量なモジュールを用いてタスク固有のクエリを合成する。
本手法はメモリ制約下での最先端性能を実現し,実環境における適用性を示す。
論文 参考訳(メタデータ) (2024-07-09T15:45:04Z) - Ins-HOI: Instance Aware Human-Object Interactions Recovery [44.02128629239429]
本稿では,エンド・ツー・エンドのインスタンス・アウェアなヒューマン・オブジェクト・インタラクション・リカバリ(Ins-HOI)フレームワークを提案する。
Ins-HOIはインスタンスレベルの再構築をサポートし、合理的で現実的な接触面を提供する。
我々は、現実世界の人間-椅子と手-物体の相互作用を伴う5.2kの高品質スキャンを含む、大規模で高忠実な3Dスキャンデータセットを収集します。
論文 参考訳(メタデータ) (2023-12-15T09:30:47Z) - Prompt Consistency for Zero-Shot Task Generalization [118.81196556175797]
本稿では,ラベルのないデータを用いてゼロショット性能を向上させる手法について検討する。
具体的には,複数のプロンプトを使ってひとつのタスクを指定できることを利用して,プロンプトの一貫性を規則化する手法を提案する。
我々のアプローチは、4つのNLPタスクにまたがる11のデータセットのうち9つにおいて、最先端のゼロショット学習者であるT0を精度で最大10.6の絶対点で上回ります。
論文 参考訳(メタデータ) (2022-04-29T19:18:37Z) - BEHAVE: Dataset and Method for Tracking Human Object Interactions [105.77368488612704]
マルチビューのRGBDフレームとそれに対応する3D SMPLとオブジェクトをアノテートしたアノテートコンタクトに適合させる。
このデータを用いて、自然環境における人間と物体を、容易に使用可能なマルチカメラで共同で追跡できるモデルを学ぶ。
論文 参考訳(メタデータ) (2022-04-14T13:21:19Z) - AdaAfford: Learning to Adapt Manipulation Affordance for 3D Articulated
Objects via Few-shot Interactions [13.802675708793014]
キャビネット、ドア、蛇口などの3D音声による物体の認識と相互作用は、将来のホームアシストロボットに特別な課題をもたらす。
我々はAdaAffordという名の新しいフレームワークを提案し、より正確なインスタンス固有の後付けに手軽さを迅速に適応するために、ごく少数のテスト時間インタラクションを実行することを学習する。
論文 参考訳(メタデータ) (2021-12-01T03:00:05Z) - Hierarchical Few-Shot Imitation with Skill Transition Models [66.81252581083199]
FIST(Few-shot Imitation with Skill Transition Models)は、オフラインデータからスキルを抽出し、それらを利用して見えないタスクに一般化するアルゴリズムである。
本稿では,FISTが新たなタスクに一般化し,ナビゲーション実験において従来のベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2021-07-19T15:56:01Z) - Meta Adaptation using Importance Weighted Demonstrations [19.37671674146514]
エージェントが新しいタスクを推測することが困難である場合も少なくない。
本稿では,特定のタスクの集合に関する事前知識を活用することで,関連するタスクを一般化する新しいアルゴリズムを提案する。
環境タスクの多様性からロボットを訓練し、目に見えない環境に適応できる実験を行った。
論文 参考訳(メタデータ) (2019-11-23T07:22:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。