論文の概要: Canonical mapping as a general-purpose object descriptor for robotic
manipulation
- arxiv url: http://arxiv.org/abs/2303.01331v1
- Date: Thu, 2 Mar 2023 15:09:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 13:52:22.685461
- Title: Canonical mapping as a general-purpose object descriptor for robotic
manipulation
- Title(参考訳): ロボット操作のための汎用オブジェクト記述子としてのカノニカルマッピング
- Authors: Benjamin Joffe and Konrad Ahlin
- Abstract要約: 準ユニバーサルでフレキシブルなオブジェクト記述子としてカノニカルマッピングを提案する。
本研究では,1つの事前学習された標準写像モデルから共通オブジェクト表現を導出できることを実証する。
2つのロボットアームを用いた多段階実験を行い、知覚アプローチの堅牢性を実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perception is an essential part of robotic manipulation in a semi-structured
environment. Traditional approaches produce a narrow task-specific prediction
(e.g., object's 6D pose), that cannot be adapted to other tasks and is
ill-suited for deformable objects. In this paper, we propose using canonical
mapping as a near-universal and flexible object descriptor. We demonstrate that
common object representations can be derived from a single pre-trained
canonical mapping model, which in turn can be generated with minimal manual
effort using an automated data generation and training pipeline. We perform a
multi-stage experiment using two robot arms that demonstrate the robustness of
the perception approach and the ways it can inform the manipulation strategy,
thus serving as a powerful foundation for general-purpose robotic manipulation.
- Abstract(参考訳): 知覚は半構造化環境におけるロボット操作の重要な部分である。
従来のアプローチは、他のタスクに適応できず、変形可能なオブジェクトに不適合な、狭いタスク固有の予測(例えば、オブジェクトの6dポーズ)を生成する。
本稿では,準ユニバーサルでフレキシブルなオブジェクト記述子としてカノニカルマッピングを提案する。
一般的なオブジェクト表現は、事前学習された単一の標準マッピングモデルから導出され、自動化されたデータ生成とトレーニングパイプラインを使用して、最小限の手動作業で生成できることを実証する。
2つのロボットアームを用いた多段階実験を行い、認識アプローチの堅牢性と、それが操作戦略に通知する方法を示し、汎用ロボット操作の強力な基盤として機能する。
関連論文リスト
- Hand-Object Interaction Pretraining from Videos [77.92637809322231]
我々は,3次元ハンドオブジェクトインタラクショントラジェクトリから,一般的なロボット操作を学習する。
人間の手と操作された物体を3D空間で共有し、人間の動きをロボットの動きと共有する。
我々は、このポリシーを、強化学習(RL)と行動クローニング(BC)の両方で微調整することで、下流タスクへのサンプル効率の適応を可能にし、従来のアプローチと比較して堅牢性と一般化性を同時に改善できることを実証的に実証した。
論文 参考訳(メタデータ) (2024-09-12T17:59:07Z) - Polaris: Open-ended Interactive Robotic Manipulation via Syn2Real Visual Grounding and Large Language Models [53.22792173053473]
我々はPolarisという対話型ロボット操作フレームワークを紹介した。
ポラリスはGPT-4と接地された視覚モデルを利用して知覚と相互作用を統合する。
本稿では,Syn2Real(Synthetic-to-Real)ポーズ推定パイプラインを提案する。
論文 参考訳(メタデータ) (2024-08-15T06:40:38Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - Learning Reusable Manipulation Strategies [86.07442931141634]
人間は「トリック」を習得し、一般化する素晴らしい能力を実証する
本稿では,機械が1つの実演と自己演奏によってこのような操作スキルを習得することを可能にするフレームワークを提案する。
これらの学習メカニズムとサンプルは、標準的なタスクやモーションプランナにシームレスに統合できる。
論文 参考訳(メタデータ) (2023-11-06T17:35:42Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Programmatically Grounded, Compositionally Generalizable Robotic
Manipulation [35.12811184353626]
意味表現を統合化するための従来の事前学習ファインタニングパイプラインは、ドメイン固有の行動情報の学習に絡み合っていることを示す。
本稿では,言語命令の統語的構造と意味的構造を利用して,事前学習モデルを活用するモジュール方式を提案する。
我々のモデルは、様々な操作行動において、ゼロショットと合成の一般化を改善するために、動作と知覚をうまく切り離すことに成功している。
論文 参考訳(メタデータ) (2023-04-26T20:56:40Z) - Zero-Shot Robot Manipulation from Passive Human Videos [59.193076151832145]
我々は,人間の映像からエージェント非依存の行動表現を抽出するフレームワークを開発した。
我々の枠組みは、人間の手の動きを予測することに基づいている。
トレーニングされたモデルゼロショットを物理ロボット操作タスクにデプロイする。
論文 参考訳(メタデータ) (2023-02-03T21:39:52Z) - PACT: Perception-Action Causal Transformer for Autoregressive Robotics
Pre-Training [25.50131893785007]
本研究は,ロボットにおける複数のタスクの出発点として機能する汎用表現を事前学習するためのパラダイムを導入する。
本稿では,ロボットデータから直接表現を自己管理的に構築することを目的として,PACT(Perception-Action Causal Transformer)を提案する。
より大規模な事前学習モデル上に小さなタスク特化ネットワークを微調整すると、同時に1つのモデルをスクラッチからトレーニングするのに比べ、性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-09-22T16:20:17Z) - Manipulation of Articulated Objects using Dual-arm Robots via Answer Set
Programming [10.316694915810947]
調音物体の操作はロボティクスにおいて最も重要なものであり、最も複雑な操作の1つと見なすことができる。
従来、この問題は、柔軟性と移植性に欠けるアドホックなアプローチによって対処されてきた。
本稿では,ロボット制御アーキテクチャにおける調音オブジェクトの自動操作のための解答セットプログラミング(ASP)に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2020-10-02T18:50:39Z) - Counterfactual Explanation and Causal Inference in Service of Robustness
in Robot Control [15.104159722499366]
我々は「事象AがCの代わりにBを引き起こすように変更できるか?」という形式の逆実数条件の生成モデルを訓練するためのアーキテクチャを提案する。
従来の制御設計手法とは対照的に、ノイズを除去する能力の観点から頑健さを定量化する手法では、ある要件に違反する可能性のある反事実の空間を探索する。
論文 参考訳(メタデータ) (2020-09-18T14:22:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。