論文の概要: Waypoint-Based Imitation Learning for Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2307.14326v1
- Date: Wed, 26 Jul 2023 17:45:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 11:41:12.638807
- Title: Waypoint-Based Imitation Learning for Robotic Manipulation
- Title(参考訳): ロボットマニピュレーションのためのWaypoint-based Imitation Learning
- Authors: Lucy Xiaoyang Shi, Archit Sharma, Tony Z. Zhao, Chelsea Finn
- Abstract要約: ウェイポイントラベリングは不特定であり、追加の人的監督が必要である。
模倣学習のためのAWE(Automatic Waypoint extract)を提案する。
AWEは、最先端のアルゴリズムの成功率を、シミュレーションで25%、実世界のバイマニュアル操作タスクで4-28%向上させることができる。
- 参考スコア(独自算出の注目度): 56.4287610994102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While imitation learning methods have seen a resurgent interest for robotic
manipulation, the well-known problem of compounding errors continues to afflict
behavioral cloning (BC). Waypoints can help address this problem by reducing
the horizon of the learning problem for BC, and thus, the errors compounded
over time. However, waypoint labeling is underspecified, and requires
additional human supervision. Can we generate waypoints automatically without
any additional human supervision? Our key insight is that if a trajectory
segment can be approximated by linear motion, the endpoints can be used as
waypoints. We propose Automatic Waypoint Extraction (AWE) for imitation
learning, a preprocessing module to decompose a demonstration into a minimal
set of waypoints which when interpolated linearly can approximate the
trajectory up to a specified error threshold. AWE can be combined with any BC
algorithm, and we find that AWE can increase the success rate of
state-of-the-art algorithms by up to 25% in simulation and by 4-28% on
real-world bimanual manipulation tasks, reducing the decision making horizon by
up to a factor of 10. Videos and code are available at
https://lucys0.github.io/awe/
- Abstract(参考訳): 模倣学習法はロボット操作への関心が高まりつつあるが、複合的エラーのよく知られた問題は、行動クローニング(BC)に影響を与え続けている。
ウェイポイントは、bcの学習問題の地平線を縮めることでこの問題に対処できるため、エラーは時間とともに複雑化する。
しかし、ウェイポイントラベリングは不特定であり、追加の人的監督が必要である。
人的監督なしでwaypointを自動生成できますか?
我々の重要な洞察は、軌道セグメントが線形運動によって近似できるならば、エンドポイントはウェイポイントとして使用できるということである。
そこで本研究では,再現学習のための自動ウェイポイント抽出 (awe) を提案する。このプリプロセッシングモジュールはデモを最小のウェイポイントに分解し,線形に補間することで,指定された誤差閾値までの軌道を近似できる。
AWEは任意のBCアルゴリズムと組み合わせることができ、AWEはシミュレーションで25%、実世界のバイマン的操作タスクで4-28%、意思決定の地平線を最大10倍に向上させることができる。
ビデオとコードはhttps://lucys0.github.io/awe/で入手できる。
関連論文リスト
- Dense Optical Tracking: Connecting the Dots [82.79642869586587]
DOTは、ビデオにおけるポイントトラッキングの問題を解決するための、新しくてシンプルで効率的な方法である。
OmniMotionのような高度な"ユニバーサルトラッカー"を上回り、CoTrackerのような最良のポイントトラッキングアルゴリズムと同等か、あるいはそれ以上の精度で、DOTが現在の光フロー技術よりもはるかに正確であることを示す。
論文 参考訳(メタデータ) (2023-12-01T18:59:59Z) - Neural Potential Field for Obstacle-Aware Local Motion Planning [46.42871544295734]
本稿では,ロボットのポーズ,障害物マップ,ロボットのフットプリントに基づいて,異なる衝突コストを返却するニューラルネットワークモデルを提案する。
私たちのアーキテクチャには、障害物マップとロボットフットプリントを埋め込みに変換するニューラルイメージエンコーダが含まれています。
Husky UGVモバイルロボットの実験は、我々のアプローチがリアルタイムで安全なローカルプランニングを可能にすることを示した。
論文 参考訳(メタデータ) (2023-10-25T05:00:21Z) - Fighting Uncertainty with Gradients: Offline Reinforcement Learning via
Diffusion Score Matching [22.461036967440723]
我々は不確実性指標としてデータへのスムーズな距離について検討し、2つの有益な性質を持つと主張している。
スコアマッチング技術を用いて,これらの勾配を効率的に学習できることを示す。
本研究では,高次元問題における一階計画を実現するためのスコアガイドプランニング(SGP)を提案する。
論文 参考訳(メタデータ) (2023-06-24T23:40:58Z) - PointFlowHop: Green and Interpretable Scene Flow Estimation from
Consecutive Point Clouds [49.7285297470392]
本研究では,PointFlowHopと呼ばれる3次元シーンフローの効率的な推定法を提案する。
ポイントフローホップは2つの連続する点雲を取り、第1点雲の各点の3次元フローベクトルを決定する。
シーンフロー推定タスクを,エゴモーション補償,オブジェクトアソシエーション,オブジェクトワイドモーション推定など,一連のサブタスクに分解する。
論文 参考訳(メタデータ) (2023-02-27T23:06:01Z) - Multi-Robot Active Mapping via Neural Bipartite Graph Matching [49.72892929603187]
本稿では,最小時間ステップにおけるシーンマップ構築の完全化を目的としたマルチロボットアクティブマッピングの問題点について検討する。
この問題の鍵は、より効率的なロボットの動きを可能にするゴール位置推定にある。
本稿では,ニューラルコマッピング(NeuralCoMapping)という新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-30T14:03:17Z) - Learning Time-optimized Path Tracking with or without Sensory Feedback [5.254093731341154]
本稿では,ロボットが関節空間で定義された基準経路を素早く追従できる学習型アプローチを提案する。
ロボットは、物理シミュレータで生成されたデータを用いて強化学習によって訓練されたニューラルネットワークによって制御される。
論文 参考訳(メタデータ) (2022-03-03T19:13:31Z) - Continuous Motion Planning with Temporal Logic Specifications using Deep
Neural Networks [16.296473750342464]
動作計画問題に対する制御ポリシを合成するモデルフリー強化学習法を提案する。
ロボットは、連続状態と行動空間を持つ離散マルコフ時間決定プロセス(MDP)としてモデル化される。
我々は,アクタクリティカル強化学習法を用いて,価値関数とポリシーを近似するために,ディープニューラルネットワークを訓練する。
論文 参考訳(メタデータ) (2020-04-02T17:58:03Z) - Key Points Estimation and Point Instance Segmentation Approach for Lane
Detection [65.37887088194022]
本稿では,PINet (Point Instance Network) と呼ばれるトラヒックライン検出手法を提案する。
PINetには、同時にトレーニングされる複数のスタックされた時間ガラスネットワークが含まれている。
PINetはTuSimpleとCulaneのデータセットで競合精度と偽陽性を達成する。
論文 参考訳(メタデータ) (2020-02-16T15:51:30Z) - PointHop++: A Lightweight Learning Model on Point Sets for 3D
Classification [55.887502438160304]
ポイントホップ法は、Zhangらによって、教師なし特徴抽出を伴う3Dポイントクラウド分類のために提案された。
1)モデルパラメータ数の観点からモデルの複雑さを減らし,2)クロスエントロピー基準に基づいて自動的に識別特徴を順序付けする。
ModelNet40ベンチマークデータセットで実施した実験により、PointHop++法がディープニューラルネットワーク(DNN)ソリューションと同等に動作し、他の教師なし特徴抽出法を上回る性能を示す。
論文 参考訳(メタデータ) (2020-02-09T04:49:32Z) - Closed-loop deep learning: generating forward models with
back-propagation [0.0]
反射は単純なクローズドループ制御アプローチであり、エラーを最小化しようとするが、反応が遅すぎるため失敗する。
適応アルゴリズムは、この誤差を利用して予測的手がかりの助けを借りて前方モデルを学ぶことができる。
ディープラーニングをクローズドループシステムに組み込んで,その連続処理を保存することで,これを直接実現できることを示す。
論文 参考訳(メタデータ) (2020-01-09T13:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。