論文の概要: Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon
Manipulation
- arxiv url: http://arxiv.org/abs/2309.00987v1
- Date: Sat, 2 Sep 2023 16:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 23:58:50.980444
- Title: Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon
Manipulation
- Title(参考訳): 逐次的デクスタリティ:ロングホリゾン操作のためのデクスタラスポリシーの連鎖
- Authors: Yuanpei Chen, Chen Wang, Li Fei-Fei, C. Karen Liu
- Abstract要約: 本稿では、長期タスク目標を達成するための複数の厳密なポリシーをチェーンする汎用システムであるSequential Dexterityを提案する。
システムの中核は、連鎖の成功率を高めるためのサブ政治を段階的に微調整する移行実現機能である。
本システムでは,器用な手を備えた実世界のロボットにゼロショットで移動することができる。
- 参考スコア(独自算出の注目度): 28.37417344133933
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world manipulation tasks consist of a series of subtasks that are
significantly different from one another. Such long-horizon, complex tasks
highlight the potential of dexterous hands, which possess adaptability and
versatility, capable of seamlessly transitioning between different modes of
functionality without the need for re-grasping or external tools. However, the
challenges arise due to the high-dimensional action space of dexterous hand and
complex compositional dynamics of the long-horizon tasks. We present Sequential
Dexterity, a general system based on reinforcement learning (RL) that chains
multiple dexterous policies for achieving long-horizon task goals. The core of
the system is a transition feasibility function that progressively finetunes
the sub-policies for enhancing chaining success rate, while also enables
autonomous policy-switching for recovery from failures and bypassing redundant
stages. Despite being trained only in simulation with a few task objects, our
system demonstrates generalization capability to novel object shapes and is
able to zero-shot transfer to a real-world robot equipped with a dexterous
hand. More details and video results could be found at
https://sequential-dexterity.github.io
- Abstract(参考訳): 多くの実世界の操作タスクは、互いに著しく異なる一連のサブタスクで構成される。
このような長いホリゾンの複雑なタスクは、適応性と汎用性を持ち、再グラッピングや外部ツールの必要なく、異なるモードの機能をシームレスに切り替えることができるデクスタラスハンドの可能性を浮き彫りにしている。
しかし、この課題は、デキスタラスハンドの高次元の作用空間と、長い水平タスクの複雑な構成力学によって生じる。
本稿では,強化学習(rl)に基づく汎用システムである逐次的デクスタリティ(sequential dexterity)を提案する。
システムのコアは、チェーン成功率を高めるためにサブポリティシーを段階的に微調整するトランジッション実現機能であると同時に、障害からの回復のための自律的なポリシー切り替えと冗長なステージのバイパスを可能にする。
数個のタスクオブジェクトのシミュレーションでしか訓練されていないにもかかわらず、システムは新しいオブジェクト形状への一般化能力を示し、デクスタースハンドを装備した実世界ロボットへのゼロショット転送を可能にする。
詳細とビデオ結果はhttps://sequential-dexterity.github.ioで確認できる。
関連論文リスト
- Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.54757719504994]
本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:49:56Z) - Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning [61.294110816231886]
我々はスパース・リユース・フレキシブル・ポリシー、スパース・ディフュージョン・ポリシー(SDP)を導入する。
SDPは、エキスパートとスキルを選択的に活性化し、モデル全体をトレーニングすることなく、効率的でタスク固有の学習を可能にする。
デモとコードはhttps://forrest-110.io/sparse_diffusion_policy/にある。
論文 参考訳(メタデータ) (2024-07-01T17:59:56Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Multi-Stage Cable Routing through Hierarchical Imitation Learning [52.66135251744562]
本研究では,多段階ロボット操作タスクの学習の課題とケーブルルーティングへの応用について検討する。
本稿では,この手法を用いてケーブルルーティングタスクを学習し,優れた性能を示す評価を行うシステムを提案する。
論文 参考訳(メタデータ) (2023-07-18T02:14:49Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - Self-Supervised Reinforcement Learning that Transfers using Random
Features [41.00256493388967]
本研究では,タスク間の行動の伝達を,報酬の異なる自己指導型強化学習手法を提案する。
我々の手法は、報奨ラベルなしでオフラインデータセットでトレーニングできるが、新しいタスクに素早くデプロイできるという自己教師型である。
論文 参考訳(メタデータ) (2023-05-26T20:37:06Z) - Building a Subspace of Policies for Scalable Continual Learning [21.03369477853538]
本稿では,一連のタスクで強化学習エージェントを訓練するためのポリシーのサブスペースを段階的に構築する新しいアプローチであるContinuous Subspace of Policies(CSP)を紹介する。
CSPは、Brax(ロコモーション)とContinuous World(操作)という2つの挑戦的なドメインから幅広いシナリオにおいて、多くの人気ベースラインを上回ります。
論文 参考訳(メタデータ) (2022-11-18T14:59:42Z) - Hierarchical Few-Shot Imitation with Skill Transition Models [66.81252581083199]
FIST(Few-shot Imitation with Skill Transition Models)は、オフラインデータからスキルを抽出し、それらを利用して見えないタスクに一般化するアルゴリズムである。
本稿では,FISTが新たなタスクに一般化し,ナビゲーション実験において従来のベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2021-07-19T15:56:01Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。