Fugu-MT 論文翻訳(概要): DexterityGen: Foundation Controller for Unprecedented Dexterity

論文の概要: DexterityGen: Foundation Controller for Unprecedented Dexterity

arxiv url: http://arxiv.org/abs/2502.04307v1
Date: Thu, 06 Feb 2025 18:49:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-07 15:30:40.924285
Title: DexterityGen: Foundation Controller for Unprecedented Dexterity
Title（参考訳）: DexterityGen: 先進的なデキスタリティのためのファウンデーションコントローラ
Authors: Zhao-Heng Yin, Changhao Wang, Luis Pineda, Francois Hogan, Krishna Bodduluri, Akash Sharma, Patrick Lancaster, Ishita Prasad, Mrinal Kalakrishnan, Jitendra Malik, Mike Lambeta, Tingfan Wu, Pieter Abbeel, Mustafa Mukadam,
Abstract要約: ツール使用など,ロボットの巧妙な操作スキルを教えることは,大きな課題となる。現在のアプローチは、人間の遠隔操作(模倣学習)とシミュレート・トゥ・リアル強化学習(sim-to-real reinforcement learning)の2つの戦略に大別できる。本稿では,手動回転や翻訳などの大規模動きプリミティブをRLで事前学習するDexterityGenを紹介する。現実の世界では、人間の遠隔操作をコントローラーのプロンプトとして利用し、厳密な振る舞いを生み出す。
参考スコア（独自算出の注目度）: 67.15251368211361
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Teaching robots dexterous manipulation skills, such as tool use, presents a significant challenge. Current approaches can be broadly categorized into two strategies: human teleoperation (for imitation learning) and sim-to-real reinforcement learning. The first approach is difficult as it is hard for humans to produce safe and dexterous motions on a different embodiment without touch feedback. The second RL-based approach struggles with the domain gap and involves highly task-specific reward engineering on complex tasks. Our key insight is that RL is effective at learning low-level motion primitives, while humans excel at providing coarse motion commands for complex, long-horizon tasks. Therefore, the optimal solution might be a combination of both approaches. In this paper, we introduce DexterityGen (DexGen), which uses RL to pretrain large-scale dexterous motion primitives, such as in-hand rotation or translation. We then leverage this learned dataset to train a dexterous foundational controller. In the real world, we use human teleoperation as a prompt to the controller to produce highly dexterous behavior. We evaluate the effectiveness of DexGen in both simulation and real world, demonstrating that it is a general-purpose controller that can realize input dexterous manipulation commands and significantly improves stability by 10-100x measured as duration of holding objects across diverse tasks. Notably, with DexGen we demonstrate unprecedented dexterous skills including diverse object reorientation and dexterous tool use such as pen, syringe, and screwdriver for the first time.
Abstract（参考訳）: ツール使用など,ロボットの巧妙な操作スキルを教えることは,大きな課題となる。現在のアプローチは、人間の遠隔操作(模倣学習)とシミュレート・トゥ・リアル強化学習(sim-to-real reinforcement learning)の2つの戦略に大別できる。第1のアプローチは、人間がタッチフィードバックなしで異なる実施形態で安全で器用な動きを発生させることが難しいため、難しい。第2のRLベースのアプローチは、ドメインギャップに苦慮し、複雑なタスクに対して高いタスク固有の報酬エンジニアリングを伴います。我々の重要な洞察は、RLは低レベルのモーションプリミティブを学ぶのに効果的であり、人間は複雑な長距離タスクのために粗いモーションコマンドを提供するのに優れています。したがって、最適解は両方のアプローチの組み合わせかもしれない。本稿では,手動回転や翻訳などの大規模動きプリミティブをRLで事前学習するDexterityGen(DexGen)を紹介する。次に、この学習データセットを活用して、厳密な基礎的なコントローラをトレーニングします。現実の世界では、人間の遠隔操作をコントローラーのプロンプトとして利用し、厳密な振る舞いを生み出す。シミュレーションと実世界の両面でのDexGenの有効性を評価し,多種多様なタスクにまたがるオブジェクト保持の持続時間として測定された10～100倍の安定性を向上できる汎用制御器であることを実証した。特に、DexGenでは、さまざまなオブジェクトのリオリエンテーションや、ペン、注射器、ドライバーといったデクスタラスなツールの使用を含む、前例のないデクスタラスなスキルを初めて披露しています。

関連論文リスト

MAPLE: Encoding Dexterous Robotic Manipulation Priors Learned From Egocentric Videos [43.836197294180316]
そこで本研究では,より効率的なポリシー学習を実現するために,よりリッチな操作を生かした創発的ロボット操作手法であるMAPLEを提案する。具体的には、手動接触時の手動接触点と詳細な手動ポーズを予測し、学習した特徴を用いて下流操作タスクのポリシーを訓練する。
論文参考訳（メタデータ） (2025-04-08T14:25:25Z)
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [56.892520712892804]
本稿では,ヒューマノイドロボットを訓練して3つの巧妙な操作を行う,実用的なシミュレート・トゥ・リアルなRLレシピを提案する。未確認のオブジェクトやロバストで適応的な政策行動に対して高い成功率を示す。
論文参考訳（メタデータ） (2025-02-27T18:59:52Z)
DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References [18.947295547196774]
我々は,人間の参照からのデクスタス操作のための汎用型ニューラルトラッキングコントローラを開発する上での課題に対処する。本稿では,ロボット追跡実験を大規模に成功させる手法を提案する。本手法は,トップベースラインに比べて10%以上の成功率向上を実現している。
論文参考訳（メタデータ） (2025-02-13T18:59:13Z)
Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning [47.785786984974855]
本稿では,多種多様な操作タスクに対して印象的な性能を示す,ループ内視覚に基づくRLシステムを提案する。提案手法では,実証と人間の修正,効率的なRLアルゴリズム,その他のシステムレベルの設計選択を統合してポリシを学習する。提案手法は,再現学習のベースラインと先行RLアプローチを著しく上回り,成功率の平均2倍,実行速度1.8倍に向上した。
論文参考訳（メタデータ） (2024-10-29T08:12:20Z)
Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文参考訳（メタデータ） (2024-01-30T10:48:43Z)
REBOOT: Reuse Data for Bootstrapping Efficient Real-World Dexterous Manipulation [61.7171775202833]
本稿では,強化学習による巧妙な操作スキルの学習を効率化するシステムを提案する。我々のアプローチの主な考え方は、サンプル効率のRLとリプレイバッファブートストラップの最近の進歩の統合である。本システムでは,実世界の学習サイクルを,模倣に基づくピックアップポリシを通じて学習されたリセットを組み込むことで完遂する。
論文参考訳（メタデータ） (2023-09-06T19:05:31Z)
Learning a Universal Human Prior for Dexterous Manipulation from Human Preference [35.54663426598218]
本稿では,ビデオ上での人間の嗜好を直接フィードバックすることで,人類の普遍性を学習するフレームワークを提案する。多様な警察を反復的に生成し、軌道上の人間の嗜好を収集することにより、タスクに依存しない報酬モデルを訓練する。提案手法は,ロボットの手の動作を,目に見えないタスクを含む多様なタスクで実証的に示す。
論文参考訳（メタデータ） (2023-04-10T14:17:33Z)
Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning [73.92475751508452]
Bimanual Dexterous Hands Benchmark (Bi-DexHands) は、数十のバイマニュアル操作タスクと数千のターゲットオブジェクトを備えた2つのデキスタラスハンドを含むシミュレータである。 Bi-DexHandsのタスクは、認知科学の文献によると、人間の運動能力のレベルが異なるように設計されている。
論文参考訳（メタデータ） (2022-06-17T11:09:06Z)
Accelerating Robotic Reinforcement Learning via Parameterized Action Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文参考訳（メタデータ） (2021-10-28T17:59:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。