論文の概要: Multi-Goal Dexterous Hand Manipulation using Probabilistic Model-based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2504.21585v1
- Date: Wed, 30 Apr 2025 12:44:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 18:53:24.149426
- Title: Multi-Goal Dexterous Hand Manipulation using Probabilistic Model-based Reinforcement Learning
- Title(参考訳): 確率モデルに基づく強化学習を用いた多目的デキスタスハンドマニピュレーション
- Authors: Yingzhuo Jiang, Wenjun Huang, Rongdun Lin, Chenyang Miao, Tianfu Sun, Yunduan Cui,
- Abstract要約: 本稿では,モデルに基づく強化学習を用いて,多目的手操作タスクの学習に挑戦する。
本稿では,高次元手動特性を記述するためのゴールコンディション型確率モデル予測制御(GC-PMPC)を提案する。
ケーブル駆動のDexterousハンドDexHand 021を12個のアクティブDOFと5個の触覚センサーで駆動し、約80分以内に3つのゴールポーズにキュービッドダイの操作を学習する。
- 参考スコア(独自算出の注目度): 2.34860173297653
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper tackles the challenge of learning multi-goal dexterous hand manipulation tasks using model-based Reinforcement Learning. We propose Goal-Conditioned Probabilistic Model Predictive Control (GC-PMPC) by designing probabilistic neural network ensembles to describe the high-dimensional dexterous hand dynamics and introducing an asynchronous MPC policy to meet the control frequency requirements in real-world dexterous hand systems. Extensive evaluations on four simulated Shadow Hand manipulation scenarios with randomly generated goals demonstrate GC-PMPC's superior performance over state-of-the-art baselines. It successfully drives a cable-driven Dexterous hand, DexHand 021 with 12 Active DOFs and 5 tactile sensors, to learn manipulating a cubic die to three goal poses within approximately 80 minutes of interactions, demonstrating exceptional learning efficiency and control performance on a cost-effective dexterous hand platform.
- Abstract(参考訳): 本稿では,モデルに基づく強化学習を用いて,多目的手操作タスクの学習に挑戦する。
本稿では,高次元手動力学を記述するために確率論的ニューラルネットワークアンサンブルを設計し,実世界の手動系における制御周波数要求を満たすための非同期MPCポリシーを導入することにより,GC-PMPC(Goal-Conditioned Probabilistic Model Predictive Control)を提案する。
ランダムに生成された目標を持つ4つのシミュレートされたシャドウハンド操作シナリオに対する広範囲な評価は、GC-PMPCが最先端のベースラインよりも優れた性能を示している。
ケーブル駆動のデクサラスハンドDexHand 021を12個のアクティブDOFと5個の触覚センサーで駆動し、約80分以内に3つの目標ポーズにキュービッドダイの操作を学習し、コスト効率の良いデクサラスハンドプラットフォーム上で例外的な学習効率と制御性能を示す。
関連論文リスト
- RUKA: Rethinking the Design of Humanoid Hands with Learning [15.909251187339228]
この研究は、コンパクトで手頃で能力のある腱駆動のヒューマノイドハンドであるRUKAを提示する。
RUKAは5本の指を持ち、自由度は15度で、多種多様な人間的な握りが可能である。
制御課題に対処するために、MANUSグローブで収集したモーションキャプチャーデータから、関節-触覚-触覚モデルと指先-触覚モデルを学ぶ。
論文 参考訳(メタデータ) (2025-04-17T17:58:59Z) - Dexterous Manipulation through Imitation Learning: A Survey [28.04590024211786]
イミテーションラーニング(IL)は、ロボットが専門家によるデモンストレーションから直接巧妙な操作スキルを習得できるようにすることによって、代替手段を提供する。
ILは、明示的なモデリングと大規模な試行錯誤の必要性を回避しながら、きめ細かい調整と接触ダイナミクスをキャプチャする。
私たちのゴールは、研究者や実践者たちに、この急速に進化する領域の包括的紹介を提供することです。
論文 参考訳(メタデータ) (2025-04-04T15:14:38Z) - DML-RAM: Deep Multimodal Learning Framework for Robotic Arm Manipulation using Pre-trained Models [4.197448156583907]
本稿では,レイトフュージョン戦略を用いてマルチモーダル入力を統合する,ロボットアーム操作のための新しいディープラーニングフレームワークを提案する。
このフレームワークはモジュール性、解釈可能性、リアルタイムな意思決定をサポートし、適応的で人力によるサイバー物理システムの目標と一致している。
論文 参考訳(メタデータ) (2025-04-04T13:11:43Z) - ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.10995326465245926]
本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。
我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。
以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文 参考訳(メタデータ) (2025-03-11T05:39:07Z) - DexHandDiff: Interaction-aware Diffusion Planning for Adaptive Dexterous Manipulation [78.60543357822957]
高度なロボティクスにとって、接触に富んだ相互作用による有害な操作が不可欠である。
DexHandDiffは,適応的デキスタラス操作のための対話型拡散計画フレームワークである。
当社のフレームワークは, 目標適応度の高いタスクにおいて, 平均70.7%の成功率を実現し, コンタクトリッチな操作における堅牢性と柔軟性を強調した。
論文 参考訳(メタデータ) (2024-11-27T18:03:26Z) - Continual Policy Distillation of Reinforcement Learning-based Controllers for Soft Robotic In-Hand Manipulation [5.601529531526852]
ソフトロボットハンドは、物体の握りと操作中に柔軟性と適応性を提供する。
我々は,手動操作のための多目的制御器を取得するための連続ポリシー蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-05T17:05:45Z) - Twisting Lids Off with Two Hands [82.21668778600414]
シミュレーションで訓練された政策を実世界へ効果的かつ効率的に移行する方法を示す。
具体的には,ボトル状物体の蓋を両手でねじる問題について考察する。
これは、バイマガル・マルチフィンガーハンドでそのような機能を実現する最初のsim-to-real RLシステムである。
論文 参考訳(メタデータ) (2024-03-04T18:59:30Z) - Reconfigurable Data Glove for Reconstructing Physical and Virtual Grasps [100.72245315180433]
本研究では,人間の手-物体相互作用の異なるモードを捉えるために,再構成可能なデータグローブの設計を提案する。
グローブは3つのモードで動作し、異なる特徴を持つ様々な下流タスクを実行する。
i)手の動きと関連力を記録し,(ii)VRの操作流速を改善するとともに,(iii)様々なツールの現実的なシミュレーション効果を生み出すことにより,システムの3つのモードを評価する。
論文 参考訳(メタデータ) (2023-01-14T05:35:50Z) - Dexterous Manipulation from Images: Autonomous Real-World RL via Substep
Guidance [71.36749876465618]
本稿では,ユーザが新しいタスクを定義するための"プログラミング不要"なアプローチを提供する,視覚に基づくデクスタラスな操作システムについて述べる。
本システムには,最終タスクと中間タスクを画像例で定義するためのフレームワークが組み込まれている。
実世界における多段階物体操作の4指ロボットハンドラーによる実験結果
論文 参考訳(メタデータ) (2022-12-19T22:50:40Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。