論文の概要: Dexterous Manipulation Based on Prior Dexterous Grasp Pose Knowledge
- arxiv url: http://arxiv.org/abs/2412.15587v1
- Date: Fri, 20 Dec 2024 05:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-23 16:19:50.883377
- Title: Dexterous Manipulation Based on Prior Dexterous Grasp Pose Knowledge
- Title(参考訳): プレデクサスグラフの知識に基づくデクサス操作
- Authors: Hengxu Yan, Haoshu Fang, Cewu Lu,
- Abstract要約: そこで本稿では,事前のきめ細やかな知識を活用して,効率と精度を両立させる新しい強化学習手法を提案する。
実験の結果,4つのタスクで学習効率と成功率が大きく向上した。
- 参考スコア(独自算出の注目度): 55.1299081537782
- License:
- Abstract: Dexterous manipulation has received considerable attention in recent research. Predominantly, existing studies have concentrated on reinforcement learning methods to address the substantial degrees of freedom in hand movements. Nonetheless, these methods typically suffer from low efficiency and accuracy. In this work, we introduce a novel reinforcement learning approach that leverages prior dexterous grasp pose knowledge to enhance both efficiency and accuracy. Unlike previous work, they always make the robotic hand go with a fixed dexterous grasp pose, We decouple the manipulation process into two distinct phases: initially, we generate a dexterous grasp pose targeting the functional part of the object; after that, we employ reinforcement learning to comprehensively explore the environment. Our findings suggest that the majority of learning time is expended in identifying the appropriate initial position and selecting the optimal manipulation viewpoint. Experimental results demonstrate significant improvements in learning efficiency and success rates across four distinct tasks.
- Abstract(参考訳): 有害な操作は最近の研究でかなりの注目を集めている。
既存の研究では、手の動きのかなりの自由度に対処する強化学習法に重点を置いている。
しかしながら、これらの手法は一般的に低い効率と精度に悩まされる。
そこで本研究では,事前の巧妙な把握が持つ知識を活用して,効率と精度を両立させる新しい強化学習手法を提案する。
我々は、操作プロセスを2つの異なるフェーズに分離する: まず、対象の機能を対象とするデクスタラスなグリップポーズを生成し、その後、環境を包括的に探索するために強化学習を採用する。
その結果,学習時間の大部分が適切な初期位置の同定と最適操作視点の選択に費やされていることが示唆された。
実験の結果,4つのタスクで学習効率と成功率が大きく向上した。
関連論文リスト
- SPIRE: Synergistic Planning, Imitation, and Reinforcement Learning for Long-Horizon Manipulation [58.14969377419633]
タスクをより小さな学習サブプロブレムに分解し、第2に模倣と強化学習を組み合わせてその強みを最大化するシステムであるspireを提案する。
我々は、模倣学習、強化学習、計画を統合する従来の手法よりも平均タスク性能が35%から50%向上していることを発見した。
論文 参考訳(メタデータ) (2024-10-23T17:42:07Z) - Curriculum Is More Influential Than Haptic Information During Reinforcement Learning of Object Manipulation Against Gravity [0.0]
指先で物体を持ち上げて回転させる学習は、自律的な手動操作に必要である。
そこで我々は,カリキュラム学習と触覚フィードバックが創発的操作の学習に果たす役割について検討した。
論文 参考訳(メタデータ) (2024-07-13T19:23:11Z) - Exploring CausalWorld: Enhancing robotic manipulation via knowledge transfer and curriculum learning [6.683222869973898]
本研究では,指間の複雑な動きと協調を必要とする,学習に基づく三指ロボットアーム操作タスクについて検討する。
強化学習を利用することで、エージェントに熟練した操作に必要なスキルを習得するよう訓練する。
微調整とカリキュラム学習という2つの知識伝達戦略を,ソフトアクター・クリティカルなアーキテクチャで活用した。
論文 参考訳(メタデータ) (2024-03-25T23:19:19Z) - A Self-supervised Contrastive Learning Method for Grasp Outcomes
Prediction [9.865029065814236]
比較学習法は,結果予測の把握に有効であることを示す。
本研究は,ロボットグルーピング分野への応用において,コントラスト学習手法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-06-26T06:06:49Z) - Basis for Intentions: Efficient Inverse Reinforcement Learning using
Past Experience [89.30876995059168]
逆強化学習(IRL) - エージェントの報酬関数をその振る舞いを観察することから推測する。
本稿では、エージェントの報酬関数を観察することのできないIRLの問題に対処する。
論文 参考訳(メタデータ) (2022-08-09T17:29:49Z) - DIODE: Dilatable Incremental Object Detection [15.59425584971872]
従来のディープラーニングモデルには、以前に学習した知識を保存する能力がない。
多段階インクリメンタル検出タスクのための拡張可能なインクリメンタルオブジェクト検出器(DIODE)を提案する。
提案手法は,新たに学習した各タスクのパラメータ数を1.2%増加させることで,最大6.4%の性能向上を実現する。
論文 参考訳(メタデータ) (2021-08-12T09:45:57Z) - Automated Deepfake Detection [19.17617301462919]
本稿では,Deepfake検出のためのアーキテクチャを自動検索する機械学習を提案する。
提案手法が従来の非深度学習法より優れているだけでなく,予測精度が向上することが実験的に証明された。
論文 参考訳(メタデータ) (2021-06-20T14:48:50Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - Self-supervised Knowledge Distillation for Few-shot Learning [123.10294801296926]
少数のサンプルだけで秩序分布から素早く学習できるため、ショットラーニングは有望な学習パラダイムである。
数ショットの学習タスクにおいて,深層ニューラルネットワークの表現能力を向上させるための簡単な手法を提案する。
実験により、第一段階においても、自己超越は現在の最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-06-17T11:27:00Z) - Understanding the Role of Training Regimes in Continual Learning [51.32945003239048]
破滅的な忘れは、ニューラルネットワークのトレーニングに影響を与え、複数のタスクを逐次学習する能力を制限する。
本研究では,タスクの局所的なミニマを拡大するトレーニング体制の形成に及ぼすドロップアウト,学習速度の低下,バッチサイズの影響について検討した。
論文 参考訳(メタデータ) (2020-06-12T06:00:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。