論文の概要: DexDLO: Learning Goal-Conditioned Dexterous Policy for Dynamic
Manipulation of Deformable Linear Objects
- arxiv url: http://arxiv.org/abs/2312.15204v1
- Date: Sat, 23 Dec 2023 09:26:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 19:13:53.209346
- Title: DexDLO: Learning Goal-Conditioned Dexterous Policy for Dynamic
Manipulation of Deformable Linear Objects
- Title(参考訳): DexDLO: 変形可能な線形物体の動的操作のためのゴール条件付きデクサラスポリシーの学習
- Authors: Sun Zhaole, Jihong Zhu, Robert B. Fisher
- Abstract要約: 変形可能な線形オブジェクトに対するデキスタラス動的操作ポリシーを固定ベースデキスタラスハンドで学習するモデルフリーフレームワークであるDexDLOを提案する。
我々は,同じフレームワークパラメータで5つの異なるDLO操作タスクを効率的に学習できることを示す。
- 参考スコア(独自算出の注目度): 7.72979328949568
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deformable linear object (DLO) manipulation is needed in many fields.
Previous research on deformable linear object (DLO) manipulation has primarily
involved parallel jaw gripper manipulation with fixed grasping positions.
However, the potential for dexterous manipulation of DLOs using an
anthropomorphic hand is under-explored. We present DexDLO, a model-free
framework that learns dexterous dynamic manipulation policies for deformable
linear objects with a fixed-base dexterous hand in an end-to-end way. By
abstracting several common DLO manipulation tasks into goal-conditioned tasks,
our DexDLO can perform these tasks, such as DLO grabbing, DLO pulling, DLO
end-tip position controlling, etc. Using the Mujoco physics simulator, we
demonstrate that our framework can efficiently and effectively learn five
different DLO manipulation tasks with the same framework parameters. We further
provide a thorough analysis of learned policies, reward functions, and reduced
observations for a comprehensive understanding of the framework.
- Abstract(参考訳): 多くの分野において変形可能な線形オブジェクト (DLO) 操作が必要である。
変形可能なリニアオブジェクト(DLO)の操作に関するこれまでの研究は、主に固定的な把持位置を持つ平行な顎グリップ操作に関わっている。
しかし, 人為的手を用いたDLOの創発的操作の可能性は未解明である。
変形可能な線形オブジェクトに対するデクスタブルな動的操作ポリシーをエンド・ツー・エンドで学習するモデルフリーなフレームワークであるdexdloを提案する。
いくつかの共通DLO操作タスクを目標条件のタスクに抽象化することで、DLOグラブ、DLOプル、DLOエンドチップ位置制御など、これらのタスクを実行できます。
我々は,Mujoco物理シミュレータを用いて,同一のフレームワークパラメータで5つの異なるDLO操作タスクを効率よく,効果的に学習できることを実証した。
さらに,学習方針の徹底的な分析,報酬機能,フレームワークの包括的理解のための観察の削減も提供する。
関連論文リスト
- MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - Modulating Reservoir Dynamics via Reinforcement Learning for Efficient Robot Skill Synthesis [0.0]
貯水池と呼ばれるランダムなリカレントニューラルネットワークは、コンテキスト入力で条件付けられたロボットの動きを学習するために使用することができる。
本稿では,新しいRCベースのLearning from Demonstration(LfD)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-17T07:25:54Z) - Deep Learning for Koopman-based Dynamic Movement Primitives [0.0]
実証から学ぶために,クープマン演算子と動的運動プリミティブの理論を結合して新しいアプローチを提案する。
我々のアプローチは glsadmd と呼ばれ、非線形力学系を線形潜在空間に射影し、解が所望の複素運動を再現する。
我々の結果は、LASAハンドライトデータセット上の拡張動的モード分解に匹敵するが、わずかな文字のトレーニングしか行わない。
論文 参考訳(メタデータ) (2023-12-06T07:33:22Z) - Learning Quasi-Static 3D Models of Markerless Deformable Linear Objects
for Bimanual Robotic Manipulation [6.212335606641129]
本稿では,変形可能な線形物体(DLO)の学習に基づく3次元モデルについて解析する。
本稿では,異なる長さのDLOであっても高い精度を実現するトランスフォーマーアーキテクチャに基づく新しい手法を提案する。
また、ほぼすべてのDLOデータ駆動モデルの予測性能を向上させるデータ拡張手法も導入する。
論文 参考訳(メタデータ) (2023-09-14T11:17:43Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z) - DLOFTBs -- Fast Tracking of Deformable Linear Objects with B-splines [1.3836565669337055]
本稿では,マスク画像に基づいてDLOの形状を高速に追跡するアルゴリズムを提案する。
実験の結果,DLOの形状復元精度とアルゴリズム実行時間において,我々の解は現状のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2023-02-27T11:54:04Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Visual Foresight With a Local Dynamics Model [1.370633147306388]
単一ステップ操作プリミティブのための状態遷移関数を効率的に学習するローカルダイナミクスモデル(LDM)を提案する。
LDMとモデルフリーなポリシー学習を組み合わせることで、ワンステップのルックアヘッド計画を用いて複雑な操作タスクを解くことができるポリシーを学ぶことができる。
論文 参考訳(メタデータ) (2022-06-29T17:58:14Z) - Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and
Heuristic Rule-based Methods for Object Manipulation [118.27432851053335]
本稿では,SAPIEN ManiSkill Challenge 2021: No Interaction Trackにおいて,以下の2つのトラックを対象としたシステムの概要と比較分析を行った。
No Interactionは、事前に収集された実証軌道からの学習ポリシーのターゲットを追跡する。
このトラックでは,タスクを一連のサブタスクに分解することで,高品質なオブジェクト操作をトリガするHuristic Rule-based Method (HRM) を設計する。
各サブタスクに対して、ロボットアームに適用可能なアクションを予測するために、単純なルールベースの制御戦略が採用されている。
論文 参考訳(メタデータ) (2022-06-13T16:20:42Z) - Learning Multi-Objective Curricula for Deep Reinforcement Learning [55.27879754113767]
深部強化学習(DRL)のサンプル効率と最終性能を向上させるために,各種自動カリキュラム学習(ACL)手法が提案されている。
本稿では,多目的だがコヒーレントなカリキュラムを作成するための統合された自動カリキュラム学習フレームワークを提案する。
既存の手設計のカリキュラムパラダイムに加えて,抽象カリキュラムを学習するためのフレキシブルなメモリ機構を設計する。
論文 参考訳(メタデータ) (2021-10-06T19:30:25Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。