論文の概要: DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools
- arxiv url: http://arxiv.org/abs/2203.17275v1
- Date: Thu, 31 Mar 2022 17:59:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-01 15:39:08.400419
- Title: DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools
- Title(参考訳): DiffSkill: ツールによる変形可能なオブジェクト操作のための微分物理学からのスキル抽象化
- Authors: Xingyu Lin, Zhiao Huang, Yunzhu Li, Joshua B. Tenenbaum, David Held,
Chuang Gan
- Abstract要約: DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
- 参考スコア(独自算出の注目度): 96.38972082580294
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We consider the problem of sequential robotic manipulation of deformable
objects using tools. Previous works have shown that differentiable physics
simulators provide gradients to the environment state and help trajectory
optimization to converge orders of magnitude faster than model-free
reinforcement learning algorithms for deformable object manipulation. However,
such gradient-based trajectory optimization typically requires access to the
full simulator states and can only solve short-horizon, single-skill tasks due
to local optima. In this work, we propose a novel framework, named DiffSkill,
that uses a differentiable physics simulator for skill abstraction to solve
long-horizon deformable object manipulation tasks from sensory observations. In
particular, we first obtain short-horizon skills using individual tools from a
gradient-based optimizer, using the full state information in a differentiable
simulator; we then learn a neural skill abstractor from the demonstration
trajectories which takes RGBD images as input. Finally, we plan over the skills
by finding the intermediate goals and then solve long-horizon tasks. We show
the advantages of our method in a new set of sequential deformable object
manipulation tasks compared to previous reinforcement learning algorithms and
compared to the trajectory optimizer.
- Abstract(参考訳): ツールを用いた変形可能な物体の逐次ロボット操作の問題点を考察する。
従来の研究では、微分可能な物理シミュレータが環境状態の勾配を提供し、変形可能なオブジェクト操作のためのモデルなし強化学習アルゴリズムよりもはるかに高速に軌道の最適化を支援することが示されている。
しかし、勾配に基づく軌道最適化は通常、完全なシミュレータ状態へのアクセスを必要とし、局所最適による短水平単スキルタスクのみを解くことができる。
そこで本研究では,技術抽象化のための微分可能な物理シミュレータを用いて,知覚観察から長方形変形可能な物体操作タスクを解決するための新しいフレームワークdiffskillを提案する。
特に,微分可能シミュレータの完全な状態情報を用いて,勾配に基づくオプティマイザから個々のツールを用いて,まず短距離スキルを取得し,次にRGBD画像を入力とする実演軌跡からニューラルスキル抽象体を学習する。
最後に、中間目標を見つけ、それから長距離タスクを解くことで、スキルを計画する。
本手法は,従来の強化学習アルゴリズムと比較し,軌道オプティマイザと比較して,逐次変形可能なオブジェクト操作タスクの利点を示す。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - DiffVL: Scaling Up Soft Body Manipulation using Vision-Language Driven
Differentiable Physics [69.6158232150048]
DiffVLは、非専門家がソフトボディ操作タスクをコミュニケーションできるようにする手法である。
大規模言語モデルを用いてタスク記述を機械解釈可能な最適化対象に翻訳する。
論文 参考訳(メタデータ) (2023-12-11T14:29:25Z) - Imitation Learning via Differentiable Physics [26.356669151969953]
逆強化学習(IRL)のような模倣学習(IL)の手法は通常、ダブルループトレーニングプロセスを持つ。
両ループ設計を廃止した新しいIL法,すなわち、微分可能物理学によるImitation Learningを提案する。
ILDは最終性能、収束速度、安定性の大幅な改善を実現している。
論文 参考訳(メタデータ) (2022-06-10T04:54:32Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - DiffCloud: Real-to-Sim from Point Clouds with Differentiable Simulation
and Rendering of Deformable Objects [18.266002992029716]
変形可能な物体の操作に関する研究は、典型的には限られたシナリオで行われている。
様々な種類の変形と相互作用をサポートする現実的なシミュレータは、実験をスピードアップする可能性がある。
高度に変形可能なオブジェクトに対しては、シミュレータの出力と実際のオブジェクトの振る舞いを一致させることが困難である。
論文 参考訳(メタデータ) (2022-04-07T00:45:26Z) - Physical Design using Differentiable Learned Simulators [9.380022457753938]
逆設計では、学習したフォワードシミュレータは勾配に基づく設計最適化と組み合わせられる。
この枠組みは数百歩の軌跡を伝播することで高品質な設計を行う。
この結果から,機械学習をベースとしたシミュレータは,いくつかの課題があるにもかかわらず,汎用設計の最適化をサポートできる段階まで成熟していることが示唆された。
論文 参考訳(メタデータ) (2022-02-01T19:56:39Z) - Efficient Differentiable Simulation of Articulated Bodies [89.64118042429287]
本稿では, 音素の効率的な微分可能シミュレーション法を提案する。
これにより、ボディダイナミクスを深層学習フレームワークに統合することが可能になる。
提案手法を用いて, 調音システムによる強化学習を高速化できることを示す。
論文 参考訳(メタデータ) (2021-09-16T04:48:13Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。