論文の概要: D-Cubed: Latent Diffusion Trajectory Optimisation for Dexterous Deformable Manipulation
- arxiv url: http://arxiv.org/abs/2403.12861v1
- Date: Tue, 19 Mar 2024 16:05:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 13:34:19.964329
- Title: D-Cubed: Latent Diffusion Trajectory Optimisation for Dexterous Deformable Manipulation
- Title(参考訳): D-Cubed:dexterous deformable Manipulationのための遅延拡散軌道最適化
- Authors: Jun Yamada, Shaohong Zhong, Jack Collins, Ingmar Posner,
- Abstract要約: D-Cubedは、タスクに依存しないプレイデータセットからトレーニングされた潜在拡散モデル(LDM)を用いた、新しい軌道最適化手法である。
我々は、D-Cubedが従来の軌道最適化および競争ベースラインアプローチをかなりの差で上回ることを示した。
- 参考スコア(独自算出の注目度): 15.680133621889809
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mastering dexterous robotic manipulation of deformable objects is vital for overcoming the limitations of parallel grippers in real-world applications. Current trajectory optimisation approaches often struggle to solve such tasks due to the large search space and the limited task information available from a cost function. In this work, we propose D-Cubed, a novel trajectory optimisation method using a latent diffusion model (LDM) trained from a task-agnostic play dataset to solve dexterous deformable object manipulation tasks. D-Cubed learns a skill-latent space that encodes short-horizon actions in the play dataset using a VAE and trains a LDM to compose the skill latents into a skill trajectory, representing a long-horizon action trajectory in the dataset. To optimise a trajectory for a target task, we introduce a novel gradient-free guided sampling method that employs the Cross-Entropy method within the reverse diffusion process. In particular, D-Cubed samples a small number of noisy skill trajectories using the LDM for exploration and evaluates the trajectories in simulation. Then, D-Cubed selects the trajectory with the lowest cost for the subsequent reverse process. This effectively explores promising solution areas and optimises the sampled trajectories towards a target task throughout the reverse diffusion process. Through empirical evaluation on a public benchmark of dexterous deformable object manipulation tasks, we demonstrate that D-Cubed outperforms traditional trajectory optimisation and competitive baseline approaches by a significant margin. We further demonstrate that trajectories found by D-Cubed readily transfer to a real-world LEAP hand on a folding task.
- Abstract(参考訳): 現実の応用において、並列グリップの限界を克服するためには、変形可能な物体の巧妙なロボット操作をマスターすることが不可欠である。
現在の軌道最適化アプローチは、大きな探索空間とコスト関数から利用可能な限られたタスク情報のために、そのような課題を解決するのに苦労することが多い。
本研究では,タスクに依存しないプレイデータセットから学習した潜在拡散モデル(LDM)を用いて,デクスタラスな変形可能なオブジェクト操作タスクを解決する新しい軌道最適化手法であるD-Cubedを提案する。
D-Cubedは、VAEを使用してプレイデータセット内の短水平動作を符号化するスキルラテント空間を学び、LDMを使用してスキルラテントをスキルトラジェクトリに構成し、データセット内の長水平アクショントラジェクトリを表現する。
対象タスクの軌道を最適化するために、逆拡散過程においてクロスエントロピー法を用いる新しい勾配のないガイド付きサンプリング法を導入する。
特に, D-Cubed は, LDM を用いて少数の雑音性スキルトラジェクトリをサンプリングし, シミュレーションにおけるトラジェクトリの評価を行う。
そして、D-Cubedは、後続の逆過程の最小コストで軌道を選択する。
これは有望な解領域を効果的に探索し、逆拡散過程を通じてサンプル軌跡を目標タスクに最適化する。
D-Cubed が従来の軌道最適化および競争ベースラインアプローチよりも有意な差で優れていることを示す。
さらに、D-Cubedによって発見された軌道は、折りたたみ作業で現実世界のLEAPハンドに容易に移動できることを実証する。
関連論文リスト
- TraDiffusion: Trajectory-Based Training-Free Image Generation [85.39724878576584]
そこで我々は,TraDiffusion(トラディフュージョン)と呼ばれる,訓練のないトラジェクトリベースの制御可能なT2Iアプローチを提案する。
この手法により、マウスの軌跡を通した画像生成を無駄にガイドすることができる。
論文 参考訳(メタデータ) (2024-08-19T07:01:43Z) - TrajCogn: Leveraging LLMs for Cognizing Movement Patterns and Travel Purposes from Trajectories [24.44686757572976]
S時間軌道は様々なデータマイニング作業において重要である。
異なるタスクを高精度に行う多目的軌跡学習法を開発することが重要である。
モデルキャパシティの制限と、トラジェクトリデータセットの品質とスケールのため、これは難しい。
論文 参考訳(メタデータ) (2024-05-21T02:33:17Z) - Diffusion-ES: Gradient-free Planning with Diffusion for Autonomous Driving and Zero-Shot Instruction Following [21.81411085058986]
Reward-gradient guided denoisingは、微分可能報酬関数と拡散モデルによって捕捉されたデータ分布下での確率の両方を最大化する軌道を生成する。
そこで我々は,勾配のない最適化と軌道デノゲーションを組み合わせたDiffusionESを提案する。
DiffusionESは、自動運転のための確立されたクローズドループ計画ベンチマークであるnuPlan上で、最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-02-09T17:18:33Z) - Unsupervised Discovery of Interpretable Directions in h-space of
Pre-trained Diffusion Models [63.1637853118899]
本稿では,事前学習した拡散モデルのh空間における解釈可能な方向を特定するための,教師なしおよび学習に基づく最初の手法を提案する。
我々は、事前訓練された拡散モデルのh-スペースで動作するシフト制御モジュールを用いて、サンプルをシフトしたバージョンに操作する。
それらを共同で最適化することで、モデルは自然に絡み合った、解釈可能な方向を発見する。
論文 参考訳(メタデータ) (2023-10-15T18:44:30Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - Learning Representative Trajectories of Dynamical Systems via
Domain-Adaptive Imitation [0.0]
ドメイン適応軌道模倣のための深層強化学習エージェントDATIを提案する。
実験の結果,DATIは模擬学習と最適制御のベースライン手法よりも優れていることがわかった。
実世界のシナリオへの一般化は、海上交通における異常な動きパターンの発見を通じて示される。
論文 参考訳(メタデータ) (2023-04-19T15:53:48Z) - DiffSkill: Skill Abstraction from Differentiable Physics for Deformable
Object Manipulations with Tools [96.38972082580294]
DiffSkillは、変形可能なオブジェクト操作タスクを解決するために、スキル抽象化に微分可能な物理シミュレータを使用する新しいフレームワークである。
特に、勾配に基づくシミュレーターから個々のツールを用いて、まず短距離のスキルを得る。
次に、RGBD画像を入力として取り込む実演軌跡から、ニューラルネットワークの抽象体を学習する。
論文 参考訳(メタデータ) (2022-03-31T17:59:38Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - Continuous Transition: Improving Sample Efficiency for Continuous
Control Problems via MixUp [119.69304125647785]
本稿では,連続的遷移を構築するための簡潔かつ強力な手法を提案する。
具体的には、連続的な遷移を線形に補間することにより、トレーニングのための新しい遷移を合成することを提案する。
また, 建設過程を自動案内する判別器を開発した。
論文 参考訳(メタデータ) (2020-11-30T01:20:23Z) - Imitative Planning using Conditional Normalizing Flow [2.8978926857710263]
自律走行車のための動的な都市シナリオにおける軌道計画の一般的な方法は、明確に特定され手作業によるコスト関数に依存することである。
自律走行車(AV)の軌道計画性能向上のための正規化フローの適用について検討する。
軌道プランナーのコスト多様体をエネルギー関数としてモデル化することにより、AV制御空間上のボルツマン分布以前のシーン条件付き写像を学習する。
論文 参考訳(メタデータ) (2020-07-31T16:32:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。