論文の概要: STAMP: Differentiable Task and Motion Planning via Stein Variational Gradient Descent
- arxiv url: http://arxiv.org/abs/2310.01775v4
- Date: Sun, 29 Sep 2024 04:43:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 21:59:14.920849
- Title: STAMP: Differentiable Task and Motion Planning via Stein Variational Gradient Descent
- Title(参考訳): STAMP: 定常変分勾配線による可変タスクと運動計画
- Authors: Yewon Lee, Andrew Z. Li, Philip Huang, Eric Heiden, Krishna Murthy Jatavallabhula, Fabian Damken, Kevin Smith, Derek Nowrouzezahrai, Fabio Ramos, Florian Shkurti,
- Abstract要約: シーケンシャルなロボティクスタスクの計画には、しばしば記号的および幾何学的推論を必要とする。
TAMPアルゴリズムは、運動学的および動的実現可能性を確認しながら、高レベルのタスクシーケンス上でツリーサーチを実行することで、これらの問題を解決するのが一般的である。
本稿では,ハイブリッド最適化問題を連続領域に緩和するSTAMP(Stein Task and Motion Planning)という新しいTAMP手法を提案する。
- 参考スコア(独自算出の注目度): 35.96763689715956
- License:
- Abstract: Planning for sequential robotics tasks often requires integrated symbolic and geometric reasoning. TAMP algorithms typically solve these problems by performing a tree search over high-level task sequences while checking for kinematic and dynamic feasibility. This can be inefficient because, typically, candidate task plans resulting from the tree search ignore geometric information. This often leads to motion planning failures that require expensive backtracking steps to find alternative task plans. We propose a novel approach to TAMP called Stein Task and Motion Planning (STAMP) that relaxes the hybrid optimization problem into a continuous domain. This allows us to leverage gradients from differentiable physics simulation to fully optimize discrete and continuous plan parameters for TAMP. In particular, we solve the optimization problem using a gradient-based variational inference algorithm called Stein Variational Gradient Descent. This allows us to find a distribution of solutions within a single optimization run. Furthermore, we use an off-the-shelf differentiable physics simulator that is parallelized on the GPU to run parallelized inference over diverse plan parameters. We demonstrate our method on a variety of problems and show that it can find multiple diverse plans in a single optimization run while also being significantly faster than existing approaches.
- Abstract(参考訳): シーケンシャルなロボティクスタスクの計画には、しばしば記号的および幾何学的推論を必要とする。
TAMPアルゴリズムは、運動学的および動的実現可能性を確認しながら、高レベルのタスクシーケンス上でツリーサーチを実行することで、これらの問題を解決するのが一般的である。
これは、通常、ツリー探索による候補タスク計画が幾何学的情報を無視しているため、非効率である可能性がある。
これはしばしば、別のタスク計画を見つけるために高価なバックトラックステップを必要とする動作計画の失敗につながる。
本稿では,ハイブリッド最適化問題を連続領域に緩和するSTAMP(Stein Task and Motion Planning)という新しいTAMP手法を提案する。
これにより、微分可能な物理シミュレーションの勾配を利用して、TAMPの離散的かつ連続的な計画パラメータを完全に最適化することができる。
特に、勾配に基づく変分推定アルゴリズム(Stein Variational Gradient Descent)を用いて最適化問題を解く。
これにより、単一の最適化実行内でソリューションの分布を見つけることができます。
さらに、GPU上で並列化され、多様な計画パラメータ上で並列化推論を実行する、オフザシェルフ微分可能な物理シミュレータを使用する。
提案手法は様々な問題に対して実証し,既存の手法よりもはるかに高速でありながら,単一最適化の実行時に複数の多様な計画を見出すことができることを示す。
関連論文リスト
- Parametric-Task MAP-Elites [3.499042782396682]
Parametric-Task MAP-Elites (PT-ME) は連続マルチタスク最適化問題に対する新しいブラックボックスアルゴリズムである。
PT-ME は2つのパラメトリックタスクの玩具問題に対する深層強化学習アルゴリズム PPO やシミュレーションにおけるロボット問題など,すべてのベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2024-02-02T10:04:29Z) - Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文 参考訳(メタデータ) (2023-10-06T16:36:08Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [36.300564378022315]
本稿では,移動環境における移動操作問題を解決するための学習可能なタスク・アンド・モーション・プランニング(TAMP)アルゴリズムを提案する。
本アルゴリズムのコアは,タスク計画,目標,初期状態を考慮したトランスフォーマーに基づく新しい学習手法であるPIGINetであり,タスク計画に関連する運動軌跡の発見確率を予測する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - A heuristic method for data allocation and task scheduling on
heterogeneous multiprocessor systems under memory constraints [14.681986126866452]
本稿では,メモリ制約下でのデータ割り当てとタスクスケジューリングの問題に焦点をあてる。
本稿では,いくつかの特徴を組み合わせたタブ探索アルゴリズムを提案する。
実験により,提案アルゴリズムは比較的高品質な解を妥当な計算時間で得られることを示した。
論文 参考訳(メタデータ) (2022-05-09T10:46:08Z) - On Steering Multi-Annotations per Sample for Multi-Task Learning [79.98259057711044]
マルチタスク学習の研究はコミュニティから大きな注目を集めている。
目覚ましい進歩にもかかわらず、異なるタスクを同時に学習するという課題はまだ検討されていない。
従来の研究は、異なるタスクから勾配を修正しようとするが、これらの手法はタスク間の関係の主観的な仮定を与え、修正された勾配はより正確でないかもしれない。
本稿では,タスク割り当てアプローチによってこの問題に対処する機構であるタスク割当(STA)を紹介し,各サンプルをランダムにタスクのサブセットに割り当てる。
さらなる進展のために、我々は全てのタスクを反復的に割り当てるためにInterleaved Task Allocation(ISTA)を提案する。
論文 参考訳(メタデータ) (2022-03-06T11:57:18Z) - Solving Sparse Linear Inverse Problems in Communication Systems: A Deep
Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。
提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文 参考訳(メタデータ) (2020-10-29T06:32:53Z) - Integrated Task and Motion Planning [30.415785183398334]
多数の物体を含む環境下で動作するロボットの計画はタスク・アンド・モーション・プランニング(TAMP)として知られている。
TAMP問題には、離散的なタスク計画、離散連続的な数学的計画、連続的な動き計画といった要素が含まれており、これらの分野のどれからも効果的に対処することはできない。
本稿では、連続空間のサブプロブレムを解くための手法と、探索の離散的かつ連続的なコンポーネントを統合する手法の観点から、TAMP問題のクラスを定義し、解法を特徴付ける。
論文 参考訳(メタデータ) (2020-10-02T16:23:08Z) - Flexible and Efficient Long-Range Planning Through Curious Exploration [13.260508939271764]
The Curious Sample Planner can realize temporallyextended plan for a wide range of really 3D task。
対照的に、標準的な計画と学習の方法は、多くの場合、これらのタスクを全く解決しなかったり、膨大な数のトレーニングサンプルでのみ実行できなかったりします。
論文 参考訳(メタデータ) (2020-04-22T21:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。