論文の概要: STAMP: Differentiable Task and Motion Planning via Stein Variational
Gradient Descent
- arxiv url: http://arxiv.org/abs/2310.01775v1
- Date: Tue, 3 Oct 2023 03:53:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 17:47:54.092571
- Title: STAMP: Differentiable Task and Motion Planning via Stein Variational
Gradient Descent
- Title(参考訳): stamp:stein変分勾配降下による微分可能タスクと動作計画
- Authors: Yewon Lee (1), Philip Huang (2), Krishna Murthy Jatavallabhula (3),
Andrew Z. Li (1), Fabian Damken (1 and 4), Eric Heiden (5), Kevin Smith (3),
Derek Nowrouzezahrai (6), Fabio Ramos (5 and 7), Florian Shkurti (1) ((1)
University of Toronto, (2) Carnegie Mellon University, (3) Massachusetts
Institute of Technology, (4) Technische Universitat Darmstadt, (5) NVIDIA,
(6) McGill University, (7) University of Sydney)
- Abstract要約: 道具の使用や部品の組み立てなど、多くの操作タスクの計画には、記号的および幾何学的推論が必要であることが多い。
タスク・アンド・モーション・プランニング(TAMP)アルゴリズムは通常、高レベルのタスク・シーケンスを木探索することでこれらの問題を解決する。
本稿では,並列化と微分可能シミュレーションを利用して,多種多様な計画の効率的な探索を行う,Stin Task and Motion Planning (STAMP) という新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.25668095234757676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Planning for many manipulation tasks, such as using tools or assembling
parts, often requires both symbolic and geometric reasoning. Task and Motion
Planning (TAMP) algorithms typically solve these problems by conducting a tree
search over high-level task sequences while checking for kinematic and dynamic
feasibility. While performant, most existing algorithms are highly inefficient
as their time complexity grows exponentially with the number of possible
actions and objects. Additionally, they only find a single solution to problems
in which many feasible plans may exist. To address these limitations, we
propose a novel algorithm called Stein Task and Motion Planning (STAMP) that
leverages parallelization and differentiable simulation to efficiently search
for multiple diverse plans. STAMP relaxes discrete-and-continuous TAMP problems
into continuous optimization problems that can be solved using variational
inference. Our algorithm builds upon Stein Variational Gradient Descent, a
gradient-based variational inference algorithm, and parallelized differentiable
physics simulators on the GPU to efficiently obtain gradients for inference.
Further, we employ imitation learning to introduce action abstractions that
reduce the inference problem to lower dimensions. We demonstrate our method on
two TAMP problems and empirically show that STAMP is able to: 1) produce
multiple diverse plans in parallel; and 2) search for plans more efficiently
compared to existing TAMP baselines.
- Abstract(参考訳): ツールの使用や部品の組み立てなど、多くの操作タスクの計画には、しばしば象徴的および幾何学的推論が必要である。
タスク・アンド・モーション・プランニング (tamp) アルゴリズムは通常、高レベルなタスクシーケンス上で木探索を行い、キネマティックかつダイナミックな実行可能性をチェックすることでこれらの問題を解決する。
パフォーマンスは高いが、既存のアルゴリズムの多くは、時間複雑性が可能なアクションやオブジェクトの数で指数関数的に増加するため、非常に非効率である。
さらに、実現可能な多くの計画が存在するかもしれない問題に対する単一の解決策しか見つからない。
これらの制約に対処するために,並列化と微分可能シミュレーションを利用したstein task and motion planning (stamp) と呼ばれる新しいアルゴリズムを提案する。
STAMPは離散的かつ連続的なTAMP問題を、変分推論を用いて解決できる連続最適化問題に緩和する。
このアルゴリズムは、勾配に基づく変分推論アルゴリズムであるStein Variational Gradient Descentと、GPU上の並列化微分可能な物理シミュレータに基づいて、推論の勾配を効率的に取得する。
さらに, 模倣学習を用いて, 推論問題を少ない次元に還元する動作抽象化を導入する。
2つのTAMP問題に対して本手法を実証し,STAMPが可能であることを示す。
1) 複数の多様な計画が並行して作成され
2)既存のTAMPベースラインよりも効率的に計画の探索を行う。
関連論文リスト
- Parametric-Task MAP-Elites [3.499042782396682]
Parametric-Task MAP-Elites (PT-ME) は連続マルチタスク最適化問題に対する新しいブラックボックスアルゴリズムである。
PT-ME は2つのパラメトリックタスクの玩具問題に対する深層強化学習アルゴリズム PPO やシミュレーションにおけるロボット問題など,すべてのベースラインより優れていることを示す。
論文 参考訳(メタデータ) (2024-02-02T10:04:29Z) - Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文 参考訳(メタデータ) (2023-10-06T16:36:08Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [36.300564378022315]
本稿では,移動環境における移動操作問題を解決するための学習可能なタスク・アンド・モーション・プランニング(TAMP)アルゴリズムを提案する。
本アルゴリズムのコアは,タスク計画,目標,初期状態を考慮したトランスフォーマーに基づく新しい学習手法であるPIGINetであり,タスク計画に関連する運動軌跡の発見確率を予測する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - A heuristic method for data allocation and task scheduling on
heterogeneous multiprocessor systems under memory constraints [14.681986126866452]
本稿では,メモリ制約下でのデータ割り当てとタスクスケジューリングの問題に焦点をあてる。
本稿では,いくつかの特徴を組み合わせたタブ探索アルゴリズムを提案する。
実験により,提案アルゴリズムは比較的高品質な解を妥当な計算時間で得られることを示した。
論文 参考訳(メタデータ) (2022-05-09T10:46:08Z) - On Steering Multi-Annotations per Sample for Multi-Task Learning [79.98259057711044]
マルチタスク学習の研究はコミュニティから大きな注目を集めている。
目覚ましい進歩にもかかわらず、異なるタスクを同時に学習するという課題はまだ検討されていない。
従来の研究は、異なるタスクから勾配を修正しようとするが、これらの手法はタスク間の関係の主観的な仮定を与え、修正された勾配はより正確でないかもしれない。
本稿では,タスク割り当てアプローチによってこの問題に対処する機構であるタスク割当(STA)を紹介し,各サンプルをランダムにタスクのサブセットに割り当てる。
さらなる進展のために、我々は全てのタスクを反復的に割り当てるためにInterleaved Task Allocation(ISTA)を提案する。
論文 参考訳(メタデータ) (2022-03-06T11:57:18Z) - Solving Sparse Linear Inverse Problems in Communication Systems: A Deep
Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。
提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文 参考訳(メタデータ) (2020-10-29T06:32:53Z) - Integrated Task and Motion Planning [30.415785183398334]
多数の物体を含む環境下で動作するロボットの計画はタスク・アンド・モーション・プランニング(TAMP)として知られている。
TAMP問題には、離散的なタスク計画、離散連続的な数学的計画、連続的な動き計画といった要素が含まれており、これらの分野のどれからも効果的に対処することはできない。
本稿では、連続空間のサブプロブレムを解くための手法と、探索の離散的かつ連続的なコンポーネントを統合する手法の観点から、TAMP問題のクラスを定義し、解法を特徴付ける。
論文 参考訳(メタデータ) (2020-10-02T16:23:08Z) - Flexible and Efficient Long-Range Planning Through Curious Exploration [13.260508939271764]
The Curious Sample Planner can realize temporallyextended plan for a wide range of really 3D task。
対照的に、標準的な計画と学習の方法は、多くの場合、これらのタスクを全く解決しなかったり、膨大な数のトレーニングサンプルでのみ実行できなかったりします。
論文 参考訳(メタデータ) (2020-04-22T21:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。