論文の概要: DiMSam: Diffusion Models as Samplers for Task and Motion Planning under
Partial Observability
- arxiv url: http://arxiv.org/abs/2306.13196v2
- Date: Tue, 3 Oct 2023 23:52:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 18:31:16.026565
- Title: DiMSam: Diffusion Models as Samplers for Task and Motion Planning under
Partial Observability
- Title(参考訳): DiMSam:部分観測可能性下における作業計画用サンプリング器としての拡散モデル
- Authors: Xiaolin Fang, Caelan Reed Garrett, Clemens Eppner, Tom\'as
Lozano-P\'erez, Leslie Pack Kaelbling, Dieter Fox
- Abstract要約: タスク・アンド・モーション・プランニング(TAMP)アプローチは、長距離自律ロボット操作の計画に有効である。
本稿では,これらの制約を深層生成モデルを用いて克服することを提案する。
古典的TAMP, 生成学習, 潜伏埋め込みの組み合わせが, 長期的制約に基づく推論にどのように役立つかを示す。
- 参考スコア(独自算出の注目度): 50.38132214102161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task and Motion Planning (TAMP) approaches are effective at planning
long-horizon autonomous robot manipulation. However, it can be difficult to
apply them to domains where the environment and its dynamics are not fully
known. We propose to overcome these limitations by leveraging deep generative
modeling, specifically diffusion models, to learn constraints and samplers that
capture these difficult-to-engineer aspects of the planning model. These
learned samplers are composed and combined within a TAMP solver in order to
find action parameter values jointly that satisfy the constraints along a plan.
To tractably make predictions for unseen objects in the environment, we define
these samplers on low-dimensional learned latent embeddings of changing object
state. We evaluate our approach in an articulated object manipulation domain
and show how the combination of classical TAMP, generative learning, and latent
embeddings enables long-horizon constraint-based reasoning. We also apply the
learned sampler in the real world. More details are available at
https://sites.google.com/view/dimsam-tamp
- Abstract(参考訳): タスク・アンド・モーション・プランニング(TAMP)アプローチは、長距離自律ロボット操作の計画に有効である。
しかし、環境とそのダイナミクスが完全には知られていない領域に適用することは困難である。
本稿では,これらの制約を,特に拡散モデル(拡散モデル)の深層生成モデルを活用することで克服することを提案する。
これらの学習されたサンプルは、計画に沿った制約を満たすアクションパラメータ値を見つけるために、TAMPソルバ内で構成・結合される。
環境中における未知の物体の予測を的確に行うため, 物体状態変化の低次元学習潜伏埋め込み上にこれらのサンプルを定式化する。
このアプローチをarticulated object manipulation domainで評価し,古典的タンプ,生成的学習,潜在的埋め込みの組み合わせによって,長期ホリゾン制約に基づく推論が可能かを示す。
また、学習したサンプルを現実世界に適用する。
詳細はhttps://sites.google.com/view/dimsam-tampで確認できる。
関連論文リスト
- Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - NOD-TAMP: Multi-Step Manipulation Planning with Neural Object
Descriptors [17.67523831096846]
家庭や工場における複雑な操作作業のためのインテリジェントロボットの開発は依然として困難である。
提案するフレームワークであるNOD-TAMPは、少数の人間のデモンストレーションから短い操作軌跡を抽出する。
NOD特徴を用いてこれらの軌道に適応し、広い長距離タスクを解くために構成する。
論文 参考訳(メタデータ) (2023-11-02T18:26:28Z) - Robots That Ask For Help: Uncertainty Alignment for Large Language Model
Planners [85.03486419424647]
KnowNoは、大きな言語モデルの不確実性を測定し、調整するためのフレームワークである。
KnowNoは、タスク完了に関する統計的保証を提供する共形予測理論に基づいている。
論文 参考訳(メタデータ) (2023-07-04T21:25:12Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Model-free Motion Planning of Autonomous Agents for Complex Tasks in
Partially Observable Environments [3.7660066212240753]
部分的に知られている環境での自律エージェントの動作計画は難しい問題である。
本稿では,モデルのない強化学習手法を提案する。
提案手法は, 環境, 行動, 観測の不確実性に効果的に対処できることを示す。
論文 参考訳(メタデータ) (2023-04-30T19:57:39Z) - Approximating Constraint Manifolds Using Generative Models for
Sampling-Based Constrained Motion Planning [8.924344714683814]
本稿では,制約付き動作計画問題に対する学習に基づくサンプリング戦略を提案する。
本研究では,条件変数自動エンコーダ(CVAE)と条件生成適応ネット(CGAN)を用いて制約条件を満たすサンプル構成を生成する。
これら2つの生成モデルの有効性を,サンプリング精度とサンプリング分布のカバレッジの観点から評価した。
論文 参考訳(メタデータ) (2022-04-14T07:08:30Z) - SAGE: Generating Symbolic Goals for Myopic Models in Deep Reinforcement
Learning [18.37286885057802]
従来使用できなかった不完全モデルのクラスを利用するための学習と計画を組み合わせたアルゴリズムを提案する。
これは、象徴的な計画とニューラルネットワークのアプローチの長所を、タクシーの世界とマインクラフトのバリエーションで競合する手法を上回る、新しい方法で組み合わせたものだ。
論文 参考訳(メタデータ) (2022-03-09T22:55:53Z) - Learning Models as Functionals of Signed-Distance Fields for
Manipulation Planning [51.74463056899926]
本研究では,シーン内のオブジェクトを表す符号付き距離場の目的を学習する,最適化に基づく操作計画フレームワークを提案する。
オブジェクトを符号付き距離場として表現することは、ポイントクラウドや占有率の表現よりも高い精度で、様々なモデルの学習と表現を可能にする。
論文 参考訳(メタデータ) (2021-10-02T12:36:58Z) - Temporal Predictive Coding For Model-Based Planning In Latent Space [80.99554006174093]
時間的に予測可能な環境要素を符号化するために,時間的予測符号化を用いた情報理論的手法を提案する。
本稿では,DMControl タスクの背景を複雑な情報を含む自然なビデオに置き換える,標準的な DMControl タスクの挑戦的な修正について評価する。
論文 参考訳(メタデータ) (2021-06-14T04:31:15Z) - Deep Model-Based Reinforcement Learning for High-Dimensional Problems, a
Survey [1.2031796234206134]
モデルに基づく強化学習は、環境サンプルの必要性を減らすために、環境力学の明示的なモデルを生成する。
深層モデルに基づく手法の課題は、低いサンプルの複雑さを維持しながら高い予測力を達成することである。
本稿では, 与えられた遷移を明示的に計画すること, 学習した遷移を明示的に計画すること, 計画と遷移の両方をエンドツーエンドで学習することの3つのアプローチに基づく分類法を提案する。
論文 参考訳(メタデータ) (2020-08-11T08:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。