Fugu-MT 論文翻訳(概要): NOD-TAMP: Multi-Step Manipulation Planning with Neural Object Descriptors

論文の概要: NOD-TAMP: Multi-Step Manipulation Planning with Neural Object Descriptors

arxiv url: http://arxiv.org/abs/2311.01530v1
Date: Thu, 2 Nov 2023 18:26:28 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-06 16:15:39.551779
Title: NOD-TAMP: Multi-Step Manipulation Planning with Neural Object Descriptors
Title（参考訳）: NOD-TAMP:ニューラルオブジェクト記述子を用いたマルチステップ操作計画
Authors: Shuo Cheng, Caelan Garrett, Ajay Mandlekar, Danfei Xu
Abstract要約: 家庭や工場における複雑な操作作業のためのインテリジェントロボットの開発は依然として困難である。提案するフレームワークであるNOD-TAMPは、少数の人間のデモンストレーションから短い操作軌跡を抽出する。 NOD特徴を用いてこれらの軌道に適応し、広い長距離タスクを解くために構成する。
参考スコア（独自算出の注目度）: 17.67523831096846
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Developing intelligent robots for complex manipulation tasks in household and factory settings remains challenging due to long-horizon tasks, contact-rich manipulation, and the need to generalize across a wide variety of object shapes and scene layouts. While Task and Motion Planning (TAMP) offers a promising solution, its assumptions such as kinodynamic models limit applicability in novel contexts. Neural object descriptors (NODs) have shown promise in object and scene generalization but face limitations in addressing broader tasks. Our proposed TAMP-based framework, NOD-TAMP, extracts short manipulation trajectories from a handful of human demonstrations, adapts these trajectories using NOD features, and composes them to solve broad long-horizon tasks. Validated in a simulation environment, NOD-TAMP effectively tackles varied challenges and outperforms existing methods, establishing a cohesive framework for manipulation planning. For videos and other supplemental material, see the project website: https://sites.google.com/view/nod-tamp/.
Abstract（参考訳）: 家庭や工場での複雑な操作タスクのためのインテリジェントロボットの開発は、長いホリゾン作業、接触の多い操作、さまざまなオブジェクト形状やシーンレイアウトを一般化する必要性などにより、依然として困難である。 task and motion planning(tamp)は有望なソリューションを提供するが、kinodynamicモデルのような仮定は、新しいコンテキストにおける適用可能性を制限する。 neural object descriptor(nod)は、オブジェクトとシーンの一般化においてpromiseを示しているが、より広いタスクに対処する上での制限に直面している。提案するTAMPベースのフレームワークであるNOD-TAMPは、少数の人間のデモから短い操作軌跡を抽出し、NOD特徴を用いてこれらの軌跡を適応し、より広い長期タスクを解くために構成する。シミュレーション環境で検証されたNOD-TAMPは、様々な課題に効果的に取り組み、既存の手法より優れている。ビデオやその他の補足資料については、プロジェクトのWebサイトを参照してください。

関連論文リスト

Data-Agnostic Robotic Long-Horizon Manipulation with Vision-Language-Guided Closed-Loop Feedback [12.600525101342026]
本稿では,言語条件のロングホライズンロボット操作のためのデータに依存しないフレームワークであるDAHLIAを紹介する。 LLMは、リアルタイムタスク計画と実行のための大きな言語モデルである。本フレームワークは,多種多様な長期タスクにおける最先端性能を実証し,シミュレーションおよび実世界のシナリオにおいて強力な一般化を実現する。
論文参考訳（メタデータ） (2025-03-27T20:32:58Z)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳（メタデータ） (2024-11-26T17:53:44Z)
LaMMA-P: Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner [9.044939946653002]
言語モデル(LM)は、自然言語を理解する強力な能力を有しており、人間の指示を単純なロボットタスクの詳細な計画に変換するのに効果的である。本稿では,言語モデル駆動型多エージェントPDDLプランナ(LaMMA-P)を提案する。 LaMMA-Pは、LMの推論能力と従来の探索プランナーの強みを統合し、高い成功率と効率を達成する。
論文参考訳（メタデータ） (2024-09-30T17:58:18Z)
Learning Task Planning from Multi-Modal Demonstration for Multi-Stage Contact-Rich Manipulation [26.540648608911308]
本稿では,人間の実演から触覚情報や力覚情報を取り入れた文脈内学習フレームワークを提案する。本稿では,各モダリティを総合的なタスクプランに順次統合するブートストラップ型推論パイプラインを提案する。このタスクプランは、新しいタスク設定のプランニングのリファレンスとして使用される。
論文参考訳（メタデータ） (2024-09-18T10:36:47Z)
Policy Adaptation via Language Optimization: Decomposing Tasks for Few-Shot Imitation [49.43094200366251]
本稿では,タスク分解のセマンティック理解を生かした,未確認タスクへの数発適応のための新しいアプローチを提案する。我々の手法であるPALO(Policy Adaptation via Language Optimization)は,タスクのいくつかの実演と,提案する言語分解とを組み合わせる。 PALOは、実世界の長期・多層的なタスクを一貫して完了することができ、事前訓練されたジェネラリスト政策の状況よりも優れています。
論文参考訳（メタデータ） (2024-08-29T03:03:35Z)
LoHoRavens: A Long-Horizon Language-Conditioned Benchmark for Robotic Tabletop Manipulation [38.66406497318709]
この研究はテーブルトップ操作タスクに焦点を当て、色、サイズ、空間、算術、参照にまたがる様々なロングホライゾン推論側面をカバーするシミュレーションベンチマークである textitLoHoRavens をリリースする。 LLMに明示的および暗黙的な観察フィードバックを組み込むためのキャプション生成と学習可能なインタフェースの2つの方法を検討した。
論文参考訳（メタデータ） (2023-10-18T14:53:14Z)
Generalizable Long-Horizon Manipulations with Large Language Models [91.740084601715]
本研究は,Large Language Models (LLMs) の機能を活用して,汎用可能な長距離操作のための原始的なタスク条件を生成するフレームワークを導入する。我々は,Pybulletに基づくロボット操作タスクスイートを作成し,長期作業評価を行う。
論文参考訳（メタデータ） (2023-10-03T17:59:46Z)
Generalization with Lossy Affordances: Leveraging Broad Offline Data for Learning Visuomotor Tasks [65.23947618404046]
本研究では,広範囲なデータを用いたオフライン強化学習を通じて,時間的拡張タスクの目標条件付きポリシを取得するフレームワークを提案する。新たなタスク目標に直面した場合、フレームワークは余裕モデルを使用して、元のタスクをより簡単な問題に分解するサブゴールとして、損失のある表現のシーケンスを計画する。我々は,従来の作業からロボット体験の大規模データセットを事前学習し,手動の報酬工学を使わずに視覚入力から,新しいタスクを効率的に微調整できることを実証した。
論文参考訳（メタデータ） (2022-10-12T21:46:38Z)
Learning Neuro-Symbolic Skills for Bilevel Planning [63.388694268198655]
意思決定は、連続したオブジェクト中心の状態、継続的なアクション、長い地平線、まばらなフィードバックを持つロボット環境では難しい。タスク・アンド・モーション・プランニング(TAMP)のような階層的なアプローチは、意思決定を2つ以上の抽象レベルに分解することでこれらの課題に対処する。我々の主な貢献は、オペレーターとサンプルラーを組み合わせたパラメータ化警察の学習方法である。
論文参考訳（メタデータ） (2022-06-21T19:01:19Z)
Wish you were here: Hindsight Goal Selection for long-horizon dexterous manipulation [14.901636098553848]
スパース報酬をサンプル効率のよい方法で解くことは、現代の強化学習の課題である。既存の戦略はタスク非依存のゴール分布に基づいて検討されており、これは長軸タスクの解を非現実的なものにすることができる。実験を成功させた少数の事例によって示されるタスク固有の分布に沿った探索をガイドするために、後視リラベリング機構を拡張した。
論文参考訳（メタデータ） (2021-12-01T16:12:32Z)
Hierarchical Few-Shot Imitation with Skill Transition Models [66.81252581083199]
FIST(Few-shot Imitation with Skill Transition Models)は、オフラインデータからスキルを抽出し、それらを利用して見えないタスクに一般化するアルゴリズムである。本稿では,FISTが新たなタスクに一般化し,ナビゲーション実験において従来のベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2021-07-19T15:56:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。