論文の概要: Policy-Guided Lazy Search with Feedback for Task and Motion Planning
- arxiv url: http://arxiv.org/abs/2210.14055v4
- Date: Wed, 23 Aug 2023 12:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 18:58:59.557750
- Title: Policy-Guided Lazy Search with Feedback for Task and Motion Planning
- Title(参考訳): タスクと動作計画のためのフィードバック付きポリシガイド型遅延探索
- Authors: Mohamed Khodeir, Atharv Sonwane, Ruthrash Hari, Florian Shkurti
- Abstract要約: PDDLStreamソルバは、タスクとモーションプランニングの問題に対して実行可能なソリューションとして最近登場した。
本稿では,PDDLStream問題に対する解法であるLAZYを提案する。
その結果, 未確認テスト環境において, 実現可能解の探索において, 大幅な高速化がもたらされることが判明した。
- 参考スコア(独自算出の注目度): 19.789123503976917
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: PDDLStream solvers have recently emerged as viable solutions for Task and
Motion Planning (TAMP) problems, extending PDDL to problems with continuous
action spaces. Prior work has shown how PDDLStream problems can be reduced to a
sequence of PDDL planning problems, which can then be solved using
off-the-shelf planners. However, this approach can suffer from long runtimes.
In this paper we propose LAZY, a solver for PDDLStream problems that maintains
a single integrated search over action skeletons, which gets progressively more
geometrically informed, as samples of possible motions are lazily drawn during
motion planning. We explore how learned models of goal-directed policies and
current motion sampling data can be incorporated in LAZY to adaptively guide
the task planner. We show that this leads to significant speed-ups in the
search for a feasible solution evaluated over unseen test environments of
varying numbers of objects, goals, and initial conditions. We evaluate our TAMP
approach by comparing to existing solvers for PDDLStream problems on a range of
simulated 7DoF rearrangement/manipulation problems.
- Abstract(参考訳): PDDLStreamソルバはタスク・アンド・モーション・プランニング(TAMP)問題に対する実行可能なソリューションとして最近登場し、PDDLを連続的なアクション空間の問題に拡張している。
以前の研究では、PDDLStreamの問題をPDDL計画の一連の問題に還元し、既成のプランナーを使って解決する方法が示されている。
しかし、このアプローチは長いランタイムに苦しむ可能性がある。
本稿では,アクションスケルトンに対する単一の統合探索を維持したpddlstream問題の解法であるlazyを提案する。
目標指向ポリシーの学習モデルと現在の動作サンプリングデータをLAZYに組み込んでタスクプランナを適応的に導く方法について検討する。
その結果, 対象, 目標, 初期条件の異なる未確認テスト環境において, 実現可能解の探索において, 大幅な高速化が期待できることがわかった。
我々は, PDDLStream問題に対する既存の解法と比較し, TAMP手法の評価を行った。
関連論文リスト
- Generating Symbolic World Models via Test-time Scaling of Large Language Models [28.258707611580643]
計画ドメイン定義言語(PDDL)は、正確な状態記述と正式な状態記述を可能にする計画抽象化として利用されます。
提案手法は,まずまずBest-of-Nサンプリング手法を用いて初期解の質を向上し,その解を言語化された機械学習で微妙に洗練する。
本手法はPDDL ドメインの生成において O1-mini よりも優れ,2つのタスクで50% 以上の成功率を達成した。
論文 参考訳(メタデータ) (2025-02-07T07:52:25Z) - SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought [78.53885607559958]
複雑な無線環境における経路計画を実現するために,視覚言語モデル(VLM)を用いた新しい手法を提案する。
この目的のために、実世界の無線レイトレーシングデータを用いたデジタルツインからの洞察を探索する。
その結果, SCoTT はDP-WA* と比較して非常に近い平均経路ゲインを実現し, 同時に一貫した経路長が得られることがわかった。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。
近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。
完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文 参考訳(メタデータ) (2024-11-21T04:23:17Z) - Leveraging Environment Interaction for Automated PDDL Translation and Planning with Large Language Models [7.3238629831871735]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。
潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。
LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T19:50:51Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - PDPP: Projected Diffusion for Procedure Planning in Instructional Videos [18.984980596601513]
本研究では,現在の視覚的観察と目的を考慮に入れた計画(一連の行動)の実現を目的とした指導ビデオにおけるプロシージャ計画の課題について検討する。
以前の研究は、これをシーケンスモデリングの問題とみなし、中間的な視覚観察または言語指示を監督として活用した。
自己回帰的に計画することによる中間的監視アノテーションやエラーの蓄積を回避するため,拡散型フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-26T10:50:16Z) - A Hierarchical Temporal Planning-Based Approach for Dynamic Hoist
Scheduling Problems [11.66506213335498]
ホイストスケジューリングは、自律デバイスの開発で産業応用の電気めっきのボトルネックとなっている。
適応型PDDLの形で新しい時間計画問題としてホイストスケジューリング問題を定式化する。
この問題に対するソリューションメソッドの評価に使用できる実生活ベンチマークインスタンスのコレクションを提供する。
論文 参考訳(メタデータ) (2022-12-11T05:30:44Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Integrated Task and Motion Planning [30.415785183398334]
多数の物体を含む環境下で動作するロボットの計画はタスク・アンド・モーション・プランニング(TAMP)として知られている。
TAMP問題には、離散的なタスク計画、離散連続的な数学的計画、連続的な動き計画といった要素が含まれており、これらの分野のどれからも効果的に対処することはできない。
本稿では、連続空間のサブプロブレムを解くための手法と、探索の離散的かつ連続的なコンポーネントを統合する手法の観点から、TAMP問題のクラスを定義し、解法を特徴付ける。
論文 参考訳(メタデータ) (2020-10-02T16:23:08Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。