論文の概要: Policy-Guided Lazy Search with Feedback for Task and Motion Planning
- arxiv url: http://arxiv.org/abs/2210.14055v1
- Date: Tue, 25 Oct 2022 14:33:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:33:20.396039
- Title: Policy-Guided Lazy Search with Feedback for Task and Motion Planning
- Title(参考訳): タスクと動作計画のためのフィードバック付きポリシガイド型遅延探索
- Authors: Mohamed Khodeir, Atharv Sonwane, Florian Shkurti
- Abstract要約: 本稿では,PDDLStream問題に対する解法であるLAZYを提案する。
その結果, 未確認テスト環境において, 実現可能解の探索において, 大幅な高速化がもたらされることが判明した。
- 参考スコア(独自算出の注目度): 12.300363114433955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: PDDLStream solvers have recently emerged as viable solutions for Task and
Motion Planning (TAMP) problems, extending PDDL to problems with continuous
action spaces. Prior work has shown how PDDLStream problems can be reduced to a
sequence of PDDL planning problems, which can then be solved using
off-the-shelf planners. However, this approach can suffer from long runtimes.
In this paper we propose LAZY, a solver for PDDLStream problems that maintains
a single integrated search over action skeletons, which gets progressively more
geometrically informed as samples of possible motions are lazily drawn during
motion planning. We explore how learned models of goal-directed policies and
current motion sampling data can be incorporated in LAZY to adaptively guide
the task planner. We show that this leads to significant speed-ups in the
search for a feasible solution evaluated over unseen test environments of
varying numbers of objects, goals, and initial conditions. We evaluate our TAMP
approach by comparing to existing solvers for PDDLStream problems on a range of
simulated 7DoF rearrangement/manipulation problems.
- Abstract(参考訳): PDDLStreamソルバはタスク・アンド・モーション・プランニング(TAMP)問題に対する実行可能なソリューションとして最近登場し、PDDLを連続的なアクション空間の問題に拡張している。
以前の研究では、PDDLStreamの問題をPDDL計画の一連の問題に還元し、既成のプランナーを使って解決する方法が示されている。
しかし、このアプローチは長いランタイムに苦しむ可能性がある。
本稿では,アクションスケルトンに対する単一の統合探索を維持したpddlstream問題の解法であるlazyを提案する。
目標指向ポリシーの学習モデルと現在の動作サンプリングデータをLAZYに組み込んでタスクプランナを適応的に導く方法について検討する。
その結果, 対象, 目標, 初期条件の異なる未確認テスト環境において, 実現可能解の探索において, 大幅な高速化が期待できることがわかった。
我々は, PDDLStream問題に対する既存の解法と比較し, TAMP手法の評価を行った。
関連論文リスト
- Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。
近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。
完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文 参考訳(メタデータ) (2024-11-21T04:23:17Z) - Leveraging Environment Interaction for Automated PDDL Translation and Planning with Large Language Models [7.3238629831871735]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。
潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。
LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
論文 参考訳(メタデータ) (2024-07-17T19:50:51Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Robust Multi-Agent Pickup and Delivery with Delays [5.287544737925232]
MAPD(Multi-Agent Pickup and Delivery)は、エージェント群に対する衝突のない経路の計算の問題である。
MAPDの現在のアルゴリズムは、実際のアプリケーションで遭遇する現実的な問題の多くを考慮していない。
本稿では,不完全な実行の影響を抑える計画経路によって堅牢性を保証する2つの手法を提案する。
論文 参考訳(メタデータ) (2023-03-30T14:42:41Z) - A Hierarchical Temporal Planning-Based Approach for Dynamic Hoist
Scheduling Problems [11.66506213335498]
ホイストスケジューリングは、自律デバイスの開発で産業応用の電気めっきのボトルネックとなっている。
適応型PDDLの形で新しい時間計画問題としてホイストスケジューリング問題を定式化する。
この問題に対するソリューションメソッドの評価に使用できる実生活ベンチマークインスタンスのコレクションを提供する。
論文 参考訳(メタデータ) (2022-12-11T05:30:44Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Accelerated Reinforcement Learning for Temporal Logic Control Objectives [10.216293366496688]
本稿では,未知マルコフ決定過程(MDP)をモデル化した移動ロボットの学習制御ポリシーの問題に対処する。
本稿では,制御ポリシを関連手法よりもはるかに高速に学習可能な制御対象に対するモデルベース強化学習(RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-09T17:09:51Z) - Integrated Task and Motion Planning [30.415785183398334]
多数の物体を含む環境下で動作するロボットの計画はタスク・アンド・モーション・プランニング(TAMP)として知られている。
TAMP問題には、離散的なタスク計画、離散連続的な数学的計画、連続的な動き計画といった要素が含まれており、これらの分野のどれからも効果的に対処することはできない。
本稿では、連続空間のサブプロブレムを解くための手法と、探索の離散的かつ連続的なコンポーネントを統合する手法の観点から、TAMP問題のクラスを定義し、解法を特徴付ける。
論文 参考訳(メタデータ) (2020-10-02T16:23:08Z) - POMP: Pomcp-based Online Motion Planning for active visual search in
indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。
提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。
提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文 参考訳(メタデータ) (2020-09-17T08:23:50Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。