Fugu-MT 論文翻訳(概要): Policy-Guided Lazy Search with Feedback for Task and Motion Planning

論文の概要: Policy-Guided Lazy Search with Feedback for Task and Motion Planning

arxiv url: http://arxiv.org/abs/2210.14055v4
Date: Wed, 23 Aug 2023 12:03:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-24 18:58:59.557750
Title: Policy-Guided Lazy Search with Feedback for Task and Motion Planning
Title（参考訳）: タスクと動作計画のためのフィードバック付きポリシガイド型遅延探索
Authors: Mohamed Khodeir, Atharv Sonwane, Ruthrash Hari, Florian Shkurti
Abstract要約: PDDLStreamソルバは、タスクとモーションプランニングの問題に対して実行可能なソリューションとして最近登場した。本稿では,PDDLStream問題に対する解法であるLAZYを提案する。その結果, 未確認テスト環境において, 実現可能解の探索において, 大幅な高速化がもたらされることが判明した。
参考スコア（独自算出の注目度）: 19.789123503976917
License: http://creativecommons.org/licenses/by/4.0/
Abstract: PDDLStream solvers have recently emerged as viable solutions for Task and Motion Planning (TAMP) problems, extending PDDL to problems with continuous action spaces. Prior work has shown how PDDLStream problems can be reduced to a sequence of PDDL planning problems, which can then be solved using off-the-shelf planners. However, this approach can suffer from long runtimes. In this paper we propose LAZY, a solver for PDDLStream problems that maintains a single integrated search over action skeletons, which gets progressively more geometrically informed, as samples of possible motions are lazily drawn during motion planning. We explore how learned models of goal-directed policies and current motion sampling data can be incorporated in LAZY to adaptively guide the task planner. We show that this leads to significant speed-ups in the search for a feasible solution evaluated over unseen test environments of varying numbers of objects, goals, and initial conditions. We evaluate our TAMP approach by comparing to existing solvers for PDDLStream problems on a range of simulated 7DoF rearrangement/manipulation problems.
Abstract（参考訳）: PDDLStreamソルバはタスク・アンド・モーション・プランニング(TAMP)問題に対する実行可能なソリューションとして最近登場し、PDDLを連続的なアクション空間の問題に拡張している。以前の研究では、PDDLStreamの問題をPDDL計画の一連の問題に還元し、既成のプランナーを使って解決する方法が示されている。しかし、このアプローチは長いランタイムに苦しむ可能性がある。本稿では,アクションスケルトンに対する単一の統合探索を維持したpddlstream問題の解法であるlazyを提案する。目標指向ポリシーの学習モデルと現在の動作サンプリングデータをLAZYに組み込んでタスクプランナを適応的に導く方法について検討する。その結果, 対象, 目標, 初期条件の異なる未確認テスト環境において, 実現可能解の探索において, 大幅な高速化が期待できることがわかった。我々は, PDDLStream問題に対する既存の解法と比較し, TAMP手法の評価を行った。

関連論文リスト

Language Models For Generalised PDDL Planning: Synthesising Sound and Programmatic Policies [14.156642420488168]
計画領域定義言語(PDDL)で規定される世界モデルにおける言語モデル(LM)の利用について検討する。我々は、あるドメインからPDDL問題を解決するための一般的なポリシーとして機能するPythonプログラムを生成するよう、LMに促す。我々は,PDDLプランナや最近のLMアプローチよりも多くのPDDL問題を一定時間とメモリ制約で解くことができることを示す競合ベンチマーク実験を行った。
論文参考訳（メタデータ） (2025-08-25T21:28:14Z)
Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2025-05-12T12:38:20Z)
ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments [7.508204100423766]
LLMを用いた推論のためのマルチエージェントアーキテクチャであるARIESを紹介する。教師付き微調整(SFT)のない政策エージェントとして市販のLCMを使用することで,HumanEvalの精度が最大29%向上することが観察された。また、観測された障害モードの徹底的な解析を行い、LLMサイズと問題分解の深さの制限が、LLM誘導推論をスケールする上での課題であることを示した。
論文参考訳（メタデータ） (2025-02-28T16:28:13Z)
Generating Symbolic World Models via Test-time Scaling of Large Language Models [28.258707611580643]
計画ドメイン定義言語(PDDL)は、正確な状態記述と正式な状態記述を可能にする計画抽象化として利用されます。提案手法は,まずまずBest-of-Nサンプリング手法を用いて初期解の質を向上し,その解を言語化された機械学習で微妙に洗練する。本手法はPDDL ドメインの生成において O1-mini よりも優れ,2つのタスクで50% 以上の成功率を達成した。
論文参考訳（メタデータ） (2025-02-07T07:52:25Z)
SCoTT: Wireless-Aware Path Planning with Vision Language Models and Strategic Chains-of-Thought [78.53885607559958]
複雑な無線環境における経路計画を実現するために,視覚言語モデル(VLM)を用いた新しい手法を提案する。この目的のために、実世界の無線レイトレーシングデータを用いたデジタルツインからの洞察を探索する。その結果, SCoTT はDP-WA* と比較して非常に近い平均経路ゲインを実現し, 同時に一貫した経路長が得られることがわかった。
論文参考訳（メタデータ） (2024-11-27T10:45:49Z)
Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文参考訳（メタデータ） (2024-11-21T04:23:17Z)
Leveraging Environment Interaction for Automated PDDL Translation and Planning with Large Language Models [7.3238629831871735]
大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。 LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
論文参考訳（メタデータ） (2024-07-17T19:50:51Z)
Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。 In-paintingとしての計画」というタスク非依存の手法を提案する。提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-12-02T10:07:17Z)
Robust Multi-Agent Pickup and Delivery with Delays [5.287544737925232]
MAPD(Multi-Agent Pickup and Delivery)は、エージェント群に対する衝突のない経路の計算の問題である。 MAPDの現在のアルゴリズムは、実際のアプリケーションで遭遇する現実的な問題の多くを考慮していない。本稿では,不完全な実行の影響を抑える計画経路によって堅牢性を保証する2つの手法を提案する。
論文参考訳（メタデータ） (2023-03-30T14:42:41Z)
A Hierarchical Temporal Planning-Based Approach for Dynamic Hoist Scheduling Problems [11.66506213335498]
ホイストスケジューリングは、自律デバイスの開発で産業応用の電気めっきのボトルネックとなっている。適応型PDDLの形で新しい時間計画問題としてホイストスケジューリング問題を定式化する。この問題に対するソリューションメソッドの評価に使用できる実生活ベンチマークインスタンスのコレクションを提供する。
論文参考訳（メタデータ） (2022-12-11T05:30:44Z)
Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文参考訳（メタデータ） (2022-09-15T07:22:58Z)
Accelerated Reinforcement Learning for Temporal Logic Control Objectives [10.216293366496688]
本稿では,未知マルコフ決定過程(MDP)をモデル化した移動ロボットの学習制御ポリシーの問題に対処する。本稿では,制御ポリシを関連手法よりもはるかに高速に学習可能な制御対象に対するモデルベース強化学習(RL)アルゴリズムを提案する。
論文参考訳（メタデータ） (2022-05-09T17:09:51Z)
Integrated Task and Motion Planning [30.415785183398334]
多数の物体を含む環境下で動作するロボットの計画はタスク・アンド・モーション・プランニング(TAMP)として知られている。 TAMP問題には、離散的なタスク計画、離散連続的な数学的計画、連続的な動き計画といった要素が含まれており、これらの分野のどれからも効果的に対処することはできない。本稿では、連続空間のサブプロブレムを解くための手法と、探索の離散的かつ連続的なコンポーネントを統合する手法の観点から、TAMP問題のクラスを定義し、解法を特徴付ける。
論文参考訳（メタデータ） (2020-10-02T16:23:08Z)
POMP: Pomcp-based Online Motion Planning for active visual search in indoor environments [89.43830036483901]
本稿では, 屋内環境におけるオブジェクトのアクティブビジュアルサーチ(AVS)の最適ポリシーを, オンライン設定で学習する問題に焦点をあてる。提案手法はエージェントの現在のポーズとRGB-Dフレームを入力として使用する。提案手法を利用可能なAVDベンチマークで検証し,平均成功率0.76,平均パス長17.1とした。
論文参考訳（メタデータ） (2020-09-17T08:23:50Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)
Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文参考訳（メタデータ） (2020-07-06T05:13:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。