Fugu-MT 論文翻訳(概要): Leveraging Environment Interaction for Automated PDDL Generation and Planning with Large Language Models

論文の概要: Leveraging Environment Interaction for Automated PDDL Generation and Planning with Large Language Models

arxiv url: http://arxiv.org/abs/2407.12979v1
Date: Wed, 17 Jul 2024 19:50:51 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-19 19:33:23.294844
Title: Leveraging Environment Interaction for Automated PDDL Generation and Planning with Large Language Models
Title（参考訳）: 大規模言語モデルを用いたPDDL自動生成と計画のための環境相互作用の活用
Authors: Sadegh Mahdavi, Raquel Aoki, Keyi Tang, Yanshuai Cao,
Abstract要約: 大規模言語モデル(LLM)は、様々な自然言語タスクにおいて顕著な性能を示している。潜在的な解決策として、計画ドメイン定義言語(PDDL)へのプランニングの問題が提案されている。 LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。
参考スコア（独自算出の注目度）: 7.3238629831871735
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Large Language Models (LLMs) have shown remarkable performance in various natural language tasks, but they often struggle with planning problems that require structured reasoning. To address this limitation, the conversion of planning problems into the Planning Domain Definition Language (PDDL) has been proposed as a potential solution, enabling the use of automated planners. However, generating accurate PDDL files typically demands human inputs or correction, which can be time-consuming and costly. In this paper, we propose a novel approach that leverages LLMs and environment feedback to automatically generate PDDL domain and problem description files without the need for human intervention. Our method introduces an iterative refinement process that generates multiple problem PDDL candidates and progressively refines the domain PDDL based on feedback obtained from interacting with the environment. To guide the refinement process, we develop an Exploration Walk (EW) metric, which provides rich feedback signals for LLMs to update the PDDL file. We evaluate our approach on PDDL environments. We achieve an average task solve rate of 66% compared to a 29% solve rate by GPT-4's intrinsic planning with chain-of-thought prompting. Our work enables the automated modeling of planning environments using LLMs and environment feedback, eliminating the need for human intervention in the PDDL generation process and paving the way for more reliable LLM agents in challenging problems.
Abstract（参考訳）: 大規模言語モデル(LLM)は様々な自然言語処理において顕著な性能を示してきたが、構造的推論を必要とする計画上の問題に悩まされることが多い。この制限に対処するため、計画領域定義言語(PDDL)への計画問題の変換が潜在的な解決策として提案され、自動プランナーの使用が可能である。しかし、正確なPDDLファイルを生成するには、一般的に人間の入力や修正が必要である。本稿では, LLMと環境フィードバックを利用してPDDLドメインと問題記述ファイルを自動生成する手法を提案する。提案手法では,複数の問題PDDL候補を生成し,環境との相互作用から得られるフィードバックに基づいて,ドメインPDDLを段階的に洗練する反復的改善プロセスを提案する。改良プロセスのガイドとして,LDMがPDDLファイルを更新するためのリッチなフィードバック信号を提供するExploration Walk(EW)メトリックを開発した。我々はPDDL環境に対するアプローチを評価した。 GPT-4の本質的な計画とチェーン・オブ・ソート・プロンプトによる29%の問題解決率と比較して,タスク解決率の平均は66%に達した。本研究は,LDMと環境フィードバックを用いた計画環境の自動モデリングを可能にし,PDDL生成プロセスにおける人的介入の必要性を排除し,より信頼性の高いLCMエージェントを課題に活用する。

関連論文リスト

Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2025-05-12T12:38:20Z)
Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-17T18:49:25Z)
Generating Symbolic World Models via Test-time Scaling of Large Language Models [28.258707611580643]
計画ドメイン定義言語(PDDL)は、正確な状態記述と正式な状態記述を可能にする計画抽象化として利用されます。提案手法は,まずまずBest-of-Nサンプリング手法を用いて初期解の質を向上し,その解を言語化された機械学習で微妙に洗練する。本手法はPDDL ドメインの生成において O1-mini よりも優れ,2つのタスクで50% 以上の成功率を達成した。
論文参考訳（メタデータ） (2025-02-07T07:52:25Z)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳（メタデータ） (2024-11-26T17:53:44Z)
Planetarium: A Rigorous Benchmark for Translating Text to Structured Planning Languages [20.62336315814875]
benchmarkNameは、計画タスクの自然言語記述からPDDLコードを生成する言語モデルの性能を評価するために設計されたベンチマークである。 13のタスクにまたがる132,037ドルのテキスト-PDDLペアのデータセットを,さまざまな難易度で提示する。
論文参考訳（メタデータ） (2024-07-03T17:59:53Z)
NL2Plan: Robust LLM-Driven Planning from Minimal Text Descriptions [8.004470925893957]
ドメインに依存しない初めてのオフラインLCM駆動計画システムであるNL2Planを提案する。我々はNL2Planを4つの計画領域で評価し、15のタスクのうち10を解くことを発見した。エンド・ツー・エンドモードでのNL2Planの使用に加えて、ユーザは中間結果の検査と修正が可能である。
論文参考訳（メタデータ） (2024-05-07T11:27:13Z)
PROC2PDDL: Open-Domain Planning Representations from Texts [56.627183903841164]
Proc2PDDLは、専門家によるPDDL表現と組み合わせたオープンドメインの手続きテキストを含む最初のデータセットである。以上の結果から, GPT-3.5は0%, GPT-4は35%, Proc2PDDLは極めて困難であることが示唆された。
論文参考訳（メタデータ） (2024-02-29T19:40:25Z)
Real-World Planning with PDDL+ and Beyond [55.73913765642435]
我々は、軽量さ、単純さ、そして最も重要なのは適応性を強調するために作られた新しいPDDL+プランナーであるNyxを紹介する。 Nyxは、ある種のAIプランニングを必要とする事実上の現実世界のアプリケーションに合わせることができ、現実の問題を解決するための計画手法をより広く採用するための道を開くことができる。
論文参考訳（メタデータ） (2024-02-19T07:35:49Z)
TIC: Translate-Infer-Compile for accurate "text to plan" using LLMs and Logical Representations [0.0]
本研究では,自然言語計画タスク要求の計画作成の問題について検討する。本手法は,LLMを用いて自然言語タスク記述の解釈可能な中間表現を生成する。中間表現のみを出力するためにLLMを用いると、LLMの誤差が大幅に減少する。
論文参考訳（メタデータ） (2024-02-09T18:39:13Z)
AutoPlanBench: Automatically generating benchmarks for LLM planners from PDDL [52.005042190810116]
PDDLで書かれたベンチマークをテキスト記述に変換する新しい手法であるAutoPlanBenchを提案する。優れたLCMプランナーは計画タスクをうまくこなすが、他のプランナーは現在の手法には及ばない。
論文参考訳（メタデータ） (2023-11-16T11:55:27Z)
HDDL 2.1: Towards Defining a Formalism and a Semantics for Temporal HTN Planning [64.07762708909846]
現実世界のアプリケーションは、リッチで多様な自動計画問題をモデル化する必要があります。階層的タスクネットワーク(HTN)形式は、数値的および時間的制約を伴う計画問題の表現を許さない。本稿では,HDDLとこれらの運用ニーズのギャップを埋めるとともに,PDDL 2.1からインスピレーションを得てHDDLを拡張することを提案する。
論文参考訳（メタデータ） (2023-06-12T18:21:23Z)
AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文参考訳（メタデータ） (2023-05-26T05:52:27Z)
Leveraging Pre-trained Large Language Models to Construct and Utilize World Models for Model-based Task Planning [39.29964085305846]
事前訓練済みの大規模言語モデルをプランナーとして直接使用する方法は、計画の正確性に限界があるため、現在は実用的ではない。本研究では,ドメイン定義言語(PDDL)の計画において,明示的な世界(ドメイン)モデルを構築し,ドメインに依存しないプランナで計画する新たなパラダイムを提案する。
論文参考訳（メタデータ） (2023-05-24T08:59:15Z)
Policy-Guided Lazy Search with Feedback for Task and Motion Planning [19.789123503976917]
PDDLStreamソルバは、タスクとモーションプランニングの問題に対して実行可能なソリューションとして最近登場した。本稿では,PDDLStream問題に対する解法であるLAZYを提案する。その結果, 未確認テスト環境において, 実現可能解の探索において, 大幅な高速化がもたらされることが判明した。
論文参考訳（メタデータ） (2022-10-25T14:33:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。