Fugu-MT 論文翻訳(概要): A complementary study on PlanGPT: Evaluation with defined Performance Metrics and comparison with a planner

論文の概要: A complementary study on PlanGPT: Evaluation with defined Performance Metrics and comparison with a planner

arxiv url: http://arxiv.org/abs/2606.10489v1
Date: Tue, 09 Jun 2026 07:07:48 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-10 15:40:58.363457
Title: A complementary study on PlanGPT: Evaluation with defined Performance Metrics and comparison with a planner
Title（参考訳）: PlanGPTの相補的研究:定義された性能指標による評価とプランナーとの比較
Authors: Youssef Abdelkader, Humbert Fiorino, Damien Pellier,
Abstract要約: 計画問題は、オブジェクトのセット、初期状態、および望ましい目標状態によって定義される。私たちは、昨年リリースされたPlanGPTという最先端のLLMを補完的に研究しました。 PlanGPTはGreedyの検索戦略に匹敵するものではないことがわかった。
参考スコア（独自算出の注目度）: 0.8491493778771617
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated Planning is a subfield of Artificial Intelligence (AI) where the main objective is generating a sequence of actions, known as a plan, that helps us reach a goal state from an initial state. A planning problem is defined by a set of objects, an initial state and a desired goal state. The objective is to compute a plan that'll lead us from the inital state to the goal state. Programs that generate plans are called planners. In this paper, we did a complementary study to the state-of-the-art LLM called PlanGPT which was released last year. We redid some experiments to verify whether planning with LLMs is \textbf{pertinent} and \textbf{worthwhile}. We also check whether the results obtained in the official PlanGPT paper for plan coverage were correct, and we also performed a more comprehensive study on PlanGPT's performance: in our paper PlanGPT's performance was evaluated using two metrics: Plan Cost and Plan Generation Time. The results of planGPT were compared to those produced by a traditional planner for the same plans and same metrics. We discovered that PlanGPT is no better than a Greedy search strategy.
Abstract（参考訳）: 自動計画(Automated Planning)は、人工知能(AI)のサブフィールドであり、計画として知られる一連のアクションを生成し、初期状態から目標状態に到達するのに役立つ。計画問題は、オブジェクトのセット、初期状態、および望ましい目標状態によって定義される。目的は、初期状態から目標状態へと導く計画を計算することです。計画を生成するプログラムはプランナーと呼ばれる。本稿では,昨年リリースされたPlanGPTという,最先端のLLMを補完する研究を行った。 LLM を用いた計画が \textbf{pertinent} と \textbf{worthwhile} であるかどうかを検証するために、いくつかの実験を再検討する。また,PlanGPTの公式調査の結果が正しいかを確認し,PlanGPTの性能についてより総合的な調査を行った。 PlanGPTの結果は、従来のプランナーが同じプランと同じメトリクスで作成したものと比較された。 PlanGPTはGreedyの検索戦略に匹敵するものではないことがわかった。

関連論文リスト

PlanningBench: Generating Scalable and Verifiable Planning Data for Evaluating and Training Large Language Models [52.48858778580074]
計画は大規模言語モデル(LLM)の基本的な機能である PlanningBenchは、評価とトレーニングの両方のためのスケーラブルで多様な検証可能な計画データを生成するためのフレームワークである。
論文参考訳（メタデータ） (2026-05-20T08:10:15Z)
Satisficing and Optimal Generalised Planning via Goal Regression (Extended Version) [16.43772461453855]
汎用計画 (GP) とは、関連する計画問題のファミリーを解くプログラムを合成するタスクである。 GPのための新しい単純な手法を導入し、各問題に対する一連のトレーニング問題を与えられた場合、ある順序で各ゴール原子に対して最適な計画を計算する。我々は,我々の方法が保証されている条件を定式化し,有効な一般化計画と探索のための状態空間決定公理を学習する。
論文参考訳（メタデータ） (2025-11-14T09:16:32Z)
Make Planning Research Rigorous Again! [32.54078334699621]
我々は、大規模言語モデルによる計画作業の現在のトレンドに厳密さを適用するべきだと論じる。計画コミュニティの経験と専門知識は、歴史的観点からだけ重要ではありません。このような落とし穴を避けることは、LSMベースのプランナー構築の進展に大きく貢献すると考えています。
論文参考訳（メタデータ） (2025-05-27T18:51:06Z)
Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following [62.10809033451526]
本研究は,Large Language Models (LLM) を用いた Embodied Instruction following (EIF) タスクプランナの構築に焦点をあてる。我々は,このタスクを部分観測可能なマルコフ決定プロセス (POMDP) として構成し,数発の仮定で頑健なプランナーの開発を目指す。 ALFREDデータセットに対する我々の実験は、プランナーが数ショットの仮定で競争性能を達成することを示す。
論文参考訳（メタデータ） (2024-12-27T10:05:45Z)
NATURAL PLAN: Benchmarking LLMs on Natural Language Planning [109.73382347588417]
本稿では,3つのタスク – トリップ計画,ミーティング計画,カレンダースケジューリング – を含む,自然言語の現実的な計画ベンチマークであるNATURAL PLANを紹介する。我々は、Google Flights、Google Maps、Google Calendarなどのツールからの出力を、モデルに対するコンテキストとして提供することによって、タスクに関する完全な情報を備えたLCMの計画能力に焦点をあてる。
論文参考訳（メタデータ） (2024-06-06T21:27:35Z)
Socratic Planner: Self-QA-Based Zero-Shot Planning for Embodied Instruction Following [17.608330952846075]
EIF(Embodied Instruction following)は、対話型環境でオブジェクトをナビゲートし、対話することによって自然言語命令を実行するタスクである。 EIFにおける重要な課題は、典型的には教師付き学習やラベル付きデータによる少数ショットのインコンテキスト学習を通じて対処される構成的タスク計画である。本稿では,自己QAに基づくゼロショット計画手法であるソクラティック・プランナーを紹介する。
論文参考訳（メタデータ） (2024-04-21T08:10:20Z)
Planning and Acting While the Clock Ticks [15.783791140860528]
時間的プレッシャーのある問題では、最初のアクションを実行する前に、タイミングが厳しすぎて計画が完了できない。計画終了前にアクションを発行(実行)できる並列計画と実行という,新たな問題設定を提案する。
論文参考訳（メタデータ） (2024-03-21T19:18:47Z)
Automating the Generation of Prompts for LLM-based Action Choice in PDDL Planning [59.543858889996024]
大規模言語モデル(LLM)は、様々なNLPタスクに革命をもたらした。 LLMを利用してPDDL入力からNLプロンプトを自動的に生成する方法を示す。我々のNLプロンプトはPDDLプロンプトや単純なテンプレートベースのNLプロンプトよりも優れた性能が得られる。
論文参考訳（メタデータ） (2023-11-16T11:55:27Z)
EIPE-text: Evaluation-Guided Iterative Plan Extraction for Long-Form Narrative Text Generation [114.50719922069261]
長文物語テキスト生成のための評価誘導反復計画抽出法(EIPE-text)を提案する。 EIPEテキストには、計画抽出、学習、推論の3段階がある。小説やストーリーテリングの分野におけるEIPEテキストの有効性を評価する。
論文参考訳（メタデータ） (2023-10-12T10:21:37Z)
Robust Hierarchical Planning with Policy Delegation [6.1678491628787455]
本稿では,デリゲートの原理に基づく階層計画のための新しいフレームワークとアルゴリズムを提案する。このプランニング手法は、様々な領域における古典的なプランニングと強化学習技術に対して、実験的に非常に競争力があることを示す。
論文参考訳（メタデータ） (2020-10-25T04:36:20Z)
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文参考訳（メタデータ） (2020-04-23T18:08:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。