Fugu-MT 論文翻訳(概要): A Framework for Neurosymbolic Robot Action Planning using Large Language Models

論文の概要: A Framework for Neurosymbolic Robot Action Planning using Large Language Models

arxiv url: http://arxiv.org/abs/2303.00438v2
Date: Tue, 5 Dec 2023 12:51:15 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-06 20:17:32.763371
Title: A Framework for Neurosymbolic Robot Action Planning using Large Language Models
Title（参考訳）: 大規模言語モデルを用いたニューロシンボリックロボット行動計画のためのフレームワーク
Authors: Alessio Capitanelli and Fulvio Mastrogiovanni
Abstract要約: シンボリックタスク計画と機械学習アプローチのギャップを埋める枠組みを提案する。我々は、大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する。選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
参考スコア（独自算出の注目度）: 3.603351032105088
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Symbolic task planning is a widely used approach to enforce robot autonomy due to its ease of understanding and deployment. However, symbolic task planning is difficult to scale in real-world when frequent re-planning is needed, for example, due to human-robot interactions or unforeseen events. Plan length and planning time can hinder the robot's efficiency and negatively affect the overall human-robot interaction's fluency. We present a framework, Teriyaki, designed to bridge the gap between symbolic task planning and machine learning approaches, by training Large Language Models (LLMs), namely GPT-3, into neurosymbolic task planners compatible with the Planning Domain Definition Language (PDDL). Potential benefits include: (i) better scalability in so far as the planning domain complexity increases, since LLMs' response time linearly scales with the combined length of the input and the output, instead of super-linearly as in the case of symbolic task planners, and (ii) the ability to synthesize a plan action-by-action instead of end-to-end, and to make each action available for execution as soon as it is generated, which in turn enables concurrent planning and execution. In the past year, significant efforts have been devoted by the research community to evaluate the overall cognitive abilities of LLMs, with alternate successes. Instead, with Teriyaki we aim to providing an overall planning performance comparable to traditional planners in specific planning domains, while leveraging LLMs capabilities in other metrics which are used to build a look-ahead predictive planning model. Preliminary results in selected domains show that our method can: (i) solve 95.5% of problems in a test data set of 1000 samples; (ii) produce plans up to 13.5% shorter than a traditional symbolic planner; (iii) reduce average overall waiting times for a plan availability by up to 61.4%.
Abstract（参考訳）: シンボリックタスクプランニング(symbolive task planning)は、ロボットの自律性を実現するために広く使われているアプローチである。しかし、例えば人間とロボットの相互作用や予期せぬ出来事のために、頻繁な再計画が必要な場合、象徴的なタスクプランニングは現実世界でスケールすることが困難である。計画の長さと計画時間はロボットの効率を阻害し、人間とロボットの相互作用の流速に悪影響を及ぼす。本稿では,大規模言語モデル (LLM) を,計画領域定義言語 (PDDL) と互換性のあるニューロシンボリックタスクプランナーに訓練することにより,記号的タスク計画と機械学習アプローチのギャップを埋めるためのフレームワークであるテリヤキを提案する。潜在的な利点は i) LLMの応答時間は、シンボリックタスクプランナーのように超直線ではなく、入力と出力の組合せで線形にスケールするため、計画領域の複雑さが増大するほどスケーラビリティが向上する。 (ii) エンド・ツー・エンドではなくプラン・アクション・バイ・アクションを合成し、各アクションが生成されたらすぐに実行できるようにし、同時に計画と実行を可能にします。過去1年間、研究コミュニティはllmの全体的な認知能力を評価することに多大な努力を捧げてきた。その代わり、teriyakiでは、特定の計画領域における従来のプランナーに匹敵する全体的なプランニングパフォーマンスを提供し、ルックアヘッド予測計画モデルを構築するために使用される他のメトリクスでllms機能を活用します。選択されたドメインにおける予備的な結果は、我々のメソッドが可能であることを示す。 (i)1000サンプルの試験データセットにおいて95.5%の問題を解決する。 (ii) 従来の象徴的プランナーよりも最大13.5%短いプランを生産する。 (iii)計画提供の待ち時間の平均を61.4%削減する。

関連論文リスト

Efficient Robotic Policy Learning via Latent Space Backward Planning [17.770562202624962]
現行のロボット計画手法は、しばしば、全画素の詳細を持つ多フレーム画像の予測に頼っている。本稿では,その課題を最終目標とするLBP(Latent Space Backward Planning scheme)を提案する。 LBPは既存の細粒度・前方計画法よりも優れた性能を示し,SOTA性能を実現している。
論文参考訳（メタデータ） (2025-05-11T06:13:51Z)
HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking [109.09735490692202]
提案するHyperTree Planning(HTP)は,高木構造プランニングアウトラインを構成する新しい推論パラダイムである。実験ではHTPの有効性を実証し、Gemini-1.5-ProによるTravelPlannerベンチマークで最先端の精度を実現し、o1-previewよりも3.6倍の性能向上を実現した。
論文参考訳（メタデータ） (2025-05-05T02:38:58Z)
Plan-and-Act: Improving Planning of Agents for Long-Horizon Tasks [36.63527489464188]
Plan-and-Actは、大規模言語モデル(LLM)に明示的なプランニングを組み込んだフレームワークである。 Plan-and-Actは、ユーザ目標を達成するための構造化された高レベルのプランを生成するPlannerモデルと、これらのプランを環境固有のアクションに変換するExecutorモデルで構成される。 We present a state-of-the-art 57.58% success rate on the WebArena-Lite benchmark and a text-only state-of-the-art 81.36% success rate on WebVoyager。
論文参考訳（メタデータ） (2025-03-12T17:40:52Z)
Zero-shot Robotic Manipulation with Language-guided Instruction and Formal Task Planning [16.89900521727246]
本稿では,言語誘導型シンボリックタスク計画(LM-SymOpt)フレームワークの最適化を提案する。大規模言語モデルからの世界的知識と公式な推論を組み合わせた最初のエキスパートフリーな計画フレームワークです。実験の結果,LM-SymOpt は既存の LLM ベースの計画手法よりも優れていた。
論文参考訳（メタデータ） (2025-01-25T13:33:22Z)
Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。 CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文参考訳（メタデータ） (2024-09-19T04:13:58Z)
LASP: Surveying the State-of-the-Art in Large Language Model-Assisted AI Planning [7.36760703426119]
この調査は、言語モデルで計画する際の既存の課題を強調することを目的としている。実施環境、最適なスケジューリング、競争と協力のゲーム、タスクの分解、推論、計画といった重要な分野に焦点を当てている。
論文参考訳（メタデータ） (2024-09-03T11:39:52Z)
PDDLEGO: Iterative Planning in Textual Environments [56.12148805913657]
テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文参考訳（メタデータ） (2024-05-30T08:01:20Z)
DELTA: Decomposed Efficient Long-Term Robot Task Planning using Large Language Models [5.385540718118656]
大規模言語モデル(LLM)に基づく新しいタスク計画手法であるDELTAを紹介する。シーングラフをLLM内の環境表現として使用することにより、DELTAは正確な計画問題記述を迅速に生成する。 DELTAは効率的かつ完全に自動化されたタスク計画パイプラインを実現し、高い計画成功率と、最先端技術と比較して計画時間を大幅に短縮できることを示す。
論文参考訳（メタデータ） (2024-04-04T07:59:24Z)
Consolidating Trees of Robotic Plans Generated Using Large Language Models to Improve Reliability [6.4111574364474215]
LLM(Large Language Models)の固有の確率論的性質は、予測不可能な要素を導入している。本稿では,多様な現実の要求やシナリオに対して,適切なロボットタスク計画を作成することを目的とした,革新的なアプローチを提案する。
論文参考訳（メタデータ） (2024-01-15T18:01:59Z)
Learning adaptive planning representations with natural language guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。 Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文参考訳（メタデータ） (2023-12-13T23:35:31Z)
Planning as In-Painting: A Diffusion-Based Embodied Task Planning Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。 In-paintingとしての計画」というタスク非依存の手法を提案する。提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-12-02T10:07:17Z)
A Planning Ontology to Represent and Exploit Planning Knowledge for Performance Efficiency [6.87593454486392]
我々は,エージェントを世界の初期状態から望ましい目標状態へ移動させる一連の行動を見つけることを目的として,自動計画の問題を考える。利用可能なプランナと多様なプランナドメインが多数用意されていると仮定し、適切なプランナを特定し、ドメインのパフォーマンスを向上させるために活用できる不可欠な情報を持っている。
論文参考訳（メタデータ） (2023-07-25T14:51:07Z)
AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文参考訳（メタデータ） (2023-05-26T05:52:27Z)
Learning to Reason over Scene Graphs: A Case Study of Finetuning GPT-2 into a Robot Language Model for Grounded Task Planning [45.51792981370957]
本研究では,ロボットタスク計画における小クラス大規模言語モデル(LLM)の適用性について,計画立案者が順次実行するためのサブゴール仕様にタスクを分解することを学ぶことによって検討する。本手法は,シーングラフとして表現される領域上でのLLMの入力に基づいて,人間の要求を実行可能なロボット計画に変換する。本研究は,LLMに格納された知識を長期タスクプランニングに効果的に活用できることを示唆し,ロボット工学におけるニューロシンボリックプランニング手法の今後の可能性を示すものである。
論文参考訳（メタデータ） (2023-05-12T18:14:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。