論文の概要: A Framework for Neurosymbolic Robot Action Planning using Large Language
Models
- arxiv url: http://arxiv.org/abs/2303.00438v2
- Date: Tue, 5 Dec 2023 12:51:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 20:17:32.763371
- Title: A Framework for Neurosymbolic Robot Action Planning using Large Language
Models
- Title(参考訳): 大規模言語モデルを用いたニューロシンボリックロボット行動計画のためのフレームワーク
- Authors: Alessio Capitanelli and Fulvio Mastrogiovanni
- Abstract要約: シンボリックタスク計画と機械学習アプローチのギャップを埋める枠組みを提案する。
我々は、大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する。
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
- 参考スコア(独自算出の注目度): 3.603351032105088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic task planning is a widely used approach to enforce robot autonomy
due to its ease of understanding and deployment. However, symbolic task
planning is difficult to scale in real-world when frequent re-planning is
needed, for example, due to human-robot interactions or unforeseen events. Plan
length and planning time can hinder the robot's efficiency and negatively
affect the overall human-robot interaction's fluency. We present a framework,
Teriyaki, designed to bridge the gap between symbolic task planning and machine
learning approaches, by training Large Language Models (LLMs), namely GPT-3,
into neurosymbolic task planners compatible with the Planning Domain Definition
Language (PDDL). Potential benefits include: (i) better scalability in so far
as the planning domain complexity increases, since LLMs' response time linearly
scales with the combined length of the input and the output, instead of
super-linearly as in the case of symbolic task planners, and (ii) the ability
to synthesize a plan action-by-action instead of end-to-end, and to make each
action available for execution as soon as it is generated, which in turn
enables concurrent planning and execution. In the past year, significant
efforts have been devoted by the research community to evaluate the overall
cognitive abilities of LLMs, with alternate successes. Instead, with Teriyaki
we aim to providing an overall planning performance comparable to traditional
planners in specific planning domains, while leveraging LLMs capabilities in
other metrics which are used to build a look-ahead predictive planning model.
Preliminary results in selected domains show that our method can: (i) solve
95.5% of problems in a test data set of 1000 samples; (ii) produce plans up to
13.5% shorter than a traditional symbolic planner; (iii) reduce average overall
waiting times for a plan availability by up to 61.4%.
- Abstract(参考訳): シンボリックタスクプランニング(symbolive task planning)は、ロボットの自律性を実現するために広く使われているアプローチである。
しかし、例えば人間とロボットの相互作用や予期せぬ出来事のために、頻繁な再計画が必要な場合、象徴的なタスクプランニングは現実世界でスケールすることが困難である。
計画の長さと計画時間はロボットの効率を阻害し、人間とロボットの相互作用の流速に悪影響を及ぼす。
本稿では,大規模言語モデル (LLM) を,計画領域定義言語 (PDDL) と互換性のあるニューロシンボリックタスクプランナーに訓練することにより,記号的タスク計画と機械学習アプローチのギャップを埋めるためのフレームワークであるテリヤキを提案する。
潜在的な利点は
i) LLMの応答時間は、シンボリックタスクプランナーのように超直線ではなく、入力と出力の組合せで線形にスケールするため、計画領域の複雑さが増大するほどスケーラビリティが向上する。
(ii) エンド・ツー・エンドではなくプラン・アクション・バイ・アクションを合成し、各アクションが生成されたらすぐに実行できるようにし、同時に計画と実行を可能にします。
過去1年間、研究コミュニティはllmの全体的な認知能力を評価することに多大な努力を捧げてきた。
その代わり、teriyakiでは、特定の計画領域における従来のプランナーに匹敵する全体的なプランニングパフォーマンスを提供し、ルックアヘッド予測計画モデルを構築するために使用される他のメトリクスでllms機能を活用します。
選択されたドメインにおける予備的な結果は、我々のメソッドが可能であることを示す。
(i)1000サンプルの試験データセットにおいて95.5%の問題を解決する。
(ii) 従来の象徴的プランナーよりも最大13.5%短いプランを生産する。
(iii)計画提供の待ち時間の平均を61.4%削減する。
関連論文リスト
- Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - LASP: Surveying the State-of-the-Art in Large Language Model-Assisted AI Planning [7.36760703426119]
この調査は、言語モデルで計画する際の既存の課題を強調することを目的としている。
実施環境、最適なスケジューリング、競争と協力のゲーム、タスクの分解、推論、計画といった重要な分野に焦点を当てている。
論文 参考訳(メタデータ) (2024-09-03T11:39:52Z) - PDDLEGO: Iterative Planning in Textual Environments [56.12148805913657]
テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。
我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。
数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文 参考訳(メタデータ) (2024-05-30T08:01:20Z) - DELTA: Decomposed Efficient Long-Term Robot Task Planning using Large Language Models [5.385540718118656]
大規模言語モデル(LLM)に基づく新しいタスク計画手法であるDELTAを紹介する。
シーングラフをLLM内の環境表現として使用することにより、DELTAは正確な計画問題記述を迅速に生成する。
DELTAは効率的かつ完全に自動化されたタスク計画パイプラインを実現し、高い計画成功率と、最先端技術と比較して計画時間を大幅に短縮できることを示す。
論文 参考訳(メタデータ) (2024-04-04T07:59:24Z) - Consolidating Trees of Robotic Plans Generated Using Large Language
Models to Improve Reliability [6.4111574364474215]
LLM(Large Language Models)の固有の確率論的性質は、予測不可能な要素を導入している。
本稿では,多様な現実の要求やシナリオに対して,適切なロボットタスク計画を作成することを目的とした,革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-01-15T18:01:59Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - A Planning Ontology to Represent and Exploit Planning Knowledge for Performance Efficiency [6.87593454486392]
我々は,エージェントを世界の初期状態から望ましい目標状態へ移動させる一連の行動を見つけることを目的として,自動計画の問題を考える。
利用可能なプランナと多様なプランナドメインが多数用意されていると仮定し、適切なプランナを特定し、ドメインのパフォーマンスを向上させるために活用できる不可欠な情報を持っている。
論文 参考訳(メタデータ) (2023-07-25T14:51:07Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z) - Learning to Reason over Scene Graphs: A Case Study of Finetuning GPT-2
into a Robot Language Model for Grounded Task Planning [45.51792981370957]
本研究では,ロボットタスク計画における小クラス大規模言語モデル(LLM)の適用性について,計画立案者が順次実行するためのサブゴール仕様にタスクを分解することを学ぶことによって検討する。
本手法は,シーングラフとして表現される領域上でのLLMの入力に基づいて,人間の要求を実行可能なロボット計画に変換する。
本研究は,LLMに格納された知識を長期タスクプランニングに効果的に活用できることを示唆し,ロボット工学におけるニューロシンボリックプランニング手法の今後の可能性を示すものである。
論文 参考訳(メタデータ) (2023-05-12T18:14:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。