論文の概要: SymPlanner: Deliberate Planning in Language Models with Symbolic Representation
- arxiv url: http://arxiv.org/abs/2505.01479v1
- Date: Fri, 02 May 2025 15:18:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.143144
- Title: SymPlanner: Deliberate Planning in Language Models with Symbolic Representation
- Title(参考訳): SymPlanner: 記号表現を伴う言語モデルにおける検討計画
- Authors: Siheng Xiong, Jieyu Zhou, Zhangding Liu, Yusen Su,
- Abstract要約: 構造化計画機能を備えた言語モデルを備えた新しいフレームワークであるSymPlannerを紹介する。
SymPlannerは、ポリシーモデルがアクションを提案し、象徴的な環境が決定論的にそれらの効果を実行し検証する、象徴的な状態空間における計画プロセスの基盤となる。
我々はPlan Bench上でSymPlannerを評価し、純粋な自然言語ベースラインよりも一貫性があり、多様性があり、検証可能なプランを生成することを示した。
- 参考スコア(独自算出の注目度): 0.9374652839580183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Planning remains a core challenge for language models (LMs), particularly in domains that require coherent multi-step action sequences grounded in external constraints. We introduce SymPlanner, a novel framework that equips LMs with structured planning capabilities by interfacing them with a symbolic environment that serves as an explicit world model. Rather than relying purely on natural language reasoning, SymPlanner grounds the planning process in a symbolic state space, where a policy model proposes actions and a symbolic environment deterministically executes and verifies their effects. To enhance exploration and improve robustness, we introduce Iterative Correction (IC), which refines previously proposed actions by leveraging feedback from the symbolic environment to eliminate invalid decisions and guide the model toward valid alternatives. Additionally, Contrastive Ranking (CR) enables fine-grained comparison of candidate plans by evaluating them jointly. We evaluate SymPlanner on PlanBench, demonstrating that it produces more coherent, diverse, and verifiable plans than pure natural language baselines.
- Abstract(参考訳): プランニングは言語モデル(LM)にとって、特に外部制約を前提とした一貫性のあるマルチステップアクションシーケンスを必要とする領域において、依然として重要な課題である。
シムプランナー(SymPlanner)は、明示的な世界モデルとして機能するシンボリック環境と相互作用することで、構造化計画能力を備えたLMを具備する新しいフレームワークである。
SymPlannerは、自然言語の推論に純粋に依存するのではなく、政策モデルが行動を提案し、象徴的な環境が決定論的にそれらの効果を実行し検証する、象徴的な状態空間に計画プロセスの基礎を置く。
探索の強化とロバスト性向上のために,シンボル環境からのフィードバックを活用し,無効な決定を排除し,有効な代替案に向けてモデルを導くことで,従来提案されていた行動を洗練する反復補正(IC)を導入する。
さらに、CR(Contrastive Ranking)は、それらを共同で評価することで、候補プランのきめ細かい比較を可能にする。
我々はPlan Bench上でSymPlannerを評価し、純粋な自然言語ベースラインよりも一貫性があり、多様性があり、検証可能なプランを生成することを示した。
関連論文リスト
- Ontology-driven Prompt Tuning for LLM-based Task and Motion Planning [0.20940572815908076]
タスク・アンド・モーション・プランニング(TAMP)アプローチは、ハイレベルなシンボリック・プランと低レベルなモーション・プランニングを組み合わせたものである。
LLMは、タスクを記述するための直感的で柔軟な方法として自然言語を提供することによって、タスク計画を変える。
本研究は、知識に基づく推論を用いてユーザプロンプトを洗練・拡張する新しいプロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-10T13:18:45Z) - LangSuitE: Planning, Controlling and Interacting with Large Language Models in Embodied Text Environments [70.91258869156353]
テキストエンボディの世界における6つの代表的具体的タスクを特徴とする多目的・シミュレーション不要なテストベッドであるLangSuitEを紹介する。
以前のLLMベースのテストベッドと比較すると、LangSuitEは複数のシミュレーションエンジンを使わずに、多様な環境への適応性を提供する。
具体化された状態の履歴情報を要約した新しいチェーン・オブ・ソート(CoT)スキーマであるEmMemを考案する。
論文 参考訳(メタデータ) (2024-06-24T03:36:29Z) - PDDLEGO: Iterative Planning in Textual Environments [56.12148805913657]
テキスト環境における計画は、現在のモデルにおいても長年にわたる課題であることが示されている。
我々は,あるサブゴールの部分的な計画に導く計画表現を反復的に構築するPDDLEGOを提案する。
数ショットのPDDLEGOで作成するプランは,Coin Collectorシミュレーションでエンドツーエンドのプランを生成するよりも43%効率がよいことを示す。
論文 参考訳(メタデータ) (2024-05-30T08:01:20Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Emergence of Abstract State Representations in Embodied Sequence
Modeling [24.827284626429964]
シーケンスモデリングは、アクションを予測トークンとしてモデル化する言語モデルの成功を模倣することを目的としている。
学習モデルの内部アクティベーションから環境レイアウトを合理的に再構築できることを示す。
我々の結果は、より複雑な具体的決定領域へのシーケンスモデリングの目的の適用に対する楽観的な展望を支持する。
論文 参考訳(メタデータ) (2023-11-03T18:00:59Z) - Compositional Foundation Models for Hierarchical Planning [52.18904315515153]
本稿では,言語,視覚,行動データを個別に訓練し,長期的課題を解決するための基礎モデルを提案する。
我々は,大規模なビデオ拡散モデルを用いて,環境に根ざした記号的計画を構築するために,大規模言語モデルを用いている。
生成したビデオプランは、生成したビデオからアクションを推論する逆ダイナミクスモデルを通じて、視覚運動制御に基礎を置いている。
論文 参考訳(メタデータ) (2023-09-15T17:44:05Z) - Lifted Sequential Planning with Lazy Constraint Generation Solvers [28.405198103927955]
本稿では,Lzy Clause Generation(LCG)に基づく制約プログラミング(CP)へのアプローチを用いて,オープンな可能性について検討する。
本稿では,いわゆるリフト型因果エンコーディングに基づく新しいCPモデルを提案する。
提案手法は,計画手順の少ない計画インスタンスに対して,最適な逐次計画における最先端の手法と非常によく比較可能であることを報告する。
論文 参考訳(メタデータ) (2023-07-17T04:54:58Z) - AdaPlanner: Adaptive Planning from Feedback with Language Models [56.367020818139665]
大規模言語モデル(LLM)は、最近、シーケンシャルな意思決定タスクの自律的エージェントとして機能する可能性を実証している。
本研究では,LLMエージェントが環境フィードバックに応じて自己生成計画を適応的に改善することのできるクローズドループアプローチであるAdaPlannerを提案する。
幻覚を緩和するために,様々なタスク,環境,エージェント機能にまたがる計画生成を容易にするコードスタイルのLCMプロンプト構造を開発した。
論文 参考訳(メタデータ) (2023-05-26T05:52:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。