論文の概要: Latent Planning Emerges with Scale
- arxiv url: http://arxiv.org/abs/2604.12493v1
- Date: Tue, 14 Apr 2026 09:18:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.371223
- Title: Latent Planning Emerges with Scale
- Title(参考訳): スケールによる潜在計画の創出
- Authors: Michael Hanna, Emmanuel Ameisen,
- Abstract要約: 簡単な計画課題についてQwen-3ファミリー (0.6B-14B) について検討し, 遅延計画能力はスケールとともに増大することを示した。
韻律を完遂するより複雑なタスクでは、モデルが前もって韻律を識別することが多いが、大きなモデルでさえ、それほど先進的な計画を立てることは滅多にない。
- 参考スコア(独自算出の注目度): 2.8074191213147652
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLMs can perform seemingly planning-intensive tasks, like writing coherent stories or functioning code, without explicitly verbalizing a plan; however, the extent to which they implicitly plan is unknown. In this paper, we define latent planning as occurring when LLMs possess internal planning representations that (1) cause the generation of a specific future token or concept, and (2) shape preceding context to license said future token or concept. We study the Qwen-3 family (0.6B-14B) on simple planning tasks, finding that latent planning ability increases with scale. Models that plan possess features that represent a planned-for word like "accountant", and cause them to output "an" rather than "a"; moreover, even the less-successful Qwen-3 4B-8B have nascent planning mechanisms. On the more complex task of completing rhyming couplets, we find that models often identify a rhyme ahead of time, but even large models seldom plan far ahead. However, we can elicit some planning that increases with scale when steering models towards planned words in prose. In sum, we offer a framework for measuring planning and mechanistic evidence of how models' planning abilities grow with scale.
- Abstract(参考訳): LLMは、計画を明確に言葉で表すことなく、一貫性のあるストーリーを書いたり、機能するコードを書いたりといった、計画集約的なタスクを実行できるが、彼らが暗黙的に計画する範囲は未知である。
本稿では, LLM が,(1) 特定の将来トークンや概念の生成を引き起こす内部計画表現を持つ場合に発生する潜在計画を定義し,(2) 当該将来トークンや概念のライセンス化に先行するコンテキストを形作る。
簡単な計画課題についてQwen-3ファミリー (0.6B-14B) について検討し, 遅延計画能力はスケールとともに増大することを示した。
計画するモデルは「会計士」のような計画された単語を表す特徴を持ち、それらが「a」ではなく「an」を出力させる。
韻律を完遂するより複雑なタスクでは、モデルが前もって韻律を識別することが多いが、大きなモデルでさえ、それほど先進的な計画を立てることは滅多にない。
しかし, 提案手法では, 提案する単語に対して, 提案する単語を定式化する際に, 規模が大きくなるプランニングを行うことが可能である。
まとめると、我々は、モデルプランニング能力がスケールでどのように成長するかを示す計画と機械的証拠を測定するためのフレームワークを提供する。
関連論文リスト
- Enhancing Cognitive Robotics with Commonsense through LLM-Generated Preconditions and Subgoals [0.0]
伝統的な象徴的なプランナーは、明示的に記述するために隠れた前提条件と小さなサブゴールが必要である。
このプロジェクトでは、大きな言語モデルとシンボリックプランニングを組み合わせています。
我々のシステムは、より有効な計画を作成し、より高いタスク成功率を達成し、環境の変化に適応する。
論文 参考訳(メタデータ) (2025-11-24T11:16:41Z) - Detecting and Characterizing Planning in Language Models [1.320426480090921]
本稿では,半自動アノテーションパイプラインとして計画および運用を行うための形式的かつ因果的基準を提案する。
このパイプラインを,MBPPコード生成ベンチマークと詩生成タスク上で,ベースおよび命令調整されたGemma-2-2Bモデルに適用する。
Gemma-2-2B は即興で同じ詩生成タスクを解くが,MBPP では同様のタスクにまたがって計画と即興を切り替え,さらに連続したトークン予測も行う。
論文 参考訳(メタデータ) (2025-08-25T14:59:46Z) - Wide-Horizon Thinking and Simulation-Based Evaluation for Real-World LLM Planning with Multifaceted Constraints [39.01715254437105]
本稿では,多面制約による計画課題を解決するための多面計画(MAoP)について紹介する。
MAoPは直接計画するのではなく、ストラテジストを活用して、さまざまな側面から事前計画を行い、プランナーのための計画青写真を提供する。
論文 参考訳(メタデータ) (2025-06-14T09:37:59Z) - Counting and Reasoning with Plans [19.223883847258158]
本研究は,計画空間の定量的,定性的推論のための最初の研究である。
理論的には、その複雑さについて研究し、リッチな推論モードが生まれる。
そこで我々は,計画課題を命題式に変換し,異なる計画を立てるために知識コンパイルを利用する。
論文 参考訳(メタデータ) (2025-01-31T20:03:51Z) - LLM-Assist: Enhancing Closed-Loop Planning with Language-Based Reasoning [65.86754998249224]
従来のルールベースプランナとLCMベースのプランナを併用した,新しいハイブリッドプランナを開発した。
当社のアプローチでは,既存のプランナが苦労する複雑なシナリオをナビゲートし,合理的なアウトプットを生成すると同時に,ルールベースのアプローチと連携して作業する。
論文 参考訳(メタデータ) (2023-12-30T02:53:45Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - PlaSma: Making Small Language Models Better Procedural Knowledge Models for (Counterfactual) Planning [77.03847056008598]
PlaSmaは、手続き的な知識と(制約のある)言語計画能力を持つ小さな言語モデルを実現するための、新しい2段階のアプローチである。
我々は,小言語モデルにおけるコモンセンス知識を高めるための記号的手続き的知識蒸留法と,より構造化された正確な推論を容易にする推論時アルゴリズムを開発する。
論文 参考訳(メタデータ) (2023-05-31T00:55:40Z) - PlanBench: An Extensible Benchmark for Evaluating Large Language Models
on Planning and Reasoning about Change [34.93870615625937]
PlanBenchは、自動計画コミュニティで使用されるドメインの種類に基づいたベンチマークスイートである。
PlanBenchはタスクドメインと特定の計画機能の両方に十分な多様性を提供します。
論文 参考訳(メタデータ) (2022-06-21T16:15:27Z) - Planning with Learned Object Importance in Large Problem Instances using
Graph Neural Networks [28.488201307961624]
現実の計画問題は、数百から数千ものオブジェクトを巻き込むことが多い。
単一推論パスにおけるオブジェクトの重要性を予測するためのグラフニューラルネットワークアーキテクチャを提案する。
提案手法では,プランナと遷移モデルをブラックボックスとして扱い,既製のプランナで使用することができる。
論文 参考訳(メタデータ) (2020-09-11T18:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。