論文の概要: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
- arxiv url: http://arxiv.org/abs/2602.12244v1
- Date: Thu, 12 Feb 2026 18:28:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.410024
- Title: Any House Any Task: Scalable Long-Horizon Planning for Abstract Human Tasks
- Title(参考訳): どんな家でも: 抽象的なヒューマンタスクのためのスケーラブルな長期計画
- Authors: Zhihong Liu, Yang Li, Rengming Huang, Cewu Lu, Panpan Cai,
- Abstract要約: AHAT(Any House Any Task)は、大規模環境における長期計画に最適化された家庭用タスクプランナーである。
AHATは、タスク命令とテキストシーングラフを計画ドメイン定義言語(PDDL)で定義された接地サブゴールにマッピングするために訓練されたLLMを利用する
複雑で曖昧な意図を分解するモデルの能力を高めるために,新しい強化学習アルゴリズムであるTGPOを導入する。
- 参考スコア(独自算出の注目度): 46.59814877000871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open world language conditioned task planning is crucial for robots operating in large-scale household environments. While many recent works attempt to address this problem using Large Language Models (LLMs) via prompting or training, a key challenge remains scalability. Performance often degrades rapidly with increasing environment size, plan length, instruction ambiguity, and constraint complexity. In this work, we propose Any House Any Task (AHAT), a household task planner optimized for long-horizon planning in large environments given ambiguous human instructions. At its core, AHAT utilizes an LLM trained to map task instructions and textual scene graphs into grounded subgoals defined in the Planning Domain Definition Language (PDDL). These subgoals are subsequently solved to generate feasible and optimal long-horizon plans through explicit symbolic reasoning. To enhance the model's ability to decompose complex and ambiguous intentions, we introduce TGPO, a novel reinforcement learning algorithm that integrates external correction of intermediate reasoning traces into Group Relative Policy Optimization (GRPO). Experiments demonstrate that AHAT achieves significant performance gains over state-of-the-art prompting, planning, and learning methods, particularly in human-style household tasks characterized by brief instructions but requiring complex execution plans.
- Abstract(参考訳): オープンワールド言語条件付きタスクプランニングは、大規模家庭環境で動作するロボットにとって不可欠である。
最近の多くの研究は、プロンプトやトレーニングを通じて、LLM(Large Language Models)を使ってこの問題に対処しようとしているが、重要な課題は拡張性である。
性能は環境サイズ、計画の長さ、命令のあいまいさ、制約の複雑さによって急速に低下することが多い。
本研究では,大規模環境における長期計画に最適化された家庭用タスクプランナであるAny House Any Task (AHAT)を提案する。
AHATのコアとなるのは、タスク命令とテキストシーングラフを、計画ドメイン定義言語(PDDL)で定義されたグラウンド化されたサブゴールにマッピングする訓練されたLLMである。
これらのサブゴールはその後、明示的な記号的推論を通じて実現可能で最適な長距離計画を生成するために解決される。
複雑で曖昧な意図を分解するモデルの能力を高めるために,グループ相対政策最適化(GRPO)に中間的推論トレースの外部修正を統合する新しい強化学習アルゴリズムTGPOを導入する。
実験により、AHATは最先端のプロンプト、計画、学習方法、特に簡単な指示で特徴づけられた人間スタイルの家庭作業において、複雑な実行計画を必要とする場合よりも顕著なパフォーマンス向上を実現していることが示された。
関連論文リスト
- Scale-Plan: Scalable Language-Enabled Task Planning for Heterogeneous Multi-Robot Teams [11.964765256346857]
不均質なマルチロボットシステムのための長期タスクプランニングは、実環境における協調チームの配置に不可欠である。
自然言語命令からタスク関連問題表現をコンパクトに生成する,スケーラブルなLLM支援フレームワークであるScale-Planを提案する。
計画に先立って無関係な情報をフィルタリングすることにより、スケールプランは効率的な分解、割り当て、長期計画生成を可能にします。
論文 参考訳(メタデータ) (2026-03-09T18:13:18Z) - Think Small, Plan Smart: Minimalist Symbolic Abstraction and Heuristic Subspace Search for LLM-Guided Task Planning [19.421916137269275]
大規模言語モデル(LLM)は、複雑で曖昧な自然言語命令を実行可能な計画に変換するための有望なインターフェースを提供する。
最近のフレームワークは、まずアクションモデル(Planning Domain Definition Language)を生成し、次に検索を適用することで、LCMとシンボリックプランナーを組み合わせる。
抽象的シンボル表現とメタヒューリスティックな部分空間探索を並列かつ反復的に統合する2段階のLLMシンボリック計画フレームワークPLAHXを提案する。
論文 参考訳(メタデータ) (2025-01-25T13:33:22Z) - Nl2Hltl2Plan: Scaling Up Natural Language Understanding for Multi-Robots Through Hierarchical Temporal Logic Task Representation [8.180994118420053]
Nl2Hltl2Planは自然言語コマンドを階層線形時間論理(LTL)に変換するフレームワーク
まず、LLMは命令を階層的なタスクツリーに変換し、論理的および時間的関係をキャプチャする。
次に、微調整されたLLMは、サブタスクをフラットな公式に変換し、階層的な仕様に集約する。
論文 参考訳(メタデータ) (2024-08-15T14:46:13Z) - AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [81.32722475387364]
大規模言語モデルに基づくエージェントが注目され、ますます人気が高まっている。
計画能力は LLM ベースのエージェントの重要な構成要素であり、通常は初期状態から望ましい目標を達成する必要がある。
近年の研究では、専門家レベルの軌跡を指導訓練用LLMに活用することで、効果的に計画能力を向上させることが示されている。
論文 参考訳(メタデータ) (2024-08-01T17:59:46Z) - Learning adaptive planning representations with natural language
guidance [90.24449752926866]
本稿では,タスク固有の計画表現を自動構築するフレームワークであるAdaについて述べる。
Adaは、プランナー互換の高レベルアクション抽象化と、特定の計画タスク領域に適応した低レベルコントローラのライブラリを対話的に学習する。
論文 参考訳(メタデータ) (2023-12-13T23:35:31Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Robot Task Planning Based on Large Language Model Representing Knowledge
with Directed Graph Structures [2.3698227130544547]
本研究では,人間の専門知識をLLMと組み合わせたタスクプランニング手法を提案し,LLMプロンプトテンプレートであるThink_Net_Promptを設計した。
さらに,タスクを段階的に分解し,タスクツリーを生成して各タスクの計画量を削減する手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。