論文の概要: A Systematic Study of Large Language Models for Task and Motion Planning With PDDLStream
- arxiv url: http://arxiv.org/abs/2510.00182v1
- Date: Tue, 30 Sep 2025 19:03:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.215159
- Title: A Systematic Study of Large Language Models for Task and Motion Planning With PDDLStream
- Title(参考訳): PDDLStreamを用いたタスク・動作計画のための大規模言語モデルの体系的研究
- Authors: Jorge Mendez-Mendez,
- Abstract要約: 複雑なロボティクス問題を解決するための言語モデル(LLM)には、その計画能力を理解する必要がある。
1つの有望な方向性は、LLMのセマンティック知識とタスクと運動計画の正式な推論を統合することである。
我々は、Gemini 2.5 Flashを使って鍵となるTAMPコンポーネントを置換する16のアルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using large language models (LLMs) to solve complex robotics problems requires understanding their planning capabilities. Yet while we know that LLMs can plan on some problems, the extent to which these planning capabilities cover the space of robotics tasks is unclear. One promising direction is to integrate the semantic knowledge of LLMs with the formal reasoning of task and motion planning (TAMP). However, the myriad of choices for how to integrate LLMs within TAMP complicates the design of such systems. We develop 16 algorithms that use Gemini 2.5 Flash to substitute key TAMP components. Our zero-shot experiments across 4,950 problems and three domains reveal that the Gemini-based planners exhibit lower success rates and higher planning times than their engineered counterparts. We show that providing geometric details increases the number of task-planning errors compared to pure PDDL descriptions, and that (faster) non-reasoning LLM variants outperform (slower) reasoning variants in most cases, since the TAMP system can direct the LLM to correct its mistakes.
- Abstract(参考訳): 大きな言語モデル(LLM)を使用して複雑なロボティクス問題を解決するには、その計画能力を理解する必要がある。
しかし、LLMがいくつかの問題に取り組むことができることは分かっているが、これらの計画能力がロボティクスタスクの空間をカバーする範囲は不明確である。
1つの有望な方向性は、LLMのセマンティック知識とタスク・アンド・モーション・プランニング(TAMP)の正式な推論を統合することである。
しかし,TLMをTAMPに組み込むには,システムの設計が複雑になる。
我々は、Gemini 2.5 Flashを使って鍵となるTAMPコンポーネントを置換する16のアルゴリズムを開発した。
4,950件の課題と3つのドメインにわたるゼロショット実験の結果、ジェミニのプランナーは、エンジニアが設計したプランナーよりも成功率と計画時間が低いことがわかった。
幾何的詳細を提供することは、純粋なPDDL記述と比較してタスク計画誤差の数を増やし、(より速い)非推論LPM変種は、ほとんどの場合において(より遅い)推論変種よりも優れていることを示す。
関連論文リスト
- Inspire or Predict? Exploring New Paradigms in Assisting Classical Planners with Large Language Models [9.925353344469324]
LLM(Large Language Models)は、検索空間を熟成するための有用なアクションと状態を生成する。
本稿では,問題分解と統合された新しいプランナを提案し,まず大規模計画問題を単純なサブタスクに分解する。
複数の領域にわたるプランナの有効性を実証的に検証し,大規模計画問題の解法における空間分割の探索能力を示す。
論文 参考訳(メタデータ) (2025-08-15T15:08:07Z) - Learning to Reason and Navigate: Parameter Efficient Action Planning with Large Language Models [63.765846080050906]
本稿では,大規模言語モデル (PEAP-LLM) を用いたパラメータ効率の高いアクションプランナを提案する。
実験により,提案したREVERIEモデルが従来の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2025-05-12T12:38:20Z) - LLM+MAP: Bimanual Robot Task Planning using Large Language Models and Planning Domain Definition Language [17.914580097058106]
両手間の空間的・時間的調整が複雑になるため、両手操作は固有の課題となる。
既存の作業は主に、ロボットハンドのための人間レベルの操作スキルの獲得に重点を置いているが、長い時間軸でのタスクプランニングにはほとんど関心が払われていない。
本稿では,LLM推論とマルチエージェント計画を統合した双方向計画フレームワークであるLLM+MAPを紹介する。
論文 参考訳(メタデータ) (2025-03-21T17:04:01Z) - MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [62.854649499866774]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - Interactive and Expressive Code-Augmented Planning with Large Language Models [62.799579304821826]
大きな言語モデル(LLM)は、常識的推論と対話的な意思決定において強力な能力を示す。
近年,制御フローなどのコード・アジャセント技術を用いてLCM出力を構造化し,計画性能を向上させる技術が提案されている。
完全コード表現で動的なLEM計画手法であるREPL-Planを提案する。
論文 参考訳(メタデータ) (2024-11-21T04:23:17Z) - CoMMIT: Coordinated Multimodal Instruction Tuning [90.1532838391285]
マルチモーダル大言語モデル(MLLM)は一般に、バックボーンLLMと非テキスト入力モードの特徴エンコーダ間の協調学習を含む。
本稿では,MLLM命令のチューニングを理論的・経験的両面から解析する。
本稿では,学習のバランスを定量的に測定できるマルチモーダルバランス係数を提案する。
論文 参考訳(メタデータ) (2024-07-29T23:18:55Z) - Embodied AI in Mobile Robots: Coverage Path Planning with Large Language Models [6.860460230412773]
移動体エージェントのためのLLM方式の経路計画フレームワークを提案する。
提案する多層アーキテクチャは,経路計画段階におけるLPMを用いて,移動エージェントの低レベルアクチュエータと統合する。
本実験により,LLMの2次元平面推論能力と完全カバレッジパス計画タスクを改善することができることが示された。
論文 参考訳(メタデータ) (2024-07-02T12:38:46Z) - From Words to Actions: Unveiling the Theoretical Underpinnings of LLM-Driven Autonomous Systems [59.40480894948944]
大規模言語モデル (LLM) は、物理世界の意思決定問題を解くことができる。
このモデルの下で、LLM Plannerは、プロンプトを介して言語ベースのサブゴールを反復的に生成することにより、部分的に観測可能なマルコフ決定プロセス(POMDP)をナビゲートする。
我々は,事前学習したLLMプランナーが,文脈内学習を通じてベイズ的集計模倣学習(BAIL)を効果的に行うことを証明した。
論文 参考訳(メタデータ) (2024-05-30T09:42:54Z) - Plansformer: Generating Symbolic Plans using Transformers [24.375997526106246]
大規模言語モデル(LLM)は、自然言語処理(NLP)分野を著しく進歩させ、活発な研究対象となっている。
プランフォーマーは計画上の問題に微調整され、知識工学の努力を減らし、正確さと長さの点で良好な行動で計画を生成することができる。
Plansformerの1つの構成では、97%の有効なプランが達成されます。
論文 参考訳(メタデータ) (2022-12-16T19:06:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。