論文の概要: Lang2Manip: A Tool for LLM-Based Symbolic-to-Geometric Planning for Manipulation
- arxiv url: http://arxiv.org/abs/2512.17062v1
- Date: Thu, 18 Dec 2025 20:58:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.414511
- Title: Lang2Manip: A Tool for LLM-Based Symbolic-to-Geometric Planning for Manipulation
- Title(参考訳): Lang2Manip: マニピュレーションのためのLLMベースのシンボリック・ツー・ジオメトリ計画ツール
- Authors: Muhayy Ud Din, Jan Rosell, Waseem Akram, Irfan Hussain,
- Abstract要約: 本稿では,LLMをベースとしたシンボリックプランナとKauthamモーションプランニングフレームワークを接続する統合パイプラインを提案する。
本システムでは,言語命令をシンボリックな動作に変換し,カウサムのプランナーを用いて衝突のない軌道を計算・実行している。
- 参考スコア(独自算出の注目度): 1.9965927292119217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Simulation is essential for developing robotic manipulation systems, particularly for task and motion planning (TAMP), where symbolic reasoning interfaces with geometric, kinematic, and physics-based execution. Recent advances in Large Language Models (LLMs) enable robots to generate symbolic plans from natural language, yet executing these plans in simulation often requires robot-specific engineering or planner-dependent integration. In this work, we present a unified pipeline that connects an LLM-based symbolic planner with the Kautham motion planning framework to achieve generalizable, robot-agnostic symbolic-to-geometric manipulation. Kautham provides ROS-compatible support for a wide range of industrial manipulators and offers geometric, kinodynamic, physics-driven, and constraint-based motion planning under a single interface. Our system converts language instructions into symbolic actions and computes and executes collision-free trajectories using any of Kautham's planners without additional coding. The result is a flexible and scalable tool for language-driven TAMP that is generalized across robots, planning modalities, and manipulation tasks.
- Abstract(参考訳): シミュレーションは、特にタスク・アンド・モーション・プランニング(TAMP)において、幾何学、キネマティック、物理に基づく実行を伴うシンボリック推論インタフェースを開発するために不可欠である。
近年のLarge Language Models (LLM) の進歩により、ロボットは自然言語からシンボリックプランを生成することができるが、シミュレーションではロボット固有のエンジニアリングやプランナーに依存した統合が必要となることが多い。
本研究では,LLMをベースとしたシンボリックプランナとKauthamモーションプランニングフレームワークを結合して,汎用的でロボットに依存しないシンボリック・ツー・ジオメトリ操作を実現する統一パイプラインを提案する。
Kauthamは、幅広い産業用マニピュレータに対するROS互換サポートを提供し、幾何学的、キノダイナミック、物理駆動、制約に基づくモーションプランニングを単一のインターフェースで提供する。
本システムでは,言語命令を記号的動作に変換し,余分なコーディングを伴わずにKauthamのプランナを用いて衝突のない軌道を計算・実行している。
その結果、柔軟でスケーラブルな言語駆動型TAMPツールが、ロボットにまたがって一般化され、モダリティを計画し、タスクを操作できる。
関連論文リスト
- Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - Trajectory Adaptation using Large Language Models [0.8704964543257245]
新しい状況に応じた人間の指示に基づくロボット軌道の適応は、より直感的でスケーラブルな人間とロボットの相互作用を実現するために不可欠である。
本研究は,市販の移動プランナが生成する汎用ロボット軌道に適応する柔軟な言語ベースのフレームワークを提案する。
我々は、事前学習されたLLMを用いて、高密度ロボット操作のポリシーとしてコードを生成することにより、軌道方向の経路を適応させる。
論文 参考訳(メタデータ) (2025-04-17T08:48:23Z) - Autonomous Behavior Planning For Humanoid Loco-manipulation Through Grounded Language Model [6.9268843428933025]
大規模言語モデル(LLM)は、意味情報の理解と処理のための強力な計画と推論能力を示している。
本稿では,ロボットが与えられたテキストによる指示の下で,自律的に動作や低レベル実行を計画できる新しい言語モデルベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-15T17:33:32Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Creative Robot Tool Use with Large Language Models [47.11935262923095]
本稿では,暗黙的な身体的制約や長期計画を含むタスクにおいて,ツールを創造的に活用できるロボットの実現可能性について検討する。
我々は、自然言語命令を受け入れ、シミュレーションと実環境の両方でロボットを制御する実行可能なコードを出力するシステムであるRoboToolを開発した。
論文 参考訳(メタデータ) (2023-10-19T18:02:15Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z) - Long-Horizon Planning and Execution with Functional Object-Oriented
Networks [79.94575713911189]
タスク計画と実行のためのFOONとしてオブジェクトレベルの知識を活用するというアイデアを紹介します。
提案手法では,FOONをPDDLに自動変換し,市販のプランナ,アクションコンテキスト,ロボットスキルを活用する。
我々はCoppeliaSimの長期タスクに対するアプローチを実証し、学習されたアクションコンテキストを、これまで見たことのないシナリオにどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-07-12T19:29:35Z) - DeepSym: Deep Symbol Generation and Rule Learning from Unsupervised
Continuous Robot Interaction for Planning [1.3854111346209868]
ロボットアームハンドシステムは、プッシュとスタックアクションから「ロータブル」、「インサータブル」、「ラーガー・サン」と解釈できるシンボルを学習する。
本システムは,ロボットアームハンドシステムにおいて,その動作から「回転可能」,「不可能」,「大きい」と解釈可能なシンボルを学習する物理に基づく3次元シミュレーション環境で検証する。
論文 参考訳(メタデータ) (2020-12-04T11:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。