論文の概要: NL2SpaTiaL: Generating Geometric Spatio-Temporal Logic Specifications from Natural Language for Manipulation Tasks
- arxiv url: http://arxiv.org/abs/2512.13670v1
- Date: Mon, 15 Dec 2025 18:56:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.36105
- Title: NL2SpaTiaL: Generating Geometric Spatio-Temporal Logic Specifications from Natural Language for Manipulation Tasks
- Title(参考訳): NL2SpaTiaL: 操作タスクのための自然言語からの幾何学的時空間論理仕様の生成
- Authors: Licheng Luo, Yu Xia, Kaier Liang, Mingyu Cai,
- Abstract要約: Spatio-Temporal Logic (SpaTiaL) は幾何学的空間的要求を表現するための定式化を提供する。
本稿では、SpaTiaL仕様を合成し、それらを自然言語記述に変換するデータセット生成フレームワークを提案する。
このパイプラインはNL2SpaTiaLデータセットを生成する。
- 参考スコア(独自算出の注目度): 8.178210432886237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatio-Temporal Logic (SpaTiaL) offers a principled formalism for expressing geometric spatial requirements-an essential component of robotic manipulation, where object locations, neighborhood relations, pose constraints, and interactions directly determine task success. Yet prior works have largely relied on standard temporal logic (TL), which models only robot trajectories and overlooks object-level interactions. Existing datasets built from randomly generated TL formulas paired with natural-language descriptions therefore cover temporal operators but fail to represent the layered spatial relations that manipulation tasks depend on. To address this gap, we introduce a dataset generation framework that synthesizes SpaTiaL specifications and converts them into natural-language descriptions through a deterministic, semantics-preserving back-translation procedure. This pipeline produces the NL2SpaTiaL dataset, aligning natural language with multi-level spatial relations and temporal objectives to reflect the compositional structure of manipulation tasks. Building on this foundation, we propose a translation-verification framework equipped with a language-based semantic checker that ensures the generated SpaTiaL formulas faithfully encode the semantics specified by the input description. Experiments across a suite of manipulation tasks show that SpaTiaL-based representations yield more interpretable, verifiable, and compositional grounding for instruction following. Project website: https://sites.google.com/view/nl2spatial
- Abstract(参考訳): Spatio-Temporal Logic (SpaTiaL) は、幾何学的空間的要求を表現するための原則的な形式主義を提供する。
しかし、従来の研究は、ロボット軌道のみをモデル化し、オブジェクトレベルの相互作用を見落としている標準時相論理(TL)に大きく依存していた。
既存のデータセットは、ランダムに生成されたTL式と自然言語記述のペアで構築されており、時間演算子をカバーしているが、操作タスクが依存する階層化された空間関係を表現できない。
このギャップに対処するために、SpaTiaL仕様を合成し、決定論的で意味論的に保存されるバック翻訳手順によって自然言語記述に変換するデータセット生成フレームワークを導入する。
このパイプラインはNL2SpaTiaLデータセットを生成し、自然言語を多レベル空間関係と時間的目的に整合させて操作タスクの構成構造を反映する。
本稿では,この基盤の上に言語ベースのセマンティックチェッカーを組み込んだ翻訳検証フレームワークを提案し,入力記述によって指定されたセマンティックスを忠実にエンコードする。
操作タスクの一連の実験により、SpatiaLベースの表現は、指示に従う上でより解釈可能で、検証可能で、構成上の基礎となることが示されている。
プロジェクトウェブサイト: https://sites.google.com/view/nl2spatial
関連論文リスト
- OVerSeeC: Open-Vocabulary Costmap Generation from Satellite Images and Natural Language [11.384592553913778]
本稿では,この問題をInterpret--Synthesize:iに分解するゼロショットモジュラーフレームワークを提案する。
我々はOVerSeeCがランク付けや構成の好みを処理し,多様な領域にまたがる人力トラジェクトリと整合した経路を生成することを示す。
論文 参考訳(メタデータ) (2026-02-20T20:49:07Z) - HELP: Hierarchical Embodied Language Planner for Household Tasks [75.38606213726906]
複雑なシナリオを扱うエージェントは、堅牢な計画能力に大きく依存する。
広範な言語知識を備えた大規模言語モデルは、この役割を果たすことができる。
LLMをベースとした一組のエージェントからなる階層型エンボディード言語プランナーHELPを提案する。
論文 参考訳(メタデータ) (2025-12-25T15:54:08Z) - Data Dependency-Aware Code Generation from Enhanced UML Sequence Diagrams [54.528185120850274]
本稿では,API2Depという新しいステップバイステップコード生成フレームワークを提案する。
まず、サービス指向アーキテクチャに適した拡張Unified Modeling Language (UML) APIダイアグラムを紹介します。
次に、データフローの重要な役割を認識し、専用のデータ依存推論タスクを導入する。
論文 参考訳(メタデータ) (2025-08-05T12:28:23Z) - CoT-TL: Low-Resource Temporal Knowledge Representation of Planning Instructions Using Chain-of-Thought Reasoning [1.433758865948252]
我々は、自然言語仕様を表現に変換するためのデータ効率のよいインコンテキスト学習フレームワークであるCoT-TLを紹介した。
CoT-TLは、ローデータシナリオで3つの多様なデータセット間で最先端の精度を達成する。
我々はCoT-TLの実用性を自然言語命令に基づく多段階ドローン計画のためのQuadCopterに組み込む。
論文 参考訳(メタデータ) (2024-10-21T17:10:43Z) - Large Language Models are Interpretable Learners [53.56735770834617]
本稿では,Large Language Models(LLM)とシンボルプログラムの組み合わせによって,表現性と解釈可能性のギャップを埋めることができることを示す。
自然言語プロンプトを持つ事前訓練されたLLMは、生の入力を自然言語の概念に変換することができる解釈可能な膨大なモジュールセットを提供する。
LSPが学んだ知識は自然言語の記述と記号規則の組み合わせであり、人間(解釈可能)や他のLLMに容易に転送できる。
論文 参考訳(メタデータ) (2024-06-25T02:18:15Z) - Data-Efficient Learning of Natural Language to Linear Temporal Logic
Translators for Robot Task Specification [6.091096843566857]
本稿では、自然言語コマンドから、人間ラベルの訓練データに制限のある仕様への変換を学習ベースで行う手法を提案する。
これは、人間のラベル付きデータセットを必要とする既存の自然言語から翻訳者への変換とは対照的である。
自然言語コマンドを75%の精度で翻訳できることを示す。
論文 参考訳(メタデータ) (2023-03-09T00:09:58Z) - Generalizing to New Domains by Mapping Natural Language to Lifted LTL [20.58567011476273]
本稿では、ひとつの肯定的なタスク仕様例から学習可能な、中間的コンテキストクエリ表現を提案する。
我々は、自然言語を翻訳できる最先端のCopyNetモデルと比較する。
シミュレーションされたOO-MDP環境において,提案手法の出力を計画に利用できることを実証した。
論文 参考訳(メタデータ) (2021-10-11T20:49:26Z) - SML: a new Semantic Embedding Alignment Transformer for efficient
cross-lingual Natural Language Inference [71.57324258813674]
トランスフォーマーが質問応答、自然言語推論(NLI)、要約といった様々なタスクを精度良く実行できることは、現在この種のタスクに対処するための最良のパラダイムの1つとしてランク付けすることができる。
nliは、複雑な文を理解するための知識が必要であり、仮説と前提の関係を確立するため、これらのアーキテクチャをテストする最良のシナリオの1つである。
本稿では,自然言語推論のための多言語組込みを効率的にアライメントするための新しいアーキテクチャ siamese multilingual transformer を提案する。
論文 参考訳(メタデータ) (2021-03-17T13:23:53Z) - Structured Prediction as Translation between Augmented Natural Languages [109.50236248762877]
本研究では,構造化予測言語の課題を解決するために,新しいフレームワークであるTANL(Translation between Augmented Natural Languages)を提案する。
タスク固有の差別を訓練することで問題に取り組む代わりに、拡張自然言語間の翻訳タスクとして位置づける。
提案手法は, タスク固有のモデルに適合するか, 性能に優れ, 特に, 共同エンティティと関係抽出に関する新たな最先端結果が得られる。
論文 参考訳(メタデータ) (2021-01-14T18:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。