論文の概要: DAG-STL: A Hierarchical Framework for Zero-Shot Trajectory Planning under Signal Temporal Logic Specifications
- arxiv url: http://arxiv.org/abs/2604.18343v1
- Date: Mon, 20 Apr 2026 14:41:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.938818
- Title: DAG-STL: A Hierarchical Framework for Zero-Shot Trajectory Planning under Signal Temporal Logic Specifications
- Title(参考訳): DAG-STL:信号時間論理仕様に基づくゼロショット軌道計画のための階層的フレームワーク
- Authors: Ruijia Liu, Ancheng Hou, Xiao Yu, Xiang Yin,
- Abstract要約: タスクに依存しない軌道データのみを用いて,未知の動的条件下でのオフラインSTL計画について検討する。
DAG-STLは長期STL計画を3段階に変換する階層的なフレームワークである。
Maze2D、OGBench AntMaze、Cubeドメインでの実験により、DAG-STLは直接ロバスト性誘導拡散を著しく上回ることが示された。
- 参考スコア(独自算出の注目度): 7.389002274709231
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Signal Temporal Logic (STL) is a powerful language for specifying temporally structured robotic tasks. Planning executable trajectories under STL constraints remains difficult when system dynamics and environment structure are not analytically available. Existing methods typically either assume explicit models or learn task-specific behaviors, limiting zero-shot generalization to unseen STL tasks. In this work, we study offline STL planning under unknown dynamics using only task-agnostic trajectory data. Our central design philosophy is to separate logical reasoning from trajectory realization. We instantiate this idea in DAG-STL, a hierarchical framework that converts long-horizon STL planning into three stages. It first decomposes an STL formula into reachability and invariance progress conditions linked by shared timing constraints. It then allocates timed waypoints using learned reachability-time estimates. Finally, it synthesizes trajectories between these waypoints with a diffusion-based generator. This decomposition--allocation--generation pipeline reduces global planning to shorter, better-supported subproblems. To bridge the gap between planning-level correctness and execution-level feasibility, we further introduce a rollout-free dynamic consistency metric, an anytime refinement search procedure for improving multiple allocation hypotheses under finite budgets, and a hierarchical online replanning mechanism for execution-time recovery. Experiments in Maze2D, OGBench AntMaze, and the Cube domain show that DAG-STL substantially outperforms direct robustness-guided diffusion on complex long-horizon STL tasks and generalizes across navigation and manipulation settings. In a custom environment with an optimization-based reference, DAG-STL recovers most model-solvable tasks while retaining a clear computational advantage over direct optimization based on the explicit system model.
- Abstract(参考訳): Signal Temporal Logic (STL) は、時間的に構造化されたロボットタスクを特定するための強力な言語である。
システム力学と環境構造が解析的に利用できない場合,STL制約下での実行可能な軌道計画は依然として困難である。
既存のメソッドは通常、明示的なモデルを仮定するか、タスク固有の振る舞いを学習し、ゼロショットの一般化を目に見えないSTLタスクに制限する。
本研究では,タスクに依存しない軌道データのみを用いて,未知の動的条件下でのオフラインSTL計画について検討する。
私たちの中心となる設計哲学は、論理的推論と軌道的実現を分離することである。
DAG-STLは長期STL計画を3段階に変換する階層的なフレームワークである。
まず、STL式を、共有タイミング制約によってリンクされた到達性と不変な進行条件に分解する。
その後、学習した到達可能性時間見積を使ってタイムポイントを割り当てる。
最後に、拡散ベースのジェネレータでこれらのウェイポイント間の軌跡を合成する。
この分解-アロケーション-ジェネレーションパイプラインは、グローバルプランニングをより短く、よりサポートされたサブプロブレムに還元する。
さらに,計画レベルの正しさと実行レベルの実現可能性のギャップを埋めるために,ロールアウト不要な動的整合性指標,有限予算下での複数アロケーション仮説改善のための任意の修正手順,実行時回復のための階層的オンライン計画機構を導入する。
Maze2D、OGBench AntMaze、Cubeドメインの実験では、DAG-STLは複雑な長距離STLタスクにおいて直接ロバスト性誘導拡散を著しく上回り、ナビゲーションと操作設定をまたいで一般化している。
最適化に基づく参照を持つカスタム環境では、DAG-STLは明示的なシステムモデルに基づく直接最適化よりも明確な計算上の優位性を保ちながら、ほとんどのモデル解決可能なタスクを復元する。
関連論文リスト
- GraSP-STL: A Graph-Based Framework for Zero-Shot Signal Temporal Logic Planning via Offline Goal-Conditioned Reinforcement Learning [5.573866102893894]
我々はSignal Temporal Logic (STL) 仕様の下でオフラインゼロショットプランニングについて検討する。
オフライン軌道からのゼロショットSTL計画のためのグラフ検索に基づくフレームワークGraSP-STLを提案する。
論文 参考訳(メタデータ) (2026-03-31T10:15:42Z) - STL-SVPIO: Signal Temporal Logic guided Stein Variational Path Integral Optimization [8.345095354174623]
Signal Temporal Logic (STL) は、ロボットタスク計画のための複雑な制約の正式な仕様化を可能にする。
本稿では,STLをグローバルな情報的,微分可能な報酬形成機構として再構成するSignal Vari Temporal Integral Optimization (STL-SVPIO)を紹介する。
STL-SVPIO は従来の STL タスクの堅牢性と効率性において,既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2026-03-06T00:53:38Z) - Agentic Spatio-Temporal Grounding via Collaborative Reasoning [80.83158605034465]
時間的ビデオグラウンド(Temporal Video Grounding)は、テキストクエリが与えられたビデオ内の対象物または人の時間的チューブを検索することを目的としている。
本稿では,STVGの課題に対して,オープンワールドおよびトレーニングフリーシナリオに向けたエージェント時空間グラウンド(ASTG)フレームワークを提案する。
具体的には、現代多言語モデル(MLLM)を活用した2つの特殊エージェントSRA(Spatial Reasoning Agent)とTRA(Temporal Reasoning Agent)である。
人気のあるベンチマークの実験は、既存の弱教師付きおよびゼロショットアプローチをマージンで上回る提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2026-02-10T10:16:27Z) - LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration [17.886091169216538]
大規模言語モデル(LLM)は、オープンワールドのマルチロボットタスクを非専門家が指定できるようにする。
LLMの計画は実現性に欠けることが多く、特に長期のシナリオでは効率的ではない。
階層的仕様の推論を基礎としたニューロシンボリックな枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-10T07:11:36Z) - PILOT: Planning via Internalized Latent Optimization Trajectories for Large Language Models [51.43746425777865]
大規模言語モデル(LLM)は、しばしばグローバル戦略を定式化する能力に欠けており、長い水平タスクにおけるエラーの伝播につながる。
PILOTは,大規模モデルの戦略的監視を本質的な潜伏誘導に内部化するためのフレームワークである。
論文 参考訳(メタデータ) (2026-01-07T12:38:56Z) - Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.91968752955649]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。
より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。
HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文 参考訳(メタデータ) (2025-03-25T22:52:46Z) - Zero-Shot Trajectory Planning for Signal Temporal Logic Tasks [7.389002274709231]
Signal Temporal Logic (STL) は、連続信号の複雑な時間的挙動を記述するための強力な仕様言語である。
STLタスクの実行可能なSTLプランの生成は、タスク仕様とシステムダイナミクスの結合を考慮する必要があるため、難しい。
オフライントレーニングにおいてタスク非依存の軌道データのみを活用することで、新しいSTLタスクへのゼロショット一般化を可能にする階層的計画フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-23T08:15:52Z) - Directed Exploration in Reinforcement Learning from Linear Temporal Logic [59.707408697394534]
リニア時間論理(LTL)は強化学習におけるタスク仕様のための強力な言語である。
合成された報酬信号は基本的に疎結合であり,探索が困難であることを示す。
我々は、仕様をさらに活用し、それに対応するリミット決定性B"uchi Automaton(LDBA)をマルコフ報酬プロセスとしてキャストすることで、よりよい探索を実現することができることを示す。
論文 参考訳(メタデータ) (2024-08-18T14:25:44Z) - Towards Unified Token Learning for Vision-Language Tracking [65.96561538356315]
本稿では,VL追跡をトークン生成タスクとして用いた「textbfMMTrack」という,視覚言語(VL)追跡パイプラインを提案する。
提案フレームワークは,言語記述と境界ボックスを離散トークン列にシリアライズする。
この新しい設計パラダイムでは、全てのトークンクエリが望ましいターゲットを認識し、ターゲットの空間座標を直接予測するために必要となる。
論文 参考訳(メタデータ) (2023-08-27T13:17:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。