Fugu-MT 論文翻訳(概要): GraSP-STL: A Graph-Based Framework for Zero-Shot Signal Temporal Logic Planning via Offline Goal-Conditioned Reinforcement Learning

論文の概要: GraSP-STL: A Graph-Based Framework for Zero-Shot Signal Temporal Logic Planning via Offline Goal-Conditioned Reinforcement Learning

arxiv url: http://arxiv.org/abs/2603.29533v1
Date: Tue, 31 Mar 2026 10:15:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-01 15:25:03.537892
Title: GraSP-STL: A Graph-Based Framework for Zero-Shot Signal Temporal Logic Planning via Offline Goal-Conditioned Reinforcement Learning
Title（参考訳）: GraSP-STL:オフラインゴール定義強化学習によるゼロショット信号時間論理計画のためのグラフベースフレームワーク
Authors: Ancheng Hou, Ruijia Liu, Xiang Yin,
Abstract要約: 我々はSignal Temporal Logic (STL) 仕様の下でオフラインゼロショットプランニングについて検討する。オフライン軌道からのゼロショットSTL計画のためのグラフ検索に基づくフレームワークGraSP-STLを提案する。
参考スコア（独自算出の注目度）: 5.573866102893894
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This paper studies offline, zero-shot planning under Signal Temporal Logic (STL) specifications. We assume access only to an offline dataset of state-action-state transitions collected by a task-agnostic behavior policy, with no analytical dynamics model, no further environment interaction, and no task-specific retraining. The objective is to synthesize a control strategy whose resulting trajectory satisfies an arbitrary unseen STL specification. To this end, we propose GraSP-STL, a graph-search-based framework for zero-shot STL planning from offline trajectories. The method learns a goal-conditioned value function from offline data and uses it to induce a finite-horizon reachability metric over the state space. Based on this metric, it constructs a directed graph abstraction whose nodes represent representative states and whose edges encode feasible short-horizon transitions. Planning is then formulated as a graph search over waypoint sequences, evaluated using arithmetic-geometric mean robustness and its interval semantics, and executed by a learned goal-conditioned policy. The proposed framework separates reusable reachability learning from task-conditioned planning, enabling zero-shot generalization to unseen STL tasks and long-horizon planning through the composition of short-horizon behaviors from offline data. Experimental results demonstrate its effectiveness on a range of offline STL planning tasks.
Abstract（参考訳）: 本稿では,Signal Temporal Logic (STL) 仕様下でのオフラインゼロショット計画について検討する。我々は、タスクに依存しない行動ポリシーによって収集された状態-状態遷移のオフラインデータセットへのアクセスのみを仮定し、分析力学モデルがなく、環境相互作用も無く、タスク固有の再訓練も行わない。目的は、任意のSTL仕様を満たす軌道を満足する制御戦略を合成することである。この目的のために、オフライン軌道からのゼロショットSTL計画のためのグラフ検索ベースのフレームワークGraSP-STLを提案する。オフラインデータからゴール条件付き値関数を学習し、状態空間上の有限水平到達性計量を誘導する。この計量に基づいて、ノードが代表状態を表し、エッジが実現可能な短水平遷移をエンコードする有向グラフ抽象化を構築する。その後、計画は経路点列上のグラフ探索として定式化され、算術的幾何学的平均ロバストネスとそのインターバルセマンティクスを用いて評価され、学習された目標条件付きポリシーによって実行される。提案フレームワークは、タスク条件付き計画から再利用可能な到達可能性学習を分離し、オフラインデータから短水平動作を構成することで、ゼロショットの一般化により、見えないSTLタスクや長期計画が可能になる。実験により, オフラインSTL計画タスクにおける有効性を示す。

関連論文リスト

Test-Time Graph Search for Goal-Conditioned Reinforcement Learning [56.13800388912632]
オフライン目標条件強化学習(GCRL)は、テスト時にユーザが指定した目標に到達するポリシーを訓練する。 GCRLタスクを解決するための軽量な計画手法であるTTGS(Test-Time Graph Search)を導入する。 TTGSは任意の状態空間距離やコスト信号を受け入れ、データセット状態の上に重み付きグラフを構築し、凍結ポリシーが実行する一連のサブゴールを高速に検索する。
論文参考訳（メタデータ） (2025-10-08T17:20:53Z)
Plan-over-Graph: Towards Parallelable LLM Agent Schedule [53.834646147919436]
大規模言語モデル(LLM)はタスク計画の推論において例外的な能力を示した。本稿では,まず実生活のテキストタスクを実行可能なサブタスクに分解し,抽象的なタスクグラフを構築する,新しいパラダイムであるプランオーバーグラフを提案する。モデルはこのタスクグラフを入力として理解し、並列実行計画を生成する。
論文参考訳（メタデータ） (2025-02-20T13:47:51Z)
Zero-Shot Trajectory Planning for Signal Temporal Logic Tasks [7.389002274709231]
Signal Temporal Logic (STL) は、連続信号の複雑な時間的挙動を記述するための強力な仕様言語である。 STLタスクの実行可能なSTLプランの生成は、タスク仕様とシステムダイナミクスの結合を考慮する必要があるため、難しい。オフライントレーニングにおいてタスク非依存の軌道データのみを活用することで、新しいSTLタスクへのゼロショット一般化を可能にする階層的計画フレームワークを提案する。
論文参考訳（メタデータ） (2025-01-23T08:15:52Z)
Affordances-Oriented Planning using Foundation Models for Continuous Vision-Language Navigation [64.84996994779443]
本稿では,連続視覚言語ナビゲーション(VLN)タスクのためのAffordances-Oriented Plannerを提案する。我々のAO-Plannerは、様々な基礎モデルを統合して、アベイランス指向の低レベルな動き計画とハイレベルな意思決定を実現する。挑戦的なR2R-CEデータセットとRxR-CEデータセットの実験は、AO-Plannerが最先端のゼロショットのパフォーマンスを達成したことを示している。
論文参考訳（メタデータ） (2024-07-08T12:52:46Z)
Towards Unified Token Learning for Vision-Language Tracking [65.96561538356315]
本稿では,VL追跡をトークン生成タスクとして用いた「textbfMMTrack」という,視覚言語(VL)追跡パイプラインを提案する。提案フレームワークは,言語記述と境界ボックスを離散トークン列にシリアライズする。この新しい設計パラダイムでは、全てのトークンクエリが望ましいターゲットを認識し、ターゲットの空間座標を直接予測するために必要となる。
論文参考訳（メタデータ） (2023-08-27T13:17:34Z)
Designing Behavior Trees from Goal-Oriented LTLf Formulas [3.3674998206524465]
本稿では,LTL(Linear Temporal Logic)のサブセットを用いて指定されたゴールを動作木(BT)に変換する方法を示す。 BTは、成功したトレースが目標を満たすことを保証します。
論文参考訳（メタデータ） (2023-07-12T18:29:37Z)
Imitating Graph-Based Planning with Goal-Conditioned Policies [72.61631088613048]
本稿では,目標目標条件ポリシにサブゴール条件ポリシを蒸留する自己シミュレーション方式を提案する。提案手法は,既存の目標条件付きRL手法のサンプル効率を大幅に向上させることができることを実証的に示す。
論文参考訳（メタデータ） (2023-03-20T14:51:10Z)
Hallucinative Topological Memory for Zero-Shot Visual Planning [86.20780756832502]
視覚計画(VP)では、エージェントは、オフラインで取得した動的システムの観察から目標指向の振る舞いを計画することを学ぶ。以前のVPに関するほとんどの研究は、学習された潜在空間で計画することでこの問題にアプローチし、結果として品質の低い視覚計画を生み出した。本稿では,画像空間を直接計画し,競合性能を示すシンプルなVP手法を提案する。
論文参考訳（メタデータ） (2020-02-27T18:54:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。