論文の概要: STL-SVPIO: Signal Temporal Logic guided Stein Variational Path Integral Optimization
- arxiv url: http://arxiv.org/abs/2603.13333v1
- Date: Fri, 06 Mar 2026 00:53:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 04:55:54.355298
- Title: STL-SVPIO: Signal Temporal Logic guided Stein Variational Path Integral Optimization
- Title(参考訳): STL-SVPIO:信号時間論理ガイドによるスタイン変分経路積分最適化
- Authors: Hongrui Zheng, Zirui Zang, Ahmad Amine, Cristian Ioan Vasile, Rahul Mangharam,
- Abstract要約: Signal Temporal Logic (STL) は、ロボットタスク計画のための複雑な制約の正式な仕様化を可能にする。
本稿では,STLをグローバルな情報的,微分可能な報酬形成機構として再構成するSignal Vari Temporal Integral Optimization (STL-SVPIO)を紹介する。
STL-SVPIO は従来の STL タスクの堅牢性と効率性において,既存の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 8.345095354174623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Signal Temporal Logic (STL) enables formal specification of complex spatiotemporal constraints for robotic task planning. However, synthesizing long-horizon continuous control trajectories from complex STL specifications is fundamentally challenging due to the nested structure of STL robustness objectives. Existing solver-based methods, such as Mixed-Integer Linear Programming (MILP), suffer from exponential scaling, whereas sampling methods, such as Model-Predictive Path Integral control (MPPI), struggle with sparse, long-horizon costs. We introduce Signal Temporal Logic guided Stein Variational Path Integral Optimization (STL-SVPIO), which reframes STL as a globally informative, differentiable reward-shaping mechanism. By leveraging Stein Variational Gradient Descent and differentiable physics engines, STL-SVPIO transports a mutually repulsive swarm of control particles toward high robustness regions. Our method transforms sparse logical satisfaction into tractable variational inference, mitigating the severe local minima traps of standard gradient-based methods. We demonstrate that STL-SVPIO significantly outperforms existing methods in both robustness and efficiency for traditional STL tasks. Moreover, it solves complex long-horizon tasks, including multi-agent coordination with synchronization and queuing while baselines either fail to discover feasible solutions, or become computationally intractable. Finally, we use STL-SVPIO in agile robotic motion planning tasks with nonlinear dynamics, such as 7-DoF manipulation and half cheetah back flips to show the generalizability of our algorithm.
- Abstract(参考訳): Signal Temporal Logic (STL) は、ロボットタスク計画のための複雑な時空間制約の正式な仕様化を可能にする。
しかし、複雑なSTL仕様から長期連続制御軌道を合成することは、STLロバストネス目標のネスト構造のため、基本的に困難である。
MILP(Mixed-Integer Linear Programming)のような既存の解法は指数的スケーリングに苦しむ一方、モデル予測パス積分制御(MPPI)のようなサンプリング法はスパースで長期のコストがかかる。
本稿では,STLをグローバルな情報的,微分可能な報酬形成機構として再構成するSTL-SVPIO(Signal Temporal Logic Guided Stein Variational Path Integral Optimization)を提案する。
STL-SVPIOは、スタイン変量勾配のDescentと微分可能な物理エンジンを利用して、互いに反発する制御粒子群を高ロバスト性領域へ輸送する。
本手法は, 緩やかな論理的満足度をトラクタブルな変分推論に変換し, 標準勾配法における局所最小値トラップを緩和する。
STL-SVPIO は従来の STL タスクの堅牢性と効率性において,既存の手法よりも優れていた。
さらに、同期やキュー処理を伴うマルチエージェントの協調を含む複雑な長距離タスクを解決し、ベースラインは実現可能な解を見つけるのに失敗するか、あるいは計算的に難解になる。
最後に、STL-SVPIOを7-DoF操作や半チーターバックフリップといった非線形ダイナミクスを備えたアジャイルなロボット動作計画タスクに使用し、アルゴリズムの一般化可能性を示す。
関連論文リスト
- Multi-Robot Trajectory Planning via Constrained Bayesian Optimization and Local Cost Map Learning with STL-Based Conflict Resolution [1.6243762297989983]
本稿では,信号時間論理(STL)仕様の下でのマルチロボット動作計画にキノダイナミック制約を適用した。
サンプルベースオンライン学習と正式なSTL推論を組み合わせた2段階のフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-06T00:03:18Z) - LLM-Grounded Dynamic Task Planning with Hierarchical Temporal Logic for Human-Aware Multi-Robot Collaboration [17.886091169216538]
大規模言語モデル(LLM)は、オープンワールドのマルチロボットタスクを非専門家が指定できるようにする。
LLMの計画は実現性に欠けることが多く、特に長期のシナリオでは効率的ではない。
階層的仕様の推論を基礎としたニューロシンボリックな枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-10T07:11:36Z) - Parallel Diffusion Solver via Residual Dirichlet Policy Optimization [88.7827307535107]
拡散モデル(DM)は、最先端の生成性能を達成したが、シーケンシャルなデノナイジング特性のため、高いサンプリング遅延に悩まされている。
既存のソルバベースの加速度法では、低次元の予算で画像品質が著しく低下することが多い。
本研究では,各ステップに複数の勾配並列評価を組み込んだ新しいODE解法であるEnsemble Parallel Directionsolvr(EPD-EPr)を提案する。
論文 参考訳(メタデータ) (2025-12-28T05:48:55Z) - Unlocking Symbol-Level Precoding Efficiency Through Tensor Equivariant Neural Network [84.22115118596741]
シンボルレベルのプリコーディングにおいて,推論の複雑さの低いエンドツーエンドディープラーニング(DL)フレームワークを提案する。
提案手法は,従来の手法よりも約80倍の高速化を実現しつつ,SLPの大幅な性能向上を達成できることを示す。
論文 参考訳(メタデータ) (2025-10-02T15:15:50Z) - PATS: Process-Level Adaptive Thinking Mode Switching [53.53401063490537]
現在の大言語モデル(LLM)は、通常、難易度に関わらず、すべての質問に対して、単純または複雑に固定された推論戦略を採用する。
このようなタスクと推論プロセスの複雑さの変化の無視は、パフォーマンスと効率のバランスを損なう。
既存の手法では, 難易度が異なる問題に対処するために, 学習不要な高速スロー思考システムを導入しようとするが, 厳密な解レベルの戦略調整によって制限される。
プロセスレベル適応思考モードスイッチング(PATS)という新しい推論パラダイムを提案し,各ステップの難易度に基づいてLLMが推論戦略を動的に調整し,そのバランスを最適化する。
論文 参考訳(メタデータ) (2025-05-25T17:58:50Z) - STLCG++: A Masking Approach for Differentiable Signal Temporal Logic Specification [9.039665244779185]
STLCG++は、STL計算と時間ステップ間のバックプロパゲーションを並列化するマスキングベースのアプローチである。
また、時間間隔境界の微分を可能にするスムース化手法を導入し、勾配に基づく最適化タスクにおけるSTLの適用性を拡大する。
論文 参考訳(メタデータ) (2025-01-08T00:06:43Z) - SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - Pushing the Envelope of Rotation Averaging for Visual SLAM [69.7375052440794]
視覚SLAMシステムのための新しい最適化バックボーンを提案する。
従来の単分子SLAMシステムの精度, 効率, 堅牢性を向上させるために, 平均化を活用している。
我々のアプローチは、公開ベンチマークの最先端技術に対して、同等の精度で最大10倍高速に表示することができる。
論文 参考訳(メタデータ) (2020-11-02T18:02:26Z) - Backpropagation through Signal Temporal Logic Specifications: Infusing
Logical Structure into Gradient-Based Methods [28.72161643908351]
本稿では,STLCG(Signal Temporal Logic)公式の定量的意味を計算グラフを用いて計算する手法を提案する。
STLは、連続系とハイブリッド系の両方で生成される信号の空間的および時間的特性を指定できる、強力で表現力のある形式言語である。
論文 参考訳(メタデータ) (2020-07-31T22:01:39Z) - Goal Kernel Planning: Linearly-Solvable Non-Markovian Policies for Logical Tasks with Goal-Conditioned Options [54.40780660868349]
我々はLinearly-Solvable Goal Kernel Dynamic Programming (LS-GKDP)と呼ばれる合成フレームワークを導入する。
LS-GKDPは、Linearly-Solvable Markov Decision Process (LMDP)形式とOptions Framework of Reinforcement Learningを組み合わせたものである。
本稿では,目標カーネルを持つLMDPが,タスク接地によって定義された低次元部分空間におけるメタポリティシの効率的な最適化を実現する方法を示す。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。