論文の概要: Feasibility Restoration under Conflicting STL Specifications with Pareto-Optimal Refinement
- arxiv url: http://arxiv.org/abs/2603.06947v1
- Date: Fri, 06 Mar 2026 23:41:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.025608
- Title: Feasibility Restoration under Conflicting STL Specifications with Pareto-Optimal Refinement
- Title(参考訳): Pareto-Optimal Refinement を併用したSTL仕様の互換性回復
- Authors: Tianhao Wu, Yiwei Lyu,
- Abstract要約: Signal Temporal Logic (STL) は、ロボット工学における表現的要求を規定する表現的言語である。
STL仕様は、安全規則、交通規制、タスクと目的を一緒に満たせない現実世界のアプリケーションでは矛盾する可能性がある。
本稿では,最小限の緩和による実現可能性の回復を図り,それを価値認識多目的最適化問題として定式化し,実現可能な解を洗練する,統合された2段階フレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.383508411056944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Signal Temporal Logic (STL) is expressive formal language that specifies spatio-temporal requirements in robotics. Its quantitative robustness semantics can be easily integrated with optimization-based control frameworks. However, STL specifications may become conflicting in real-world applications, where safety rules, traffic regulations, and task objectives can be cannot be satisfied together. In these situations, traditional STL-constrained Model Predictive Control (MPC) becomes infeasible and default to conservative behaviors such as freezing, which can largely increase risks in safety-critical scenarios. In this paper, we proposes a unified two-stage framework that first restores feasibility via minimal relaxation, then refine the feasible solution by formulating it as a value-aware multi-objective optimization problem. Using $\varepsilon$-constraint method, we approximate the Pareto front of the multi-objective optimization, which allows analysis of tradeoffs among competing objectives and counterfactual analysis of alternative actions. We demonstrate that the proposed approach avoids deadlock under conflicting STL specifications and enables interpretable decision-making in safety-critical applications by conducting a case study in autonomous driving.
- Abstract(参考訳): 信号時相論理 (Signal Temporal Logic, STL) は、ロボット工学における時空間要求を規定する表現的形式言語である。
その量的堅牢性セマンティクスは、最適化ベースの制御フレームワークと容易に統合できる。
しかし、STL仕様は、安全規則、交通規制、タスク目的を一緒に満たせない現実世界のアプリケーションでは矛盾する可能性がある。
このような状況下では、従来のSTL制約モデル予測制御(MPC)は、凍結のような保守的な行動に対して非実用的でデフォルトとなり、安全クリティカルなシナリオのリスクを大幅に増加させる可能性がある。
本稿では,最小限の緩和によって実現可能性の回復を図り,それを価値認識多目的最適化問題として定式化し,実現可能な解を洗練する,統合された2段階フレームワークを提案する。
$\varepsilon$-constraint 法による多目的最適化のParetoフロントを近似し、競合する目的間のトレードオフを解析し、代替行動の反実的解析を可能にする。
提案手法は、STL仕様に矛盾するデッドロックを回避し、自律運転におけるケーススタディを行うことで、安全クリティカルなアプリケーションにおける解釈可能な意思決定を可能にすることを実証する。
関連論文リスト
- MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - Learning Robust and Correct Controllers Guided by Feasibility-Aware Signal Temporal Logic via BarrierNet [5.174839530270601]
制御バリア関数(CBF)は、最適化ベースのコントローラの安全性を高める強力なツールとして登場した。
CBFを微分可能二次プログラム(dQP)に組み込む実現可能性を考慮した学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-07T19:52:27Z) - Certifiable Safe RLHF: Fixed-Penalty Constraint Optimization for Safer Language Models [7.422627253922975]
我々は,大規模コーパスでトレーニングされたコストモデルであるCertifiable Safe-RLHFを導入し,セマンティックグラウンドの安全性スコアを割り当てる。
適切にスケールされたペナルティにより、二重変数更新の必要性を排除し、安全制約の実現性を保証することができる。
経験的評価により、CS-RLHFは、名目や脱獄のプロンプトに対して、最先端のモデル応答よりも5倍効率が高いことが示されている。
論文 参考訳(メタデータ) (2025-10-03T21:24:41Z) - Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Generalization Bounds of Surrogate Policies for Combinatorial Optimization Problems [53.03951222945921]
我々はスムーズな(摂動された)ポリシーを解析し、線形オラクルが使用する方向に対して制御されたランダムな摂動を付加する。
我々の主な貢献は、過剰リスクを摂動バイアス、統計的推定誤差、最適化誤差に分解する一般化境界である。
車両のスケジューリングやスムーズ化がトラクタブルトレーニングと制御された一般化の両方を可能にしていることを示す。
論文 参考訳(メタデータ) (2024-07-24T12:00:30Z) - One-Shot Safety Alignment for Large Language Models via Optimal Dualization [64.52223677468861]
本稿では,制約付きアライメントを等価な非制約アライメント問題に還元する双対化の観点を提案する。
我々は、閉形式を持つ滑らかで凸な双対函数を事前に最適化する。
我々の戦略は、モデルベースと嗜好ベースの設定における2つの実用的なアルゴリズムに導かれる。
論文 参考訳(メタデータ) (2024-05-29T22:12:52Z) - Double Duality: Variational Primal-Dual Policy Optimization for
Constrained Reinforcement Learning [132.7040981721302]
本研究では,訪問尺度の凸関数を最小化することを目的として,制約付き凸決定プロセス(MDP)について検討する。
制約付き凸MDPの設計アルゴリズムは、大きな状態空間を扱うなど、いくつかの課題に直面している。
論文 参考訳(メタデータ) (2024-02-16T16:35:18Z) - Risk-Awareness in Learning Neural Controllers for Temporal Logic
Objectives [2.047329787828792]
閉ループ系が一定の制約を満たすような不確実性が存在する場合の制御器の問題を考える。
制御障壁関数(CBF)の枠組みを利用して,STL目的のCBFをアルゴリズム的に取得する。
クワッドロータや一輪車のような非線形制御のよく知られた難解な例に対して,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-10-14T00:49:08Z) - Policy Optimization with Linear Temporal Logic Constraints [37.27882290236194]
本稿では,線形時間論理制約を用いた政策最適化の問題点について考察する。
我々は,タスク満足度とコスト最適性の両方を保証するために,サンプル複雑性分析を楽しむモデルベースアプローチを開発した。
論文 参考訳(メタデータ) (2022-06-20T02:58:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。