論文の概要: Learning Probabilistic Temporal Logic Specifications for Stochastic Systems
- arxiv url: http://arxiv.org/abs/2505.12107v1
- Date: Sat, 17 May 2025 18:19:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.042673
- Title: Learning Probabilistic Temporal Logic Specifications for Stochastic Systems
- Title(参考訳): 確率的システムのための確率的時間論理仕様の学習
- Authors: Rajarshi Roy, Yash Pote, David Parker, Marta Kwiatkowska,
- Abstract要約: マルコフ連鎖の集合から簡潔なL仕様を推論する新しい学習アルゴリズムを提案する。
我々はアルゴリズムの有効性を,アルゴリズムによって誘導されるポリシーから学習し,確率論的モデルから学習する2つのユースケースで示す。
- 参考スコア(独自算出の注目度): 24.82640206181621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been substantial progress in the inference of formal behavioural specifications from sample trajectories, for example, using Linear Temporal Logic (LTL). However, these techniques cannot handle specifications that correctly characterise systems with stochastic behaviour, which occur commonly in reinforcement learning and formal verification. We consider the passive learning problem of inferring a Boolean combination of probabilistic LTL (PLTL) formulas from a set of Markov chains, classified as either positive or negative. We propose a novel learning algorithm that infers concise PLTL specifications, leveraging grammar-based enumeration, search heuristics, probabilistic model checking and Boolean set-cover procedures. We demonstrate the effectiveness of our algorithm in two use cases: learning from policies induced by RL algorithms and learning from variants of a probabilistic model. In both cases, our method automatically and efficiently extracts PLTL specifications that succinctly characterise the temporal differences between the policies or model variants.
- Abstract(参考訳): 例えば、LTL(Linear Temporal Logic)を用いたサンプル軌跡からの形式的行動仕様の推測には、かなりの進歩があった。
しかし、これらの手法は、強化学習や形式的検証で一般的に発生する確率的振る舞いを持つシステムを正しく特徴づける仕様を扱うことはできない。
マルコフ連鎖の集合から確率的LTL(PLTL)式をブール組合せで推定する受動的学習問題について考察した。
本稿では,文法に基づく列挙,探索ヒューリスティックス,確率的モデルチェック,ブール集合被覆手順を活用する,簡潔なPLTL仕様を推論する新しい学習アルゴリズムを提案する。
RLアルゴリズムによって誘導されるポリシーから学習し、確率モデルの変種から学習する2つのユースケースでアルゴリズムの有効性を実証する。
いずれの場合も,ポリシーやモデル変種間の時間的差異を簡潔に特徴付けるPLTL仕様を自動かつ効率的に抽出する。
関連論文リスト
- Transformers as Statisticians: Provable In-Context Learning with
In-Context Algorithm Selection [88.23337313766353]
この研究はまず、変換器がICLを実行するための包括的な統計理論を提供する。
コンテクストにおいて、トランスフォーマーは、幅広い種類の標準機械学習アルゴリズムを実装可能であることを示す。
エンフィングル変換器は、異なるベースICLアルゴリズムを適応的に選択することができる。
論文 参考訳(メタデータ) (2023-06-07T17:59:31Z) - Learning Temporal Logic Properties: an Overview of Two Recent Methods [27.929058359327186]
正あるいは負とラベル付けされた例から線形時間論理(LTL)公式を学習することで、システムの振る舞いの記述を推測することが可能になる。
2つの異なる問題設定における例から公式を学習する2つの方法を提案する。
論文 参考訳(メタデータ) (2022-12-02T00:32:09Z) - Formal Controller Synthesis for Markov Jump Linear Systems with
Uncertain Dynamics [64.72260320446158]
マルコフジャンプ線形系に対する制御器の合成法を提案する。
本手法は,MJLSの離散(モードジャンピング)と連続(確率線形)の両方の挙動を捉える有限状態抽象化に基づいている。
本手法を複数の現実的なベンチマーク問題,特に温度制御と航空機の配送問題に適用する。
論文 参考訳(メタデータ) (2022-12-01T17:36:30Z) - pRSL: Interpretable Multi-label Stacking by Learning Probabilistic Rules [0.0]
本稿では,確率論的命題論理則と信念伝播を用いた確率論的ルールスタックリング(pRSL)を提案し,その基礎となる分類器の予測と組み合わせる。
精度と近似推論と学習のためのアルゴリズムを導出し、様々なベンチマークデータセット上でpRSLが最先端の性能に達することを示す。
論文 参考訳(メタデータ) (2021-05-28T14:06:21Z) - Uncertainty-Aware Signal Temporal logic [21.626420725274208]
既存の時間論理推論手法は、データの不確かさをほとんど無視する。
本稿では,不確実性を考慮した信号時間論理(STL)推論手法を提案する。
論文 参考訳(メタデータ) (2021-05-24T21:26:57Z) - Explaining Multi-stage Tasks by Learning Temporal Logic Formulas from
Suboptimal Demonstrations [6.950510860295866]
本稿では,一貫した線形時間論理式(LTL)の論理構造と原子命題を学習し,実演から多段階タスクを学習する手法を提案する。
学習者は、その式を満足しながらコスト関数を最適化し、学習者にはコスト関数が不確実な場合において、成功しているが潜在的に最適でないデモンストレーションが与えられる。
提案アルゴリズムでは,デモのKKT(Karush-Kuhn-Tucker)最適条件と反例誘導ファルシフィケーション戦略を用いて,原子命題パラメータを学習する。
論文 参考訳(メタデータ) (2020-06-03T17:40:14Z) - Learning Interpretable Models in the Property Specification Language [6.875312133832079]
IEEE標準時相論理PSLにおける公式の学習アルゴリズムを開発した。
私たちの研究は、n番目の点ごとに起こる事象のような多くの自然の性質が、言葉で表現できないという事実に動機づけられている。
論文 参考訳(メタデータ) (2020-02-10T11:42:50Z) - Certified Reinforcement Learning with Logic Guidance [78.2286146954051]
線形時間論理(LTL)を用いて未知の連続状態/動作マルコフ決定過程(MDP)のゴールを定式化できるモデルフリーなRLアルゴリズムを提案する。
このアルゴリズムは、トレースが仕様を最大確率で満たす制御ポリシーを合成することが保証される。
論文 参考訳(メタデータ) (2019-02-02T20:09:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。