論文の概要: Explaining Multi-stage Tasks by Learning Temporal Logic Formulas from
Suboptimal Demonstrations
- arxiv url: http://arxiv.org/abs/2006.02411v1
- Date: Wed, 3 Jun 2020 17:40:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 18:48:53.170316
- Title: Explaining Multi-stage Tasks by Learning Temporal Logic Formulas from
Suboptimal Demonstrations
- Title(参考訳): 時相論理公式の学習による多段階課題の解法
- Authors: Glen Chou, Necmiye Ozay, Dmitry Berenson
- Abstract要約: 本稿では,一貫した線形時間論理式(LTL)の論理構造と原子命題を学習し,実演から多段階タスクを学習する手法を提案する。
学習者は、その式を満足しながらコスト関数を最適化し、学習者にはコスト関数が不確実な場合において、成功しているが潜在的に最適でないデモンストレーションが与えられる。
提案アルゴリズムでは,デモのKKT(Karush-Kuhn-Tucker)最適条件と反例誘導ファルシフィケーション戦略を用いて,原子命題パラメータを学習する。
- 参考スコア(独自算出の注目度): 6.950510860295866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a method for learning multi-stage tasks from demonstrations by
learning the logical structure and atomic propositions of a consistent linear
temporal logic (LTL) formula. The learner is given successful but potentially
suboptimal demonstrations, where the demonstrator is optimizing a cost function
while satisfying the LTL formula, and the cost function is uncertain to the
learner. Our algorithm uses the Karush-Kuhn-Tucker (KKT) optimality conditions
of the demonstrations together with a counterexample-guided falsification
strategy to learn the atomic proposition parameters and logical structure of
the LTL formula, respectively. We provide theoretical guarantees on the
conservativeness of the recovered atomic proposition sets, as well as
completeness in the search for finding an LTL formula consistent with the
demonstrations. We evaluate our method on high-dimensional nonlinear systems by
learning LTL formulas explaining multi-stage tasks on 7-DOF arm and quadrotor
systems and show that it outperforms competing methods for learning LTL
formulas from positive examples.
- Abstract(参考訳): 本稿では,連続線形時相論理(ltl)の論理構造と原子命題を学習し,実演から多段階タスクを学習する手法を提案する。
学習者は、ltlの公式を満たしながらコスト関数を最適化し、学習者にとってコスト関数が不確かであるような、成功するが潜在的に最適でないデモンストレーションが与えられる。
提案アルゴリズムでは,実演におけるKKT(Karush-Kuhn-Tucker)最適条件と反例誘導のファルシフィケーション戦略を用いて,LTL公式の原子命題パラメータと論理構造をそれぞれ学習する。
我々は、回収された原子命題集合の保守性に関する理論的保証と、実演と整合したLTL公式の探索における完全性を提供する。
本研究では, 高次元非線形システムにおいて, 7-DOF アームおよび四重項系の多段階タスクを記述した LTL 式を学習し, 正の例から LTL 式を学習するための競合手法よりも優れていることを示す。
関連論文リスト
- The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Faithful Explanations of Black-box NLP Models Using LLM-generated
Counterfactuals [67.64770842323966]
NLPシステムの予測に関する因果的説明は、安全性を確保し、信頼を確立するために不可欠である。
既存の手法は、しばしばモデル予測を効果的または効率的に説明できない。
本稿では, 対物近似(CF)の2つの手法を提案する。
論文 参考訳(メタデータ) (2023-10-01T07:31:04Z) - Low-Rank Multitask Learning based on Tensorized SVMs and LSSVMs [65.42104819071444]
マルチタスク学習(MTL)はタスク関連性を活用して性能を向上させる。
タスクインデックスに対応する各モードを持つ高次テンソルを用いて、複数のインデックスが参照するタスクを自然に表現する。
テンソル化サポートベクターマシン(SVM)と最小2乗サポートベクターマシン(LSSVM)を併用した低ランクMTL手法の汎用フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-30T14:28:26Z) - Making Linear MDPs Practical via Contrastive Representation Learning [101.75885788118131]
マルコフ決定過程(MDP)における次元性の呪いに、低ランク表現を利用することで対処することが一般的である。
本稿では,効率的な表現学習を可能にしつつ,正規化を自動的に保証する線形MDPの代替的定義について考察する。
いくつかのベンチマークにおいて、既存の最先端モデルベースおよびモデルフリーアルゴリズムよりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-07-14T18:18:02Z) - Contrastive and Non-Contrastive Self-Supervised Learning Recover Global
and Local Spectral Embedding Methods [19.587273175563745]
自己監督学習(SSL)は、入力とペアの正の関係は意味のある表現を学ぶのに十分である。
本稿では,これらの制約に対処するために,スペクトル多様体学習の推進力の下で統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2022-05-23T17:59:32Z) - Linear Temporal Logic Modulo Theories over Finite Traces (Extended
Version) [72.38188258853155]
有限トレース(LTLf)上の線形時間論理について検討する。
命題の文字は任意の理論で解釈された一階述語式に置き換えられる。
Satisfiability Modulo Theories (LTLfMT) と呼ばれる結果の論理は半決定可能である。
論文 参考訳(メタデータ) (2022-04-28T17:57:33Z) - Learning Model Checking and the Kernel Trick for Signal Temporal Logic
on Stochastic Processes [1.2708506121941319]
信号時間論理(STL)の論理式に類似性関数を導入する。
対応するカーネルトリックにより、特徴抽出の複雑なプロセスを回避できます。
本研究では,STL式に対する満足度を(定量的に)予測する作業において,この結果とその利点を実証する。
論文 参考訳(メタデータ) (2022-01-24T19:36:11Z) - Inverse Reinforcement Learning of Autonomous Behaviors Encoded as
Weighted Finite Automata [18.972270182221262]
本稿では,論理タスク仕様とコスト関数を実演から学習する手法を提案する。
本稿では,タスクの未知論理構造を近似した重み付き有限オートマトン(WFA)の抽出にスペクトル学習手法を用いる。
高レベルタスクガイダンスのためのWFAと低レベル制御のためのラベル付きマルコフ決定プロセス(L-MDP)との間にある製品を定義し、実証者の行動にマッチするコスト関数を最適化する。
論文 参考訳(メタデータ) (2021-03-10T06:42:10Z) - Formal Synthesis of Lyapunov Neural Networks [61.79595926825511]
本稿では,リアプノフ関数の自動合成法を提案する。
我々は,数値学習者と記号検証器が相互作用して,確実に正しいリアプノフニューラルネットワークを構築する,反例誘導方式を採用する。
提案手法は,Lyapunov関数を他の手法よりも高速かつ広い空間領域で合成する。
論文 参考訳(メタデータ) (2020-03-19T17:21:02Z) - Learning Interpretable Models in the Property Specification Language [6.875312133832079]
IEEE標準時相論理PSLにおける公式の学習アルゴリズムを開発した。
私たちの研究は、n番目の点ごとに起こる事象のような多くの自然の性質が、言葉で表現できないという事実に動機づけられている。
論文 参考訳(メタデータ) (2020-02-10T11:42:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。