論文の概要: Pointwise-in-Time Explanation for Linear Temporal Logic Rules
- arxiv url: http://arxiv.org/abs/2306.13956v2
- Date: Sun, 1 Oct 2023 16:35:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-03 13:51:03.275734
- Title: Pointwise-in-Time Explanation for Linear Temporal Logic Rules
- Title(参考訳): 線形時相論理規則のポイントワイズインタイム説明
- Authors: Noel Brindise and Cedric Langbort
- Abstract要約: ルールステータスアセスメント(RSA)という新しい枠組みを提案する。
RSAは、個々の時間ステップにおける軌道進行を記述するために、直感的なステータスを任意のルールに割り当てる。
我々は、RSAがポストホック診断として有用であることに気付き、ユーザーはルールの集合に関してエージェントの振る舞いを体系的に追跡できる。
- 参考スコア(独自算出の注目度): 0.29008108937701327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The new field of Explainable Planning (XAIP) has produced a variety of
approaches to explain and describe the behavior of autonomous agents to human
observers. Many summarize agent behavior in terms of the constraints, or
''rules,'' which the agent adheres to during its trajectories. In this work, we
narrow the focus from summary to specific moments in individual trajectories,
offering a ''pointwise-in-time'' view. Our novel framework, which we define on
Linear Temporal Logic (LTL) rules, assigns an intuitive status to any rule in
order to describe the trajectory progress at individual time steps; here, a
rule is classified as active, satisfied, inactive, or violated. Given a
trajectory, a user may query for status of specific LTL rules at individual
trajectory time steps. In this paper, we present this novel framework, named
Rule Status Assessment (RSA), and provide an example of its implementation. We
find that pointwise-in-time status assessment is useful as a post-hoc
diagnostic, enabling a user to systematically track the agent's behavior with
respect to a set of rules.
- Abstract(参考訳): 説明可能な計画(XAIP)の新たな分野は、自律エージェントの振る舞いを人間の観察者に説明し説明するための様々なアプローチを生み出している。
エージェントの動作を制約、つまりエージェントがその軌道中に従属する「ルール」で要約することが多い。
本研究では,個々の軌跡の要約から特定の瞬間への焦点を狭め,「時間内視点」の視点を提供する。
我々の新しいフレームワークは、線形時間論理(LTL)ルールに基づいて定義されており、個々の時間ステップにおける軌道の進行を記述するために、直感的なステータスを任意のルールに割り当てている。
軌跡が与えられると、ユーザーは個々の軌跡時間ステップで特定のltlルールのステータスを問い合わせることができる。
本稿では,この新たなフレームワークであるrsa(laws status assessment)を提案し,その実装例を示す。
我々は,時間内状態評価がポストホック診断として有用であることに気付き,ルールの集合に関してエージェントの動作を体系的に追跡することを可能にする。
関連論文リスト
- UNIT: Unsupervised Online Instance Segmentation through Time [69.2787246878521]
クラスに依存しないオンラインインスタンスのセグメンテーションとトラッキングの問題に対処する。
オブジェクトのオンライントラッキングを可能にする新しいトレーニングレシピを提案する。
我々のネットワークは擬似ラベルで訓練されており、手動のアノテーションは不要である。
論文 参考訳(メタデータ) (2024-09-12T09:47:45Z) - LTLDoG: Satisfying Temporally-Extended Symbolic Constraints for Safe Diffusion-based Planning [12.839846486863308]
本研究では,新しい静的かつ時間的に拡張された制約/命令に準拠する長い水平軌道を生成することに焦点を当てる。
本稿では、線形時間論理を用いて指定された命令を与えられた逆プロセスの推論ステップを変更する、データ駆動拡散に基づくフレームワーク、 finiteDoGを提案する。
ロボットナビゲーションと操作の実験では、障害物回避と訪問シーケンスを指定する公式を満たす軌道を生成することができる。
論文 参考訳(メタデータ) (2024-05-07T11:54:22Z) - From Instructions to Constraints: Language Model Alignment with
Automatic Constraint Verification [70.08146540745877]
NLPタスクの共通制約を調査し、それらの引数の型に基づいて、それらを3つのクラスに分類する。
本稿では,ACT(ConsTraintsのアラインメント)という統合フレームワークを提案し,制約に適応したユーザアライメントのための監視信号を自動的に生成する。
論文 参考訳(メタデータ) (2024-03-10T22:14:54Z) - Foundation Policies with Hilbert Representations [54.44869979017766]
ラベルなしオフラインデータから一般ポリシーを事前学習するための教師なしフレームワークを提案する。
我々の重要な洞察は、基盤となる環境の時間的構造を保存する構造的表現を学習することである。
実験の結果、教師なしのポリシーは、ゴール条件付きおよび一般のRLタスクをゼロショットで解決できることがわかった。
論文 参考訳(メタデータ) (2024-02-23T19:09:10Z) - Tracking Objects and Activities with Attention for Temporal Sentence
Grounding [51.416914256782505]
時間文 (TSG) は、意味的に自然言語のクエリと一致した時間セグメントを、トリミングされていないセグメントでローカライズすることを目的としている。
本稿では,(A)マルチモーダル・検索空間を生成するクロスモーダル・ターゲット・ジェネレータと(B)マルチモーダル・ターゲットの動作を追跡し,クエリ関連セグメントを予測するテンポラル・センセント・トラッカーとを含む,新しいテンポラル・センセント・トラッカー・ネットワーク(TSTNet)を提案する。
論文 参考訳(メタデータ) (2023-02-21T16:42:52Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - LTL-Constrained Steady-State Policy Synthesis [0.0]
マルコフ決定プロセス(MDP)とこれらすべての型を組み合わせた仕様について検討する。
マルチタイプの仕様を多次元の長期平均報酬に還元する統合ソリューションを提供する。
このアルゴリズムは一般の$omega$-regularプロパティにも拡張され、LDBAと同様にMDPのサイズで実行されます。
論文 参考訳(メタデータ) (2021-05-31T11:35:42Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - Verifiable Planning in Expected Reward Multichain MDPs [20.456052208569115]
エージェントの意思決定方針を導出する定常計画問題について検討する。
提案プログラムに対する最適解が、厳密な行動保証を伴う定常的な政策をもたらすことを証明した。
論文 参考訳(メタデータ) (2020-12-03T18:54:24Z) - Towards Learning Instantiated Logical Rules from Knowledge Graphs [20.251630903853016]
本稿では,知識グラフから一階述語論理規則を抽出するために最適化された確率論的学習ルールGPFLを提案する。
GPFLは、抽出された経路を非循環的な抽象規則であるテンプレートに一般化する新しい2段階ルール生成機構を利用する。
オーバーフィッティングルールの存在、予測性能への影響、およびオーバーフィッティングルールをフィルタリングする単純なバリデーション手法の有効性を明らかにする。
論文 参考訳(メタデータ) (2020-03-13T00:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。