論文の概要: On verifying expectations and observations of intelligent agents
- arxiv url: http://arxiv.org/abs/2205.00784v1
- Date: Mon, 2 May 2022 10:09:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-03 20:04:56.898315
- Title: On verifying expectations and observations of intelligent agents
- Title(参考訳): 知的エージェントの期待と観察の検証について
- Authors: Sourav Chakraborty, Avijeet Ghosh, Sujata Ghosh and Fran\c{c}ois
Schwarzentruber
- Abstract要約: パブリック・オブザーバ・ロジック (Public Observation logic, POL) は、エージェントの期待とエージェントの観察を推論するダイナミック・エピステミック・ロジックの変種である。
本研究では,POLのモデルチェック問題の計算複雑性について検討し,そのPSPACE完全性を証明する。
本研究では,POLモデル検査の適用性を実証し,対話システムの異なる特性と特徴を,システムの異なる期待と(マッチング)観察に対して検証する。
- 参考スコア(独自算出の注目度): 3.077802365568915
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Public observation logic (POL) is a variant of dynamic epistemic logic to
reason about agent expectations and agent observations. Agents have certain
expectations, regarding the situation at hand, that are actuated by the
relevant protocols, and they eliminate possible worlds in which their
expectations do not match with their observations. In this work, we investigate
the computational complexity of the model checking problem for POL and prove
its PSPACE-completeness. We also study various syntactic fragments of POL. We
exemplify the applicability of POL model checking in verifying different
characteristics and features of an interactive system with respect to the
distinct expectations and (matching) observations of the system. Finally, we
provide a discussion on the implementation of the model checking algorithms.
- Abstract(参考訳): パブリック・オブザーバー・ロジック(public observation logic、pol)は、エージェントの期待やエージェントの観察を推論するための動的認識論理の変種である。
エージェントは、目の前の状況に関して、関連するプロトコルによってアクティベートされる特定の期待を持ち、彼らの期待が彼らの観察と一致しない可能性のある世界を排除します。
本研究では,POLのモデルチェック問題の計算複雑性について検討し,そのPSPACE完全性を証明する。
POLの様々な構文的断片についても検討した。
本研究では,POLモデル検査の適用性を実証し,対話システムの異なる特性と特徴を,システムの異なる期待と(マッチング)観察に対して検証する。
最後に,モデル検査アルゴリズムの実装について論じる。
関連論文リスト
- How to Exhibit More Predictable Behaviors [3.5248694676821484]
本稿では,外部オブザーバが行うことができる予測を最適化するために,エージェントがその戦略を選択する必要がある予測可能性問題について考察する。
環境力学や観察対象者の政策について不確実性を考慮して検討する。
本稿では,エージェントポリシーに対するオブザーバの信念に基づいて,報酬関数を用いた行動予測可能性評価基準を提案する。
論文 参考訳(メタデータ) (2024-04-17T12:06:17Z) - On simple expectations and observations of intelligent agents: A
complexity study [3.077802365568915]
POL(Public Observation logic)は、様々な現実の状況におけるエージェントの期待とエージェントの観察に関する理由である。
本研究では, POLの種々のフラグメントの満足度問題に対する計算複雑性について検討する。
その過程では、これらのフラグメントがよく研究されているパブリックな発表ロジックと必然的に結びついている点を強調します。
論文 参考訳(メタデータ) (2023-06-05T10:53:27Z) - Knowledge-Based Counterfactual Queries for Visual Question Answering [0.0]
本稿では,VQAモデルの動作を説明するための系統的手法を提案する。
そこで我々は,言語的モダリティをターゲットとした決定論的,最適,制御可能な単語レベルの置換を行うために,構造化知識ベースを利用する。
次に、そのような反実的な入力に対するモデルの応答を評価する。
論文 参考訳(メタデータ) (2023-03-05T08:00:30Z) - Distributed Bayesian Learning of Dynamic States [65.7870637855531]
提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
論文 参考訳(メタデータ) (2022-12-05T19:40:17Z) - Neural Causal Models for Counterfactual Identification and Estimation [62.30444687707919]
本稿では,ニューラルモデルによる反事実文の評価について検討する。
まず、神経因果モデル(NCM)が十分に表現可能であることを示す。
第2に,反事実分布の同時同定と推定を行うアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-09-30T18:29:09Z) - DIDER: Discovering Interpretable Dynamically Evolving Relations [14.69985920418015]
本稿では,内在的解釈可能性を備えた汎用的なエンドツーエンドインタラクションモデリングフレームワークであるDIDER,Discovering Interpretable Dynamically Evolving Relationsを紹介する。
合成と実世界の両方のデータセット上でDIDERを評価する。
論文 参考訳(メタデータ) (2022-08-22T20:55:56Z) - PAC Reinforcement Learning for Predictive State Representations [60.00237613646686]
部分的に観察可能な力学系におけるオンライン強化学習(RL)について検討する。
我々は、他のよく知られたモデルをキャプチャする表現モデルである予測状態表現(PSR)モデルに焦点を当てる。
我々は,サンプル複雑性のスケーリングにおいて,ほぼ最適なポリシを学習可能な,PSRのための新しいモデルベースアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-12T17:57:17Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Explaining and Improving Model Behavior with k Nearest Neighbor
Representations [107.24850861390196]
モデルの予測に責任のあるトレーニング例を特定するために, k 近傍表現を提案する。
我々は,kNN表現が学習した素因関係を明らかにするのに有効であることを示す。
以上の結果から,kNN手法により,直交モデルが逆入力に対してより堅牢であることが示唆された。
論文 参考訳(メタデータ) (2020-10-18T16:55:25Z) - Invariant Causal Prediction for Block MDPs [106.63346115341862]
環境全体にわたる一般化は、実世界の課題への強化学習アルゴリズムの適用の成功に不可欠である。
本稿では,多環境環境における新しい観測を一般化するモデル不適合状態抽象化(MISA)を学習するための不変予測法を提案する。
論文 参考訳(メタデータ) (2020-03-12T21:03:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。