Fugu-MT 論文翻訳(概要): On simple expectations and observations of intelligent agents: A complexity study

論文の概要: On simple expectations and observations of intelligent agents: A complexity study

arxiv url: http://arxiv.org/abs/2306.02769v1
Date: Mon, 5 Jun 2023 10:53:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-06 15:41:16.914462
Title: On simple expectations and observations of intelligent agents: A complexity study
Title（参考訳）: 知的エージェントの単純な期待と観察について:複雑性研究
Authors: Sourav Chakraborty, Avijeet Ghosh, Sujata Ghosh and Fran\c{c}ois Schwarzentruber
Abstract要約: POL(Public Observation logic)は、様々な現実の状況におけるエージェントの期待とエージェントの観察に関する理由である。本研究では, POLの種々のフラグメントの満足度問題に対する計算複雑性について検討する。その過程では、これらのフラグメントがよく研究されているパブリックな発表ロジックと必然的に結びついている点を強調します。
参考スコア（独自算出の注目度）: 3.077802365568915
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Public observation logic (POL) reasons about agent expectations and agent observations in various real world situations. The expectations of agents take shape based on certain protocols about the world around and they remove those possible scenarios where their expectations and observations do not match. This in turn influences the epistemic reasoning of these agents. In this work, we study the computational complexity of the satisfaction problems of various fragments of POL. In the process, we also highlight the inevitable link that these fragments have with the well-studied Public announcement logic.
Abstract（参考訳）: POL(Public Observation logic)は、様々な現実世界におけるエージェントの期待とエージェントの観察に関する理由である。エージェントの期待は、周りの世界の特定のプロトコルに基づいて形成され、期待と観察が一致しないようなシナリオを取り除く。このことは、これらの薬剤の疫学的推論に影響を及ぼす。本研究では, POLの種々の断片の満足度問題の計算複雑性について検討する。その過程では、これらのフラグメントがよく研究されている公開発表ロジックと必然的に結びついている点を強調します。

関連論文リスト

Complexity Control Facilitates Reasoning-Based Compositional Generalization in Transformers [10.206921909332006]
本研究では,コンポジションタスクにおけるトランスフォーマーの振舞いのメカニズムについて検討する。複雑性制御戦略は,分布外(推論に基づく解)を一般化するプリミティブレベルのルールを学習するか,あるいは記憶されたマッピング(メモリベースの解)にのみ依存するかに影響を及ぼす。
論文参考訳（メタデータ） (2025-01-15T02:54:52Z)
On Multi-Agent Inverse Reinforcement Learning [8.284137254112848]
Inverse Reinforcement Learning (IRL) フレームワークを多エージェント設定に拡張し、Nash Equilibrium (NE) ポリシーに従うエージェントを観察する。本稿では,現実的な報酬セットを明示的に評価し,移行ダイナミクスや専門家の行動が報酬にどのように影響するかを推定する。
論文参考訳（メタデータ） (2024-11-22T16:31:36Z)
Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文参考訳（メタデータ） (2023-12-07T18:57:03Z)
On the Complexity of Multi-Agent Decision Making: From Learning in Games to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文参考訳（メタデータ） (2023-05-01T06:46:22Z)
On verifying expectations and observations of intelligent agents [3.077802365568915]
パブリック・オブザーバ・ロジック (Public Observation logic, POL) は、エージェントの期待とエージェントの観察を推論するダイナミック・エピステミック・ロジックの変種である。本研究では,POLのモデルチェック問題の計算複雑性について検討し,そのPSPACE完全性を証明する。本研究では,POLモデル検査の適用性を実証し,対話システムの異なる特性と特徴を,システムの異なる期待と(マッチング)観察に対して検証する。
論文参考訳（メタデータ） (2022-05-02T10:09:49Z)
Q-Mixing Network for Multi-Agent Pathfinding in Partially Observable Grid Environments [62.997667081978825]
部分的に観測可能なグリッド環境におけるマルチエージェントナビゲーションの問題点を考察する。エージェントがまず、観察を行動にマッピングする方針を学習し、その目的を達成するためにこれらの方針に従うとき、強化学習アプローチを活用することを提案する。
論文参考訳（メタデータ） (2021-08-13T09:44:47Z)
Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文参考訳（メタデータ） (2021-07-10T03:49:41Z)
CausalCity: Complex Simulations with Agency for Causal Discovery and Reasoning [68.74447489372037]
本稿では,因果探索と反事実推論のためのアルゴリズムの開発を目的とした,高忠実度シミュレーション環境を提案する。私たちの作業の中核となるコンポーネントは、複雑なシナリオを定義して作成することが簡単になるような、テキストの緊急性を導入することです。我々は3つの最先端の手法による実験を行い、ベースラインを作成し、この環境の可利用性を強調する。
論文参考訳（メタデータ） (2021-06-25T00:21:41Z)
What is Going on Inside Recurrent Meta Reinforcement Learning Agents? [63.58053355357644]
recurrent meta reinforcement learning (meta-rl)エージェントは「学習アルゴリズムの学習」を目的としてrecurrent neural network (rnn)を使用するエージェントである。部分観測可能なマルコフ決定プロセス(POMDP)フレームワークを用いてメタRL問題を再構成することにより,これらのエージェントの内部動作機構を明らかにする。
論文参考訳（メタデータ） (2021-04-29T20:34:39Z)
Local and Global Explanations of Agent Behavior: Integrating Strategy Summaries with Saliency Maps [4.568911586155097]
我々は、強化学習エージェントのグローバルな説明とローカルな説明を組み合わせる。本研究では,サリエンシマップを用いたシミュレーションから,状態の重要軌跡を抽出する戦略要約を強化する。実測値と実測値との混合結果が得られた。
論文参考訳（メタデータ） (2020-05-18T16:44:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。