論文の概要: Partially Observable Stochastic Games with Neural Perception Mechanisms
- arxiv url: http://arxiv.org/abs/2310.11566v1
- Date: Tue, 17 Oct 2023 20:25:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-19 12:08:54.661488
- Title: Partially Observable Stochastic Games with Neural Perception Mechanisms
- Title(参考訳): 神経知覚機構を有する部分可観測確率ゲーム
- Authors: Rui Yan, Gabriel Santos, Gethin Norman, David Parker and Marta
Kwiatkowska
- Abstract要約: ニューロシンボリック部分観測ゲーム(NS-POSG)のモデルを提案する。
本研究では、離散的なデータ駆動観察を行う部分インフォームドエージェントと、連続的な観察を行う完全インフォームドエージェントとからなる一方的な設定に焦点を当てた。
本研究では,一方のNS-POSGの値の近似法として,一方のNS-HSVIと呼ばれる新たな点ベースの手法を提案する。
- 参考スコア(独自算出の注目度): 33.8116851154507
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stochastic games are a well established model for multi-agent sequential
decision making under uncertainty. In reality, though, agents have only partial
observability of their environment, which makes the problem computationally
challenging, even in the single-agent setting of partially observable Markov
decision processes. Furthermore, in practice, agents increasingly perceive
their environment using data-driven approaches such as neural networks trained
on continuous data. To tackle this problem, we propose the model of
neuro-symbolic partially-observable stochastic games (NS-POSGs), a variant of
continuous-space concurrent stochastic games that explicitly incorporates
perception mechanisms. We focus on a one-sided setting, comprising a
partially-informed agent with discrete, data-driven observations and a
fully-informed agent with continuous observations. We present a new point-based
method, called one-sided NS-HSVI, for approximating values of one-sided
NS-POSGs and implement it based on the popular particle-based beliefs, showing
that it has closed forms for computing values of interest. We provide
experimental results to demonstrate the practical applicability of our method
for neural networks whose preimage is in polyhedral form.
- Abstract(参考訳): 確率ゲームは、不確実性の下でのマルチエージェントシーケンシャル決定のためのよく確立されたモデルである。
しかし実際には、エージェントは環境の部分的可観測性しか持たず、部分可観測マルコフ決定プロセスの単一エージェント設定においても計算的に困難である。
さらに、エージェントは、継続的データでトレーニングされたニューラルネットワークのようなデータ駆動アプローチを使って、環境を知覚するようになっている。
この問題を解決するために,知覚機構を明示的に組み込んだ連続空間型確率ゲーム(NS-POSG)のモデルを提案する。
本研究では、離散的なデータ駆動観察を行う部分インフォームドエージェントと、連続観察を行う完全インフォームドエージェントからなる一方的な設定に焦点を当てた。
本稿では,一面ns-posgの値を近似し,人気の粒子ベース信念に基づいて実装するための,一面ns-hsviと呼ばれる新しい点ベース手法を提案する。
本稿では,前画像が多面体型であるニューラルネットワークの実用的適用性を示す実験結果を示す。
関連論文リスト
- Diffusion models as probabilistic neural operators for recovering unobserved states of dynamical systems [49.2319247825857]
拡散に基づく生成モデルは、ニューラル演算子に好適な多くの特性を示す。
本稿では,複数のタスクに適応可能な単一モデルを,トレーニング中のタスク間で交互に学習することを提案する。
論文 参考訳(メタデータ) (2024-05-11T21:23:55Z) - Qualitative Prediction of Multi-Agent Spatial Interactions [5.742409080817885]
我々は,密集シーンにおけるマルチエージェントインタラクションをモデル化し,予測するための3つの新しいアプローチを提示し,ベンチマークする。
提案手法は、個々の相互作用を予測する静的および動的コンテキストを考慮したものである。
彼らはインプット・アンド・タイムアテンション・メカニズムを利用し、中・長期の地平線でテストされる。
論文 参考訳(メタデータ) (2023-06-30T18:08:25Z) - Cheap and Deterministic Inference for Deep State-Space Models of
Interacting Dynamical Systems [38.23826389188657]
本稿では,基礎となる相互作用力学系をモデル化するために,グラフニューラルネットワークを用いた深部状態空間モデルを提案する。
予測分布はマルチモーダルであり、ガウス混合モデルの形をしており、ガウス成分のモーメントは決定論的モーメントマッチングルールによって計算できる。
我々のモーメントマッチングスキームはサンプルのない推論に利用でき、モンテカルロの代替案と比較してより効率的で安定した訓練がもたらされる。
論文 参考訳(メタデータ) (2023-05-02T20:30:23Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Learning Interacting Dynamical Systems with Latent Gaussian Process ODEs [13.436770170612295]
本研究では,対話対象の連続時間力学の不確実性を考慮したモデリングを初めて行った。
我々のモデルは、独立力学と信頼性のある不確実性推定との相互作用の両方を推測する。
論文 参考訳(メタデータ) (2022-05-24T08:36:25Z) - EINNs: Epidemiologically-Informed Neural Networks [75.34199997857341]
本稿では,疫病予測のための新しい物理インフォームドニューラルネットワークEINNを紹介する。
メカニスティックモデルによって提供される理論的柔軟性と、AIモデルによって提供されるデータ駆動表現性の両方を活用する方法について検討する。
論文 参考訳(メタデータ) (2022-02-21T18:59:03Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Modeling Implicit Bias with Fuzzy Cognitive Maps [0.0]
本稿では、構造化データセットにおける暗黙バイアスを定量化するファジィ認知マップモデルを提案する。
本稿では,ニューロンの飽和を防止する正規化様伝達関数を備えた新しい推論機構を提案する。
論文 参考訳(メタデータ) (2021-12-23T17:04:12Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - Forecasting Sequential Data using Consistent Koopman Autoencoders [52.209416711500005]
クープマン理論に関連する新しい物理学に基づく手法が導入された。
本稿では,既存の作業の多くと異なり,前方・後方のダイナミクスを生かした新しいコンシスタント・クープマン・オートエンコーダモデルを提案する。
このアプローチの鍵となるのは、一貫性のある力学と関連するクープマン作用素との相互作用を探索する新しい解析である。
論文 参考訳(メタデータ) (2020-03-04T18:24:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。