論文の概要: Recursive Metropolis-Hastings Naming Game: Symbol Emergence in a
Multi-agent System based on Probabilistic Generative Models
- arxiv url: http://arxiv.org/abs/2305.19761v1
- Date: Wed, 31 May 2023 11:46:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 17:01:44.594076
- Title: Recursive Metropolis-Hastings Naming Game: Symbol Emergence in a
Multi-agent System based on Probabilistic Generative Models
- Title(参考訳): Recursive Metropolis-Hastings Naming Game:確率的生成モデルに基づくマルチエージェントシステムにおけるシンボル創発
- Authors: Jun Inukai, Tadahiro Taniguchi, Akira Taniguchi, Yoshinobu Hagiwara
- Abstract要約: 本稿では,メトロポリス・ハスティングスの名称ゲーム(MHNG)をNエージェントシナリオに拡張する。
RMHNGはエージェントが共有する潜伏変数の後方分布を近似したベイズ推定法である。
RMHNGの計算が単純化されたバージョンでさえ、シンボルがエージェント間で出現することを可能にした。
- 参考スコア(独自算出の注目度): 6.270305440413688
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the studies on symbol emergence and emergent communication in a population
of agents, a computational model was employed in which agents participate in
various language games. Among these, the Metropolis-Hastings naming game (MHNG)
possesses a notable mathematical property: symbol emergence through MHNG is
proven to be a decentralized Bayesian inference of representations shared by
the agents. However, the previously proposed MHNG is limited to a two-agent
scenario. This paper extends MHNG to an N-agent scenario. The main
contributions of this paper are twofold: (1) we propose the recursive
Metropolis-Hastings naming game (RMHNG) as an N-agent version of MHNG and
demonstrate that RMHNG is an approximate Bayesian inference method for the
posterior distribution over a latent variable shared by agents, similar to
MHNG; and (2) we empirically evaluate the performance of RMHNG on synthetic and
real image data, enabling multiple agents to develop and share a symbol system.
Furthermore, we introduce two types of approximations -- one-sample and
limited-length -- to reduce computational complexity while maintaining the
ability to explain communication in a population of agents. The experimental
findings showcased the efficacy of RMHNG as a decentralized Bayesian inference
for approximating the posterior distribution concerning latent variables, which
are jointly shared among agents, akin to MHNG. Moreover, the utilization of
RMHNG elucidated the agents' capacity to exchange symbols. Furthermore, the
study discovered that even the computationally simplified version of RMHNG
could enable symbols to emerge among the agents.
- Abstract(参考訳): エージェント集団におけるシンボル出現と創発的コミュニケーションに関する研究において,エージェントが様々な言語ゲームに参加する計算モデルが採用された。
このうち、メトロポリス・ハスティングス命名ゲーム(MHNG)は、MHNGによるシンボルの出現は、エージェントが共有する表現の分散ベイズ的推論であることが証明されている。
しかし、以前提案されたMHNGは2エージェントのシナリオに限定されている。
本稿では,MHNGをNエージェントシナリオに拡張する。
本論文の主な貢献は,(1)MHNGのNエージェント版として再帰的メトロポリス・ハスティングス命名ゲーム(RMHNG)を提案し,RMHNGがMHNGと同様のエージェントによって共有される潜伏変数に対する後続分布の近似ベイズ推定法であることを実証し,(2)合成および実画像データにおけるRMHNGの性能を実証的に評価し,複数のエージェントがシンボルシステムを開発し,共有できるようにする。
さらに,1サンプルと制限長の2種類の近似を導入し,計算複雑性を低減し,エージェントの集団におけるコミュニケーションを説明する能力を維持する。
実験の結果, RMHNGは, MHNGと同様, 潜伏変数に関する後部分布を近似するための分散ベイズ推定法として有効であった。
さらにRMHNGの利用により、シンボル交換のためのエージェントの能力が解明された。
さらに、計算的に単純化されたRMHNGでさえ、エージェント間でシンボルが出現することを発見した。
関連論文リスト
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards [1.179778723980276]
MARL(Multi-agent Reinforcement Learning)は、シーケンシャルな意思決定と制御タスクの鍵となるフレームワークである。
これらのシステムを現実のシナリオに展開するには、分散トレーニング、多様なエージェントセット、そして頻繁な環境報酬信号から学ぶ必要がある。
我々は,新しいグラフニューラルネットワーク(GNN)に基づく本質的なモチベーションを利用して,異種エージェントポリシーの学習を容易にするCoHetアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-12T21:38:40Z) - Model-Based RL for Mean-Field Games is not Statistically Harder than Single-Agent RL [57.745700271150454]
モデルに基づく関数近似を用いた平均フィールドゲーム(MFG)における強化学習のサンプル複雑性について検討した。
本稿では、モデルクラスの複雑性を特徴付けるためのより効果的な概念である部分モデルベースエルダー次元(P-MBED)を紹介する。
論文 参考訳(メタデータ) (2024-02-08T14:54:47Z) - Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs [49.71319907864573]
本稿では,分解が容易なマルチエージェントスキル発見法を提案する。
我々のキーとなる考え方は、合同状態空間をクロネッカーグラフとして近似することであり、そのフィドラーベクトルを直接見積もることができる。
ラプラシアンスペクトルを直接計算することは、無限大の状態空間を持つタスクには難易度が高いことを考慮し、さらに本手法の深層学習拡張を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:53:12Z) - Metropolis-Hastings algorithm in joint-attention naming game:
Experimental semiotics study [6.270305440413688]
本研究では, 個人間の相互作用におけるシンボルの出現について, 実験的なセミオティックスタディを通して検討した。
我々は、参加者が単独でオブジェクトを分類し、共同注意を仮定しながら名前を割り当てるジョイント・アテンション・ナッシング・ゲーム(JA-NG)に注目した。
パートナーの命名決定とMHNGで計算された受理確率を比較することで、人間の行動がMHNG理論と一致しているかどうかを検証した。
論文 参考訳(メタデータ) (2023-05-31T15:20:54Z) - IPCC-TP: Utilizing Incremental Pearson Correlation Coefficient for Joint
Multi-Agent Trajectory Prediction [73.25645602768158]
IPCC-TPはインクリメンタルピアソン相関係数に基づく新しい関連認識モジュールであり,マルチエージェントインタラクションモデリングを改善する。
我々のモジュールは、既存のマルチエージェント予測手法に便利に組み込んで、元の動き分布デコーダを拡張することができる。
論文 参考訳(メタデータ) (2023-03-01T15:16:56Z) - Emergent Communication through Metropolis-Hastings Naming Game with Deep
Generative Models [6.270305440413688]
本研究の目的は,確率的生成モデルに基づく創発的コミュニケーションのための新しいモデルを提供することである。
メトロポリス・ハスティングス(Metropolis-Hastings、MH)は、積分確率的生成モデルのための一種のMHアルゴリズムである。
また、創発的コミュニケーションをシミュレートする深層生成モデルであるInter-GMM+VAEも提供する。
論文 参考訳(メタデータ) (2022-05-24T22:49:53Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - Learning Multi-agent Skills for Tabular Reinforcement Learning using
Factor Graphs [41.17714498464354]
エージェント間の協調的な探索行動により,マルチエージェントの選択肢を直接計算できることが示唆された。
提案アルゴリズムは,マルチエージェントオプションの同定に成功し,シングルエージェントオプションや非オプションを用いることで,従来よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2022-01-20T15:33:08Z) - Multi-Agent MDP Homomorphic Networks [100.74260120972863]
協調型マルチエージェントシステムでは、エージェントの異なる構成とそれらの局所的な観察の間に複雑な対称性が生じる。
単エージェント強化学習における既存の対称性の研究は、完全に集中した環境にのみ一般化できる。
本稿では,ローカル情報のみを用いた分散実行が可能なネットワークのクラスであるマルチエージェントMDPホモモルフィックネットワークを提案する。
論文 参考訳(メタデータ) (2021-10-09T07:46:25Z) - Multiagent Multimodal Categorization for Symbol Emergence: Emergent
Communication via Interpersonal Cross-modal Inference [4.964816143841663]
本稿では,創発的コミュニケーションを実現するマルチエージェントマルチモーダル分類の計算モデルについて述べる。
インターMDMにより、エージェントはマルチモーダルカテゴリを形成し、エージェント間でサインを適切に共有することができる。
突発的コミュニケーションは,いくつかの感覚的モダリティが欠如している場合でも,分類精度を向上させることが示されている。
論文 参考訳(メタデータ) (2021-09-15T10:20:54Z) - Brainstorming Generative Adversarial Networks (BGANs): Towards
Multi-Agent Generative Models with Distributed Private Datasets [70.62568022925971]
生成的敵ネットワーク(GAN)は、データ空間を適切に表現する大規模なデータセットによって供給されなければならない。
多くのシナリオでは、利用可能なデータセットは制限され、複数のエージェントに分散する可能性がある。
本稿では,BGAN(Breepstorming GAN)アーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-02T02:58:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。