論文の概要: Shared Spatial Memory Through Predictive Coding
- arxiv url: http://arxiv.org/abs/2511.04235v1
- Date: Thu, 06 Nov 2025 10:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.384638
- Title: Shared Spatial Memory Through Predictive Coding
- Title(参考訳): 予測符号化による共有空間記憶
- Authors: Zhengru Fang, Yu Guo, Jingjing Wang, Yuang Zhang, Haonan An, Yinhai Wang, Yuguang Fang,
- Abstract要約: エージェント間の相互不確実性の最小化として協調を定式化する多エージェント予測符号化フレームワークを提案する。
このフレームワークの基礎には、自己ローカライゼーションのための内部空間符号化としてグリッドセルのようなメトリクスがある。
エージェントは徐々に、パートナーの位置を符号化する帯域効率の高い通信機構と特殊な神経集団を開発する。
- 参考スコア(独自算出の注目度): 34.221039336567415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sharing and reconstructing a consistent spatial memory is a critical challenge in multi-agent systems, where partial observability and limited bandwidth often lead to catastrophic failures in coordination. We introduce a multi-agent predictive coding framework that formulate coordination as the minimization of mutual uncertainty among agents. Instantiated as an information bottleneck objective, it prompts agents to learn not only who and what to communicate but also when. At the foundation of this framework lies a grid-cell-like metric as internal spatial coding for self-localization, emerging spontaneously from self-supervised motion prediction. Building upon this internal spatial code, agents gradually develop a bandwidth-efficient communication mechanism and specialized neural populations that encode partners' locations: an artificial analogue of hippocampal social place cells (SPCs). These social representations are further enacted by a hierarchical reinforcement learning policy that actively explores to reduce joint uncertainty. On the Memory-Maze benchmark, our approach shows exceptional resilience to bandwidth constraints: success degrades gracefully from 73.5% to 64.4% as bandwidth shrinks from 128 to 4 bits/step, whereas a full-broadcast baseline collapses from 67.6% to 28.6%. Our findings establish a theoretically principled and biologically plausible basis for how complex social representations emerge from a unified predictive drive, leading to social collective intelligence.
- Abstract(参考訳): 一貫性のある空間記憶の共有と再構成は、部分的な可観測性と帯域幅の制限が、協調の破滅的な失敗に繋がる多エージェントシステムにおいて重要な課題である。
エージェント間の相互不確実性の最小化として協調を定式化する多エージェント予測符号化フレームワークを提案する。
情報ボトルネックの目的として確立されたこの手法は、エージェントに対して、誰と何を通信すべきかだけでなく、いつ何を通信すべきかを学ぶように促す。
この枠組みの基礎には、自己局所化のための内部空間符号化としてグリッドセルのようなメートル法があり、自監督運動予測から自然に現れる。
この内部空間コードに基づいて、エージェントは徐々に帯域効率の高い通信機構と、パートナーの位置をコードする特殊な神経集団、すなわち海馬の社会的場所細胞(SPC)の人工的なアナログを開発する。
これらの社会的表現は、共同不確実性を減らすために積極的に探求する階層的な強化学習政策によってさらに実現される。
成功率は73.5%から64.4%に低下し、帯域幅は128ビットから4ビット/ステップに縮小する一方、フルブロードキャストのベースラインは67.6%から28.6%に低下する。
我々の発見は、複雑な社会表現が統一された予測ドライブからどのように出現し、社会集団知性をもたらすか、理論的に原理化され、生物学的に妥当な基礎を確立した。
関連論文リスト
- Deep Reinforcement Learning for Multi-Agent Coordination [8.250169938213558]
本稿では,仮想フェロモンを用いて局所的・社会的相互作用をモデル化するS-MADRL(Stigmergic Multi-Agent Deep Reinforcement Learning)フレームワークを提案する。
我々は,ロボットが非対称な作業負荷分布に自己組織化される,最大8つのエージェントの最も効果的な協調を実現していることを示す。
この創発的行動は、自然界で観察される戦略に類似しており、混雑した環境下での分散マルチエージェント協調のためのスケーラブルなソリューションを示している。
論文 参考訳(メタデータ) (2025-10-04T00:47:20Z) - Understanding Human Activity with Uncertainty Measure for Novelty in Graph Convolutional Networks [2.223052975765005]
本稿では,テンポラルフュージョングラフ畳み込みネットワークについて紹介する。
これは、アクティビティストリーム内の個々のアクションの境界推定が不十分であることを是正することを目的としている。
また、時間次元における過分割の問題も緩和する。
論文 参考訳(メタデータ) (2024-10-10T13:44:18Z) - Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの非絶対的実行から平均フィールドゲームにおいて平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
ポリシー情報の交換は,ネットワーク化されたエージェントが,機能近似設定において,独立エージェントと集中エージェントの両方より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-21T13:32:46Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - Privacy-Preserving Distributed Learning for Residential Short-Term Load
Forecasting [11.185176107646956]
電力システムの負荷データは、住宅ユーザの日常のルーチンを不注意に明らかにし、彼らの財産のセキュリティにリスクを及ぼす可能性がある。
我々はマルコフスイッチ方式の分散学習フレームワークを導入し、その収束は厳密な理論的解析によって実証される。
実世界の電力系統負荷データを用いたケーススタディにより,提案アルゴリズムの有効性を検証した。
論文 参考訳(メタデータ) (2024-02-02T16:39:08Z) - Compressed Regression over Adaptive Networks [58.79251288443156]
分散エージェントのネットワークによって達成可能な性能を導出し,通信制約や回帰問題を解消し,適応的に解決する。
エージェントによって最適化に必要なパラメータをオンラインで学習できる最適化アロケーション戦略を考案する。
論文 参考訳(メタデータ) (2023-04-07T13:41:08Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Dimension-Free Rates for Natural Policy Gradient in Multi-Agent
Reinforcement Learning [22.310861786709538]
協調型マルチエージェント強化学習のためのスケーラブルなアルゴリズムを提案する。
このアルゴリズムは,次元自由な統計量と計算量とで,グローバルな最適ポリシーに収束することを示す。
論文 参考訳(メタデータ) (2021-09-23T23:38:15Z) - Neural Enhanced Belief Propagation for Cooperative Localization [6.787897491422112]
位置対応ネットワークは、現代的な利便性、応用海洋科学、公共安全のための革新的なサービスと応用を導入する。
モデルベースおよびデータ駆動推論のためのハイブリッド手法を確立する。
無線ネットワーク内の移動体エージェントが、他のエージェントと相互に観測し、位置情報を交換することで、自らをローカライズすることを目的とした、協調的ローカライゼーション(CL)シナリオを検討する。
論文 参考訳(メタデータ) (2021-05-27T01:42:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。