論文の概要: EquiMem: Calibrating Shared Memory in Multi-Agent Debate via Game-Theoretic Equilibrium
- arxiv url: http://arxiv.org/abs/2605.09278v1
- Date: Sun, 10 May 2026 03:04:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.162542
- Title: EquiMem: Calibrating Shared Memory in Multi-Agent Debate via Game-Theoretic Equilibrium
- Title(参考訳): EquiMem: ゲーム理論平衡による多エージェント議論における共有メモリの校正
- Authors: Yuqiao Meng, Sakshi Sunil Narvekar, Luoxi Tang, Rupali Rajendra Vaje, Yingxue Zhang, Muchao Ye, Zhaohan Xi,
- Abstract要約: マルチエージェント討論(MAD)システムは、長期の推論をサポートするために共有メモリに依存している。
単一の破損したエントリは、下流のメモリ拡張された推論を汚染し、議論だけではそのようなエラーをフィルタリングすることができない。
提案するEquiMemは,各更新を共有メモリ状態に対してアルゴリズム的に定量化する推論時キャリブレーション機構である。
- 参考スコア(独自算出の注目度): 10.71445877501096
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multi-agent debate (MAD) systems increasingly rely on shared memory to support long-horizon reasoning, but this convenience opens a critical vulnerability: a single corrupted entry can contaminate the downstream memory-augmented reasoning, and debate alone fails to filter such errors. Existing safeguards filter entries via heuristics or LLM-based validation, yet they rely on AI judgments that share the same failure modes and overlook the cross-agent dynamics of MAD. We address this gap by formulating memory updating in MAD as a zero-trust memory game, in which no agent is assumed honest and the game's equilibrium serves as an indicator of optimal memory trust. Guided by this equilibrium, we propose EquiMem, an inference-time calibration mechanism that quantifies each update algorithmically against the shared memory state, using agents' existing retrieval queries and traversal paths as evidence rather than soliciting any LLM judgment. EquiMem instantiates calibration for both embedding- and graph-based memory, and across diverse benchmarks, MAD frameworks, and memory architectures, it consistently outperforms existing safeguards, remains robust under adversarial agents, and incurs negligible inference overhead.
- Abstract(参考訳): マルチエージェントディベート(MAD)システムは、長い水平推論をサポートするために共有メモリに依存していることが多いが、この利便性は重大な脆弱性を生じさせる。
既存のセーフガードはヒューリスティックスやLLMベースの検証を通じてエントリをフィルタリングするが、同じ障害モードを共有し、MADのクロスエージェントダイナミクスを見落としているAI判断に依存している。
我々は,MADにおけるメモリ更新をゼロトラストメモリゲームとして定式化し,エージェントを正直に仮定せず,ゲームの平衡が最適なメモリ信頼の指標となるようなギャップに対処する。
この平衡によって導かれたEquiMemは、エージェントの既存の検索クエリとトラバースパスを証拠として用いて、各更新をアルゴリズム的に共有メモリ状態に対して定量化する推論時キャリブレーション機構である。
EquiMemは組み込みメモリとグラフベースのメモリの両方のキャリブレーションをインスタンス化し、さまざまなベンチマーク、MADフレームワーク、メモリアーキテクチャにわたって、既存のセーフガードを一貫して上回り、敵エージェントの下で堅牢であり、無視できない推論オーバーヘッドを発生させる。
関連論文リスト
- Belief Memory: Agent Memory Under Partial Observability [56.41506249481312]
本稿では,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
BeliefMemは決定論的パラダイムが破棄されるという不確実性を保ち、エージェントが高い信頼を持って行動することを可能にする。
LoCoMoとALFWorldベンチマークの実証的な評価は、限られたデータであっても、BeliefMemが最高の平均パフォーマンスを達成することを示している。
論文 参考訳(メタデータ) (2026-05-07T02:03:13Z) - Memory Centric Power Allocation for Multi-Agent Embodied Question Answering [49.3249799261475]
マルチエージェントの具体的質問応答(MA-EQA)は、ロボットチームに対して、長い視野で見たものを問うことを目的としている。
このパラダイムシフトに対処するために、生成逆検(GAE)に基づく品質記憶モデル(QoM)を提案する。
次に,通信資源制約下でQoM関数を最大化するメモリ中心電力割り当て(MCPA)を提案する。
論文 参考訳(メタデータ) (2026-04-20T05:08:53Z) - MemEvoBench: Benchmarking Memory MisEvolution in LLM Agents [78.95081012334116]
永続メモリを持つ大規模言語モデル(LLM)は、相互作用の継続性とパーソナライゼーションを高めるが、新たな安全性リスクをもたらす。
汚染または偏りのある記憶蓄積は、異常な作用を引き起こす可能性がある。
MemeEvoBenchは、LLMエージェントのメモリ安全性を評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-04-17T07:29:52Z) - MemCollab: Cross-Agent Memory Collaboration via Contrastive Trajectory Distillation [16.57908722474221]
大規模言語モデル(LLM)ベースのエージェントは、過去の問題解決経験から知識を再利用するためのメモリメカニズムに依存している。
既存のアプローチは、通常、エージェントごとの方法でメモリを構築し、格納された知識を単一のモデルの推論スタイルに密結合する。
その結果,エージェント間でのメモリ転送は,タスク関連知識をエージェント固有のバイアスと結び付けるなど,パフォーマンスを低下させることがわかった。
我々は,同一タスク上で異なるエージェントが生成する軌道の推論を対比することにより,エージェント非依存メモリを構成する協調メモリフレームワークであるMemCollabを提案する。
論文 参考訳(メタデータ) (2026-03-24T14:05:47Z) - MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution [52.29303869050117]
メモリ拡張LDMエージェントは、長期の相互作用をサポートするために外部メモリバンクを保持する。
MemMAはプラグアンドプレイのマルチエージェントフレームワークで、前方と後方の両方の経路に沿ってメモリサイクルを調整する。
論文 参考訳(メタデータ) (2026-03-19T10:15:59Z) - NextMem: Towards Latent Factual Memory for LLM-based Agents [58.35585202907478]
NextMemは、自動回帰型オートエンコーダを使用して、潜時メモリを効率的に構築する、潜時ファクトメモリフレームワークである。
大規模な実験は、NextMemが優れたパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-02-26T14:35:27Z) - A-MemGuard: A Proactive Defense Framework for LLM-Based Agent Memory [31.673865459672285]
大規模言語モデル(LLM)エージェントは、過去のインタラクションから学習するためにメモリを使用する。
敵は、エージェントのメモリに一見無害なレコードを注入して、その将来の振る舞いを操作できる。
A-MemGuard は LLM エージェントメモリのための最初のプロアクティブな防御フレームワークである。
論文 参考訳(メタデータ) (2025-09-29T16:04:15Z) - SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.182291416527764]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。
また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。
結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文 参考訳(メタデータ) (2025-09-11T14:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。