論文の概要: Belief Memory: Agent Memory Under Partial Observability
- arxiv url: http://arxiv.org/abs/2605.05583v1
- Date: Thu, 07 May 2026 02:03:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.483222
- Title: Belief Memory: Agent Memory Under Partial Observability
- Title(参考訳): 信念記憶:部分的可観測性下でのエージェント記憶
- Authors: Junfeng Liao, Qizhou Wang, Jianing Zhu, Bo Du, Rui Yan, Xiuying Chen,
- Abstract要約: 本稿では,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
BeliefMemは決定論的パラダイムが破棄されるという不確実性を保ち、エージェントが高い信頼を持って行動することを可能にする。
LoCoMoとALFWorldベンチマークの実証的な評価は、限られたデータであっても、BeliefMemが最高の平均パフォーマンスを達成することを示している。
- 参考スコア(独自算出の注目度): 56.41506249481312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents that operate over long context depend on external memory to accumulate knowledge over time. However, existing methods typically store each observation as a single deterministic conclusion (e.g., inferring "API~X failed" from temporary errors), even though such observations are inherently partial and potentially ambiguous. By committing to one conclusion and discarding uncertainty, these methods introduce self-reinforcing error: the agent acts on the stored conclusion, never revisits alternatives, and reinforces the conclusion over time. To address this issue, we propose BeliefMem, which shifts the memory paradigm from committing to a single conclusion per observation to retaining multiple candidate conclusions with their probabilities. Concretely, BeliefMem stores the candidate conclusions as separate memory entries, each carrying a probability that is updated via Noisy-OR rules as new observations arrive. At retrieval, all candidates surface together with their probabilities, keeping alternatives visible to the agent. Since each conclusion in memory retains its probability, BeliefMem preserves the uncertainty that the deterministic paradigm discards, enabling the agent to act with high confidence on well-evidenced knowledge while retaining the capacity to update its confidence when new evidence arrives. Empirical evaluations on LoCoMo and ALFWorld benchmarks show that, even with limited data, BeliefMem achieves the best average performance, remarkably outperforming well-known baselines. More broadly, such probabilistic memory produces substantial gains and explores a new direction for agent memory in partially observable environments.
- Abstract(参考訳): 長期にわたって動作するLLMエージェントは、時間とともに知識を蓄積するために外部メモリに依存する。
しかし、既存の手法では、それぞれの観測を単一の決定論的結論(例えば、一時的なエラーから"API~Xの失敗"を推測する)として保存するが、そのような観測は本質的に部分的であり、潜在的に曖昧である。
エージェントは格納された結論に作用し、代替案を再検討せず、時間の経過とともに結論を補強する。
この問題に対処するため,メモリパラダイムを観測毎に1つの結論にシフトし,その確率で複数の結論を導出するBeliefMemを提案する。
具体的には、BeliefMemは、候補の結論を別々のメモリエントリとして格納する。
検索の際には、すべての候補が確率とともに表面化し、代替案がエージェントに見えるように保たれる。
記憶における各結論はその確率を保っているので、BeliefMemは決定論的パラダイムが放棄されるという不確実性を保ち、エージェントは適切な知識に高い信頼を持って行動し、新たな証拠が到着した時にその信頼を更新する能力を保持することができる。
LoCoMoとALFWorldベンチマークの実証的な評価によると、限られたデータであっても、BeliefMemは最高の平均パフォーマンスを達成し、よく知られたベースラインを著しく上回っている。
より広範に、そのような確率的メモリは実質的なゲインをもたらし、部分的に観測可能な環境でエージェントメモリの新しい方向を探る。
関連論文リスト
- STALE: Can LLM Agents Know When Their Memories Are No Longer Valid? [5.361950931863979]
大規模言語モデル(LLM)エージェントは、コヒーレントで長期的なパーソナライズされたメモリを維持することがますます期待されている。
現在のベンチマークは、主に静的な事実検索を計測し、新しい証拠が現れたときに保存された信念を更新する能力を見下ろしている。
専門家が検証した400の競合シナリオのベンチマークであるSTALEを紹介します。
CUPMemは,構造化状態統合と伝搬認識探索による書き込み時間リビジョンを強化するプロトタイプである。
論文 参考訳(メタデータ) (2026-05-07T16:31:15Z) - MemEvoBench: Benchmarking Memory MisEvolution in LLM Agents [78.95081012334116]
永続メモリを持つ大規模言語モデル(LLM)は、相互作用の継続性とパーソナライゼーションを高めるが、新たな安全性リスクをもたらす。
汚染または偏りのある記憶蓄積は、異常な作用を引き起こす可能性がある。
MemeEvoBenchは、LLMエージェントのメモリ安全性を評価する最初のベンチマークである。
論文 参考訳(メタデータ) (2026-04-17T07:29:52Z) - The Model Agreed, But Didn't Learn: Diagnosing Surface Compliance in Large Language Models [12.743453676247903]
大規模言語モデル(LLM)は、膨大な世界の知識をパラメトリックメモリとして内部化するが、必然的にソースコーパスの不安定さと誤りを継承する。
知識編集は、再トレーニングせずに記憶を外科的に修正するための重要なパラダイムを提供する。
本研究では,文脈内学習環境下での識別的自己評価をモデルとした診断フレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-07T15:20:41Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - Rethinking Memory Mechanisms of Foundation Agents in the Second Half: A Survey [211.01908189012184]
今年、何百もの論文が公開されたメモリは、ユーティリティギャップを埋めるための重要なソリューションとして現れます。
ファンデーションエージェントのメモリを3次元に統一したビューを提供する。
次に、異なるエージェントトポロジの下でメモリがどのようにインスタンス化され、操作されるかを分析する。
論文 参考訳(メタデータ) (2026-01-14T07:38:38Z) - Illusions of Confidence? Diagnosing LLM Truthfulness via Neighborhood Consistency [78.91846841708586]
完全な自己整合性で答えられた事実でさえ、軽微な文脈干渉の下で急速に崩壊することを示します。
本研究では,概念的近傍における応答コヒーレンスを評価する信念の構造尺度であるNighbor-Consistency Belief(NCB)を提案する。
また、文脈不変の信念構造を最適化し、長い知識の脆さを約30%低減する構造意識訓練(SAT)を提案する。
論文 参考訳(メタデータ) (2026-01-09T16:23:21Z) - Finite Memory Belief Approximation for Optimal Control in Partially Observable Markov Decision Processes [1.614301262383079]
部分観測可能(PO)最適制御(SOC)問題に対する有限メモリ信念近似について検討した。
我々は,情報損失を制御性能に直接関連付ける計量に基づく理論を開発した。
論文 参考訳(メタデータ) (2026-01-06T16:05:20Z) - Forgetting as a Feature: Cognitive Alignment of Large Language Models [39.146761527401424]
本研究では,Large Language Models (LLM) が過去の情報を体系的に忘れていることを示す。
人間の記憶力学からインスピレーションを得て,LLM推論を指数的崩壊によって支配される確率的記憶過程としてモデル化する。
これらの観測に基づいて,人間のような記憶崩壊を模倣するエビデンス統合を形作る軽量な戦略である確率的記憶促進法を提案する。
論文 参考訳(メタデータ) (2025-12-28T10:43:00Z) - Beyond Heuristics: A Decision-Theoretic Framework for Agent Memory Management [49.71055327567513]
メモリ管理は、不確実性の下でのシーケンシャルな意思決定問題と見なされるべきである。
私たちの貢献は、新しいアルゴリズムではなく、アプローチの限界を明確にする原則的なリフレーミングです。
論文 参考訳(メタデータ) (2025-12-25T08:23:03Z) - The Influence of Memory in Multi-Agent Consensus [0.8399688944263843]
我々は、emphmemoryコンセンサスプロトコルと呼ばれるものを研究するためのフレームワークを提案する。
メモリの利用により、そのようなプロセスは常に収束し、サイクルのようないくつかのシナリオではより早く収束することが示される。
エージェントが表現した最初の意見に基づいて、各オプションが最終的にそのようなプロセスに勝つ確率を理論的に分析する。
論文 参考訳(メタデータ) (2021-05-10T20:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。