論文の概要: Drawing on Memory: Dual-Trace Encoding Improves Cross-Session Recall in LLM Agents
- arxiv url: http://arxiv.org/abs/2604.12948v1
- Date: Tue, 14 Apr 2026 16:45:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.567717
- Title: Drawing on Memory: Dual-Trace Encoding Improves Cross-Session Recall in LLM Agents
- Title(参考訳): メモリ上の描画: デュアルトレースエンコーディングによるLDMエージェントのクロスセッションリコールの改善
- Authors: Benjamin Stern, Peter Nadel,
- Abstract要約: メモリ保存情報をフラットな事実記録として保持するLLMエージェントは、時間的推論、変更追跡、セッション間集約のコンテキストをほとんど提供しない。
描画効果に触発されて、デュアルトレースメモリの符号化を導入する。
この方法では、各記憶された事実を具体的シーントレースと組み合わせ、情報を学習した瞬間と状況の物語再構成を行う。
- 参考スコア(独自算出の注目度): 0.22917707112773592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: LLM agents with persistent memory store information as flat factual records, providing little context for temporal reasoning, change tracking, or cross-session aggregation. Inspired by the drawing effect [3], we introduce dual-trace memory encoding. In this method, each stored fact is paired with a concrete scene trace, a narrative reconstruction of the moment and context in which the information was learned. The agent is forced to commit to specific contextual details during encoding, creating richer, more distinctive memory traces. Using the LongMemEval-S benchmark (4,575 sessions, 100 recall questions), we compare dual-trace encoding against a fact-only control with matched coverage and format over 99 shared questions. Dual-trace achieves 73.7% overall accuracy versus 53.5%, a +20.2 percentage point (pp) gain (95% CI: [+12.1, +29.3], bootstrap p < 0.0001). Gains concentrate in temporal reasoning (+40pp), knowledge-update tracking (+25pp), and multi-session aggregation (+30pp), with no benefit for single-session retrieval, consistent with encoding specificity theory [8]. Token analysis shows dual-trace encoding achieves this gain at no additional cost. We additionally sketch an architectural design for adapting dual-trace encoding to coding agents, with preliminary pilot validation.
- Abstract(参考訳): LLMエージェントは、永続記憶情報をフラットな事実記録として保存し、時間的推論、変更追跡、セッション間集約のコンテキストをほとんど提供しない。
描画効果[3]にインスパイアされ、デュアルトレースメモリ符号化を導入する。
この方法では、各記憶された事実を具体的シーントレースと組み合わせ、情報を学習した瞬間と状況の物語再構成を行う。
エージェントはエンコーディング中に特定のコンテキストの詳細をコミットし、よりリッチで、より独特なメモリトレースを生成する。
LongMemEval-Sベンチマーク(4,575のセッション、100のリコール質問)を用いて、ファクトのみの符号化と99以上の共有質問に対して一致したカバレッジとフォーマットを比較した。
総合精度は73.7%、53.5%、+20.2ポイント(pp)ゲイン(95%CI: [+12.1, +29.3]、ブートストラップp < 0.0001)である。
利得は時間的推論(+40pp)、知識更新追跡(+25pp)、多セッション集約(+30pp)に焦点をあてる。
トークン解析により、二重トレース符号化が追加コストなしでこのゲインを達成することを示す。
また、符号化エージェントにデュアルトレース符号化を適用するためのアーキテクチャ設計を、予備的なパイロット検証でスケッチする。
関連論文リスト
- DMax: Aggressive Parallel Decoding for dLLMs [77.24184219948337]
効率的な拡散言語モデル(dLLM)のための新しいパラダイムであるDMaxを提案する。
並列デコードにおけるエラーの蓄積を軽減し、生成品質を維持しながらアグレッシブデコードを可能にする。
当社のアプローチの核心は、マスクと均一なdLLMを効率的に統合する新しいトレーニング戦略であるOn-Policy Uniform Trainingである。
論文 参考訳(メタデータ) (2026-04-09T14:35:42Z) - Breaking the KV Cache Bottleneck: Fan Duality Model Achieves O(1) Decode Memory with Superior Associative Recall [0.0]
Fan Duality Modelは、シーケンスモデリングにおけるメモリ効率と連想リコールの間の緊張を解消する。
FDMはシーケンス処理を、長距離パターンを隠蔽状態に圧縮する波動成分と、特定のトークンを取得する粒子成分の2つのコンポーネントに分割する。
本稿では,再帰的なスキャンを凍結し,キャッシュを埋め込みと共に最適化する2段階のトレーニング戦略であるFreeze-Scanを提案する。
論文 参考訳(メタデータ) (2026-04-09T02:00:30Z) - MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents [2.541923091180284]
大規模言語モデル(LLM)エージェントはパーソナライゼーション、事実連続性、長期的推論を維持するために永続記憶を必要とする。
本稿では,短期,長期,プロファイルメモリを統合したオープンソースのメモリシステムであるMemMachineを紹介する。
MemMachineは、コンテキスト化された検索を使用して、周囲のコンテキストにマッチする核を拡大し、関連するエビデンスが複数の対話にまたがる場合のリコールを改善する。
論文 参考訳(メタデータ) (2026-04-06T16:57:06Z) - APEX-EM: Non-Parametric Online Learning for Autonomous Agents via Structured Procedural-Episodic Experience Replay [7.370176470430802]
LLMベースの自律エージェントは、永続的な手続き記憶を欠いている。
我々は,構造化手続き計画の蓄積,検索,再利用を行う非パラメトリックオンライン学習フレームワークであるAPEX-EMを提案する。
論文 参考訳(メタデータ) (2026-03-31T00:24:56Z) - Going Down Memory Lane: Scaling Tokens for Video Stream Understanding with Dynamic KV-Cache Memory [50.30283773196725]
既存のアプローチは、時間とともにフレームレベルの詳細を蓄積するためにキーバリューキャッシングに依存していますが、フレーム毎に限られた数のトークンを使用します。
より詳細な時間的理解と推論を可能にするためにトークン予算のスケーリングを提案する。
論文 参考訳(メタデータ) (2026-02-20T18:59:50Z) - Training Large Reasoning Models Efficiently via Progressive Thought Encoding [63.254758972725654]
大規模推論モデル(LRM)は複雑な問題に優れるが、効率にとって重要な障壁に直面している。
本稿では,パラメータ効率のよい微調整手法であるProgressive Thoughtを紹介する。
論文 参考訳(メタデータ) (2026-02-18T20:03:38Z) - Dual Latent Memory for Visual Multi-agent System [69.29799381195592]
Visual Multi-Agent Systems (VMAS)は、エージェント間のコラボレーションを通じて包括的な能力を強化することを約束する。
増量剤は、指数関数的にトークンコストを膨らませながら、しばしば性能を低下させる。
L$2$-VMASは,2つの潜在記憶を用いたエージェント間コラボレーションを実現する新しいモデルに依存しないフレームワークである。
論文 参考訳(メタデータ) (2026-01-31T02:49:10Z) - CIMemories: A Compositional Benchmark for Contextual Integrity of Persistent Memory in LLMs [62.116710797795314]
大規模言語モデル(LLM)は、パーソナライゼーションとタスクパフォーマンスを向上させるために、過去のインタラクションから永続的なメモリを使用することが多い。
タスクコンテキストに基づいて,LLMがメモリからの情報フローを適切に制御するかどうかを評価するベンチマークであるCIMemoriesを提案する。
論文 参考訳(メタデータ) (2025-11-18T21:51:23Z) - dParallel: Learnable Parallel Decoding for dLLMs [77.24184219948337]
拡散大言語モデル(dLLM)は並列トークン予測と低推論遅延を提供する。
既存のオープンソースモデルは、パフォーマンスを確保するためにトークン長のデコードステップをほとんど必要としています。
高速サンプリングのためにdLLMs固有の並列性を解き放つシンプルで効果的な方法であるdParallelを導入する。
論文 参考訳(メタデータ) (2025-09-30T16:32:52Z) - When Speculation Spills Secrets: Side Channels via Speculative Decoding In LLMs [2.305309289946973]
そこで本研究では,不正な推測と正しい推測の入力依存パターンを,フィルタ単位のトークン数やパケットサイズをモニタすることによって推定できる,新たなサイドチャネルを明らかにする。
これらのパターンを観察する敵は、4つの投機的デコードスキームで90%の精度でユーザクエリをフィンガープリントすることができる。
パケットパディングや繰り返しトークンアグリゲーションなど,一連の軽減策を提案し,評価する。
論文 参考訳(メタデータ) (2024-11-01T23:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。