論文の概要: Context Distillation as Latent Memory Management
- arxiv url: http://arxiv.org/abs/2605.28889v1
- Date: Wed, 27 May 2026 07:29:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.030136
- Title: Context Distillation as Latent Memory Management
- Title(参考訳): 潜在記憶管理としてのコンテキスト蒸留
- Authors: Ziyang Zheng, Zeju Li, Xiangyu Wen, Jianyuan Zhong, Junhua Huang, Lei Chen, Mingxuan Yuan, Qiang Xu,
- Abstract要約: 我々は,文脈蒸留を潜在記憶管理問題として定式化する。
各コンテキストを独立したLoRAアダプタに蒸留し,モジュール型メモリバンクを形成する。
クエリが与えられた場合、我々のフレームワークは候補メモリを検索し、クエリを最も適切なアダプタにルーティングし、Self-Gatingメカニズムを使用して潜在メモリをアクティベートするかどうかを決定する。
- 参考スコア(独自算出の注目度): 29.691992295989223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context distillation compresses contextual information into model parameters, yet existing methods often ignore how multiple distilled latent memories should be stored, retrieved, and safely activated in non-oracle settings. We formulate context distillation as a latent memory management problem. We distill each context into an independent LoRA adapter, forming a modular memory bank that enables explicit memory selection. Given a query, our framework retrieves candidate memories, routes the query to the most suitable adapter, and uses a Self-Gating mechanism to decide whether latent memory should be activated. To improve efficiency, we further introduce cache sharing to reduce management overhead during inference. Experiments show that our method substantially outperforms baselines with retrieval, while Self-Gating improves robustness by deactivate unnecessary latent memories.
- Abstract(参考訳): コンテキスト蒸留はコンテキスト情報をモデルパラメータに圧縮するが、既存の方法では、複数の蒸留された潜在記憶を格納し、検索し、非オークル設定で安全に活性化する方法を無視することが多い。
我々は,文脈蒸留を潜在記憶管理問題として定式化する。
それぞれのコンテキストを独立したLoRAアダプタに蒸留し、明示的なメモリ選択を可能にするモジュール型メモリバンクを形成する。
クエリが与えられた場合、我々のフレームワークは候補メモリを検索し、クエリを最も適切なアダプタにルーティングし、Self-Gatingメカニズムを使用して潜在メモリをアクティベートするかどうかを決定する。
効率を向上させるため、キャッシュ共有を導入し、推論時の管理オーバーヘッドを低減する。
実験の結果,本手法は検索によりベースラインを大幅に上回るが,セルフゲーティングは不必要な潜時記憶を不活性化することにより堅牢性を向上させることがわかった。
関連論文リスト
- MemCog: From Memory-as-Tool to Memory-as-Cognition in Conversational Agents [16.587587215932526]
本稿では,メモリアクセスを推論プロセスの不可欠な部分とするメモリ・アズ・認知システムを提案する。
MemCogはユーザ知識をNavigable Memory Storeとしてアソシエーションリンクグラフで整理する。
また,プロアクティブメモリトリガ評価のための最初のベンチマークであるProactiveMemBenchを構築した。
論文 参考訳(メタデータ) (2026-05-27T06:48:33Z) - MemGuard: Preventing Memory Contamination in Long-Term Memory-Augmented Large Language Models [56.31411457917676]
本稿では,メモリ構築と検索において,機能的メモリ境界を保存するタイプアウェアメモリフレームワークであるMemGuardを紹介する。
幻覚と長期会話のベンチマーク全体で、MemGuardはメモリの信頼性を最大28.27%向上し、メモリトークンは以前の方法より5.8倍少ない。
論文 参考訳(メタデータ) (2026-05-27T06:04:19Z) - EM-Vid: Training-Free Entity-Centric Memory for Efficient and Consistent Multi-Shot Video Generation [18.052867824594347]
マルチショットビデオ生成には、ショット間で連続的なエンティティの出現を維持する必要がある。
最近の自己回帰手法は、以前生成されたフレームをメモリとして再利用する。
我々は、潜伏パッチのエンティティインデックスバンクという形でエンティティ中心のメモリを提案する。
論文 参考訳(メタデータ) (2026-05-22T13:20:29Z) - Causal Intervention-Based Memory Selection for Long-Horizon LLM Agents [0.33842793760651557]
制御された介入の下で,候補記憶がモデル応答に与える影響を推定する因果記憶選択手法を提案する。
以上の結果から,CMIは,信頼性の高い長期記憶には関連性のみではなく,因果的有用性に基づくコンテキスト選択が必要であることが示唆された。
論文 参考訳(メタデータ) (2026-05-17T20:21:55Z) - RecMem: Recurrence-based Memory Consolidation for Efficient and Effective Long-Running LLM Agents [16.625864201773343]
RecMemは、受信するインタラクションをサブ意識のメモリ層に格納し、軽量な埋め込みモデルを使用してエンコードする。
実験により、RecMemは3つのSOTAメモリシステムのメモリ構築トークンコストを最大87%削減し、精度を上回ります。
論文 参考訳(メタデータ) (2026-05-15T15:17:36Z) - MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution [52.29303869050117]
メモリ拡張LDMエージェントは、長期の相互作用をサポートするために外部メモリバンクを保持する。
MemMAはプラグアンドプレイのマルチエージェントフレームワークで、前方と後方の両方の経路に沿ってメモリサイクルを調整する。
論文 参考訳(メタデータ) (2026-03-19T10:15:59Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - Beyond Dialogue Time: Temporal Semantic Memory for Personalized LLM Agents [68.84161689205779]
テンポラルセマンティックメモリ(TSM)は、ポイントワイドメモリのセマンティックタイムをモデル化するメモリフレームワークである。
TSMは既存の手法を一貫して上回り、最大12.2%の精度向上を実現している。
論文 参考訳(メタデータ) (2026-01-12T12:24:44Z) - Evaluating Long-Term Memory for Long-Context Question Answering [100.1267054069757]
質問応答タスクにアノテートした合成長文対話のベンチマークであるLoCoMoを用いて,メモリ拡張手法の体系的評価を行う。
以上の結果から,メモリ拡張アプローチによりトークン使用率が90%以上削減され,競争精度が向上した。
論文 参考訳(メタデータ) (2025-10-27T18:03:50Z) - Multiple Memory Systems for Enhancing the Long-term Memory of Agent [9.43633399280987]
MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。
我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文 参考訳(メタデータ) (2025-08-21T06:29:42Z) - Memory-Based Semantic Parsing [79.48882899104997]
文脈依存型セマンティック解析のためのメモリベースモデルを提案する。
逐次的ユーザ発話の累積的意味を維持することにより,メモリ管理を行うコンテキストメモリコントローラを学習する。
論文 参考訳(メタデータ) (2021-09-07T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。