論文の概要: VikingMem: A Memory Base Management System for Stateful LLM-based Applications
- arxiv url: http://arxiv.org/abs/2605.29640v1
- Date: Thu, 28 May 2026 09:07:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 05:02:24.566428
- Title: VikingMem: A Memory Base Management System for Stateful LLM-based Applications
- Title(参考訳): VikingMem:ステートフルLLMベースのアプリケーションのためのメモリベース管理システム
- Authors: Jiajie Fu, Junwen Chen, Mengzhao Wang, Aoxiang He, Maojia Sheng, Xiangyu Ke, Yifan Zhu, Yunjun Gao,
- Abstract要約: 本稿では,長期的相互作用の持続状態を管理するための新しいデータ管理パラダイムであるMemory Baseを紹介する。
本稿では,VikingDBベクタエンジン上に実装されたエンドツーエンドメモリベース管理システムであるVikingMemを紹介する。
- 参考スコア(独自算出の注目度): 22.527701567108195
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large Language Models have revolutionized interactive applications; however, their finite context windows pose a critical data management challenge for maintaining stateful, long-term interactions. Existing memory approaches often rely on simplistic extraction methods that lead to incomplete memories or use rigid, single-purpose memory extraction prompts tailored to a single use case, such as chatbots. Consequently, they lack generalizability and perform poorly across diverse downstream tasks. To bridge this gap, we introduce the Memory Base, a novel data management paradigm for managing the persistent state of long-term interactions. It is characterized by three core principles: selective extraction of high-value memories from raw information streams; inherent statefulness and evolution, where memory content is progressively summarized, corrected, and temporally weighted to prioritize recent interactions; and a generalizable abstraction paradigm designed for robust transferability across diverse applications, including education, recommendation, and agent memory. Building on this foundation, we present VikingMem, an end-to-end Memory Base Management System implemented on the VikingDB vector engine. VikingMem materializes this paradigm through interconnected event and entity abstractions. It features event-centric memory extraction to selectively handle complex information streams, while entities are dynamically updated by events to achieve stateful evolution. Using temporal compression via a topic-wise timeline and time-weighted recall, the system progressively produces high-level summary memories, prioritizes recent items, and compresses and fades older ones. Extensive evaluations on long-term memory benchmarks demonstrate that VikingMem outperformes baselines by up to 30% in memory retrieval effectiveness while maintaining the low latency essential for interactive applications.
- Abstract(参考訳): 大規模言語モデルは、インタラクティブなアプリケーションに革命をもたらしたが、その有限コンテキストウィンドウは、ステートフルで長期的な相互作用を維持する上で重要なデータ管理課題をもたらす。
既存のメモリアプローチでは、不完全なメモリにつながる単純な抽出方法や、チャットボットのような単一のユースケースに合わせた厳格な単一目的メモリ抽出プロンプトを使用する場合が多い。
その結果、一般化性が欠如し、下流の様々なタスクで性能が良くない。
このギャップを埋めるために、長期的相互作用の永続状態を管理するための新しいデータ管理パラダイムであるMemory Baseを紹介します。
生の情報ストリームから高価値メモリを選択的に抽出すること、メモリの内容が徐々に要約され、修正され、時間的に重み付けされる固有のステートフルネスと進化、そして教育、推薦、エージェントメモリを含む多様なアプリケーション間で堅牢な転送性のために設計された一般化可能な抽象化パラダイムである。
この基盤の上に構築されたVikingMemは、VikingDBベクタエンジン上に実装されたエンドツーエンドのメモリベース管理システムである。
VikingMemはイベントとエンティティの抽象化を相互接続することで、このパラダイムを実現する。
イベント中心のメモリ抽出によって複雑な情報ストリームを選択的に処理し、エンティティはイベントによって動的に更新され、ステートフルな進化を達成する。
トピックワイズタイムラインと時間重み付けリコールによる時間的圧縮を用いて、システムは徐々にハイレベルな要約記憶を生成し、最近の項目を優先順位付けし、古い項目を圧縮およびフェードアウトする。
長期メモリベンチマークの大規模な評価によると、VikingMemは、インタラクティブなアプリケーションに不可欠な低レイテンシを維持しながら、メモリ検索効率を最大30%向上させる。
関連論文リスト
- Hierarchical Memory Orchestration for Personalized Persistent Agents [22.711300383282268]
ユーザ中心のコンテキスト関連性によって駆動される3階層のディレクトリにインタラクション履歴を整理するフレームワークである階層記憶オーケストレーション(HMO)を提案する。
エージェント推論が個々の行動特性と一致し続けることを保証するため,本システムはコンパクトなプライマリキャッシュを維持し,最近のメモリとピボットメモリと,進化するユーザプロファイルを結合する。
論文 参考訳(メタデータ) (2026-04-02T06:16:53Z) - Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity [26.512226057571947]
Memoraは、抽象性と特異性の構造的バランスをとるハーモニックメモリ表現である。
本稿では,LoCoMoベンチマークとLongMemEvalベンチマークでMemoraが新たな最先端性を確立し,メモリスケールとしての検索妥当性と推論の有効性を示す。
論文 参考訳(メタデータ) (2026-02-03T09:44:43Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - Mem-Gallery: Benchmarking Multimodal Long-Term Conversational Memory for MLLM Agents [76.76004970226485]
長期記憶はマルチモーダル大言語モデル(MLLM)エージェントにとって重要な機能である。
Mem-GalleryはMLLMエージェントのマルチモーダル長期会話メモリ評価のための新しいベンチマークである。
論文 参考訳(メタデータ) (2026-01-07T02:03:13Z) - Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文 参考訳(メタデータ) (2026-01-05T08:24:16Z) - Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory [89.65731902036669]
Evo-Memoryは、大規模言語モデル(LLM)エージェントで自己進化型メモリを評価するための、ストリーミングベンチマークとフレームワークである。
10以上の代表的なメモリモジュールを評価し、10種類の多ターンゴール指向およびシングルターン推論およびQAデータセットで評価した。
論文 参考訳(メタデータ) (2025-11-25T21:08:07Z) - SEDM: Scalable Self-Evolving Distributed Memory for Agents [23.182291416527764]
SEDMは、メモリをパッシブリポジトリからアクティブな自己最適化コンポーネントに変換する検証可能で適応的なフレームワークである。
また,SEDMは,強いメモリベースラインに比べてトークンオーバーヘッドを低減しつつ,推論精度を向上することを示した。
結果は、SEDMをオープンエンドのマルチエージェントコラボレーションのためのスケーラブルで持続可能なメモリメカニズムとして強調する。
論文 参考訳(メタデータ) (2025-09-11T14:37:37Z) - MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。