論文の概要: CALMem : Application-Layer Dual Memory for Conversational AI
- arxiv url: http://arxiv.org/abs/2605.20724v1
- Date: Wed, 20 May 2026 05:23:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.49006
- Title: CALMem : Application-Layer Dual Memory for Conversational AI
- Title(参考訳): 対話型AIのためのアプリケーション層デュアルメモリCALMem
- Authors: Rajendra Narayan Jena, Rajan Padmanabhan, Sankar Arumugam,
- Abstract要約: CALMemはアプリケーション層二重メモリアーキテクチャであり、基礎となるモデルを変更することなく、会話アシスタントに事実上効果的なコンテキストを提供する。
MOIMと呼ばれるトークン・バジェット・アダプティブ・インジェクション(トークン・バジェット・アダプティブ・インジェクション)機構は、各ターンごとに関連する過去のコンテキストを自動的に取り出し注入する。
アーキテクチャ、設計決定、パフォーマンス特性を説明し、それぞれの実装選択を導くトレードオフを分析します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) operate within fixed context windows that fundamentally limit conversational continuity. When context fills, compaction discards history irreversibly; when sessions end, all memory resets to zero. Existing solutions-larger context windows, retrieval-augmented generation for knowledge bases, and memory-augmented architectures such as MemGPT-either require model modification, impose provider lock-in, or do not address the compaction continuity problem. We present CALMem (Conversational Application-Layer Memory), an application-layer dual memory architecture that gives LLM-based conversational assistants virtually unbounded effective context without any modification to the underlying model. CALMem combines two complementary memory subsystems: an episodic memory layer built on sliding-window vector embeddings of conversation history, and a semantic memory layer of agent-writable structured facts. A token-budget-adaptive injection mechanism, called the MOIM (Message of Injected Memory), automatically retrieves and injects relevant past context each turn, scaling injection depth inversely with context pressure. A key contribution is intra-session retrieval: compacted away turns from the current session remain searchable, closing a gap unaddressed by prior work. The system is implemented as a pure application layer in a production Rust codebase, is provider-agnostic, and degrades to original LLM behaviour with zero overhead when disabled. We describe the architecture, design decisions, and performance characteristics, and analyse the trade-offs that guided each implementation choice.
- Abstract(参考訳): 大きな言語モデル(LLM)は、会話の連続性を根本的に制限する固定されたコンテキストウィンドウ内で動作する。
コンテキストが満たされると、圧縮は履歴を不可逆的に破棄する。セッションが終了すると、すべてのメモリはゼロにリセットされる。
既存のソリューション拡張コンテキストウィンドウ、知識ベースのための検索拡張生成、MemGPTのようなメモリ拡張アーキテクチャは、モデル修正、プロバイダロックインの強制、圧縮継続性の問題に対処しない。
本稿では,LCMをベースとした対話型メモリアーキテクチャであるCALMem(Conversational Application-Layer Memory)を提案する。
CALMemは、会話履歴のスライディングウィンドウベクトル埋め込み上に構築されたエピソードメモリ層と、エージェント記述可能な構造化事実のセマンティックメモリ層という2つの補完メモリサブシステムを組み合わせたものである。
MOIM(Message of Injected Memory)と呼ばれるトークン・バジェット・アダプティブ・インジェクション(トークン・バジェット・アダプティブ・インジェクション)機構は、各ターンごとに関連する過去のコンテキストを自動的に検索して注入し、インジェクション深度をコンテキスト圧力で逆方向にスケーリングする。
セッション内検索は重要な貢献である: 圧縮された切り離しが現在のセッションから探索可能のままであり、以前の作業で守られていないギャップを閉じる。
システムは本番のRustコードベースで純粋なアプリケーション層として実装され、プロバイダに依存しないため、無効化時にオーバーヘッドをゼロにして、元のLLM動作に分解される。
アーキテクチャ、設計決定、パフォーマンス特性を説明し、それぞれの実装選択を導くトレードオフを分析します。
関連論文リスト
- MemGym: a Long-Horizon Memory Environment for LLM Agents [69.79226770543049]
本稿では,エージェントメモリのベンチマークであるMemGymを紹介する。
MemGymは、メモリパフォーマンスを推論、検索、ツール使用能力から切り離すメモリアイソレーションスコアを報告している。
MEMGYM-CODEQAとMEMGYM-DRの合成パイプラインは、長さ制御可能であり、各ステージでアブレーションを検証可能であり、下流のシナリオと密に整合している。
論文 参考訳(メタデータ) (2026-05-20T07:25:33Z) - Rethinking How to Remember: Beyond Atomic Facts in Lifelong LLM Agent Memory [88.81430082035617]
LLMエージェントは、蓄積された対話履歴を忠実に保存し、効率的に検索し、深く推論できるメモリシステムを必要とする。
本稿では,ソース識別子に固定された生の対話セグメントを含む3つの共存表現の粒度を格納するTriMemを提案する。
論文 参考訳(メタデータ) (2026-05-19T15:05:06Z) - Cognis: Context-Aware Memory for Conversational AI Agents [0.0]
LLMエージェントは永続的なメモリを欠き、セッション毎に会話がリセットされ、時間とともにパーソナライズされるのを防ぐ。
我々は会話型AIエージェントのための統一メモリアーキテクチャであるLyzr Cognisを紹介する。
システムはオープンソースで、対話型AIアプリケーションを提供する本番環境にデプロイされる。
論文 参考訳(メタデータ) (2026-03-27T10:15:30Z) - Memori: A Persistent Memory Layer for Efficient, Context-Aware LLM Agents [0.0]
既存のアプローチはベンダーをロックインさせ、大量の生会話をプロンプトに注入することに頼っている。
本稿では,メモリをデータ構造問題として扱うLCM非依存の永続メモリ層であるMemoriを紹介する。
論文 参考訳(メタデータ) (2026-03-20T13:26:38Z) - Contextual Memory Virtualisation: DAG-Based State Management and Structurally Lossless Trimming for LLM Agents [0.0]
我々は,蓄積したLLM理解をバージョン管理状態として扱うシステムであるコンテキスト記憶仮想化(CMV)を提案する。
CMVはセッション履歴を、正式に定義されたスナップショット、ブランチ、トリムプリミティブを備えたDAG(Directed Acyclic Graph)としてモデル化する。
シングルユーザによるケーススタディ評価では、トリミングが迅速なキャッシュの下で経済的に有効であることが示されている。
論文 参考訳(メタデータ) (2026-02-25T20:52:52Z) - Memoria: A Scalable Agentic Memory Framework for Personalized Conversational AI [0.6840655769002751]
エージェントメモリは大規模言語モデル(LLM)のキーイネーブラーとして登場しつつある
我々は,LLMベースの会話システムを永続的,解釈可能,コンテキストに富んだメモリで拡張するモジュール型メモリフレームワークであるMemoriaを紹介する。
我々は、ステートレスLLMインタフェースとエージェントメモリシステムとのギャップを埋めることで、Memoriaがスケーラブルでパーソナライズされた対話型人工知能(AI)を実現する方法を実証する。
論文 参考訳(メタデータ) (2025-12-14T13:38:06Z) - MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z) - Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory [0.5584627289325719]
大規模言語モデル(LLM)は、文脈的に一貫性のある応答を生成する際、顕著な進歩を示した。
しかし、それらの固定されたコンテキストウィンドウは、長時間のマルチセッション対話に対する一貫性を維持するための根本的な課題を生じさせる。
私たちはMem0というスケーラブルなメモリ中心アーキテクチャを導入し、進行中の会話から健全な情報を動的に抽出し、統合し、取得することでこの問題に対処します。
論文 参考訳(メタデータ) (2025-04-28T01:46:35Z) - L2MAC: Large Language Model Automatic Computer for Extensive Code Generation [52.81694565226513]
トランスフォーマーベースの大規模言語モデル(LLM)は、基盤となるトランスフォーマーアーキテクチャの固定コンテキストウィンドウによって制約される。
本稿では,L2MACを提案する。L2MACは,LLMをベースとした汎用型自動計算機(von Neumann Architecture)フレームワークで,長期的かつ一貫した出力生成を実現する。
論文 参考訳(メタデータ) (2023-10-02T16:55:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。