論文の概要: MemRouter: Memory-as-Embedding Routing for Long-Term Conversational Agents
- arxiv url: http://arxiv.org/abs/2605.00356v1
- Date: Fri, 01 May 2026 02:33:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.825842
- Title: MemRouter: Memory-as-Embedding Routing for Long-Term Conversational Agents
- Title(参考訳): MemRouter: 長期会話エージェントのためのメモリ・アズ・埋め込みルーティング
- Authors: Tianyu Hu, Weikai Lin, Weizhi Zhang, Jing Ma, Song Wang,
- Abstract要約: 我々は、下流の応答バックボーンからメモリの入力を分離する書き込み側メモリルータであるMemを紹介する。
Memは、12Mパラメータのみをトレーニングしながら、軽量な分類ヘッドを使用してターンを格納すべきかどうかを予測する。
- 参考スコア(独自算出の注目度): 20.000127976303606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-term conversational agents must decide which turns to store in external memory, yet recent systems rely on autoregressive LLM generation at every turn to make that decision. We present MemRouter, a write-side memory router that decouples memory admission from the downstream answer backbone and replaces per-turn memory-management decoding with an embedding-based routing policy. MemRouter encodes each turn together with recent context, projects the resulting embeddings through a frozen LLM backbone, and predicts whether the turn should be stored using lightweight classification heads while training only 12M parameters. Under a controlled matched-harness comparison on LoCoMo, where the retrieval pipeline, answer prompts, and QA backbone (Qwen2.5-7B) are held identical, MemRouter outperforms an LLM-based memory manager on every question category (overall F1 52.0 vs 45.6, non-overlapping 95% CIs) while reducing memory-management p50 latency from 970ms to 58ms. Descriptive factorial averaging further shows that learned admission improves mean F1 by +10.3 over random storage, category-specific prompting adds +5.2 over a generic prompt, and retrieval contributes +0.7. These results suggest that write-side memory admission can be learned by a small supervised router, while answer generation remains a separate downstream component in long-horizon conversational QA.
- Abstract(参考訳): 長期的な会話エージェントは、どのターンを外部メモリに格納するかを決定する必要があるが、最近のシステムは各ターンで自動回帰LDM生成に依存している。
本稿では,書き込み側のメモリルータであるMemRouterについて紹介する。このルータは,ダウンストリーム応答バックボーンからメモリ入力を分離し,ターン単位のメモリ管理デコーディングを埋め込みベースのルーティングポリシで置き換える。
MemRouterは、各ターンを最近のコンテキストと共にエンコードし、凍結したLCMバックボーンに埋め込みを投影し、12Mパラメータのみをトレーニングしながら、軽量な分類ヘッドを使用してターンを格納すべきかどうかを予測する。
検索パイプライン、応答プロンプト、QAバックボーン(Qwen2.5-7B)が同一であるLoCoMoの制御されたマッチハーネス比較では、MemRouterは全ての質問カテゴリ(F1 52.0対45.6、非オーバーラップ95%CI)においてLLMベースのメモリマネージャよりも優れ、メモリ管理のp50レイテンシを970msから58msに短縮する。
説明的因子平均化(Descriptive factorial averaging)はさらに、学習された入力はランダムストレージよりも平均F1を+10.3改善し、カテゴリ固有のプロンプトはジェネリックプロンプトに+5.2を加え、検索は+0.7に寄与することを示した。
これらの結果から,長期会話型QAにおいて,返信生成は別の下流成分として残っており,書き込み側メモリの入力は小さな教師付きルータで学習可能であることが示唆された。
関連論文リスト
- HiGMem: A Hierarchical and LLM-Guided Memory System for Long-Term Conversational Agents [9.454943641700392]
HiGMemは2段階のイベントターンメモリシステムで、イベントサマリーをセマンティックアンカーとして使用して、どのターンが読む価値があるかを予測している。
LoCoMo10ベンチマークでは、HiGMemは5つの質問カテゴリのうち4つで最高のF1を達成し、A-Memよりも逆F1を0.54から0.78に改善した。
論文 参考訳(メタデータ) (2026-04-20T14:44:12Z) - MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents [2.541923091180284]
大規模言語モデル(LLM)エージェントはパーソナライゼーション、事実連続性、長期的推論を維持するために永続記憶を必要とする。
本稿では,短期,長期,プロファイルメモリを統合したオープンソースのメモリシステムであるMemMachineを紹介する。
MemMachineは、コンテキスト化された検索を使用して、周囲のコンテキストにマッチする核を拡大し、関連するエビデンスが複数の対話にまたがる場合のリコールを改善する。
論文 参考訳(メタデータ) (2026-04-06T16:57:06Z) - MemMA: Coordinating the Memory Cycle through Multi-Agent Reasoning and In-Situ Self-Evolution [52.29303869050117]
メモリ拡張LDMエージェントは、長期の相互作用をサポートするために外部メモリバンクを保持する。
MemMAはプラグアンドプレイのマルチエージェントフレームワークで、前方と後方の両方の経路に沿ってメモリサイクルを調整する。
論文 参考訳(メタデータ) (2026-03-19T10:15:59Z) - MemR$^3$: Memory Retrieval via Reflective Reasoning for LLM Agents [29.652985606497882]
私たちは、自律的で正確で互換性のあるエージェントシステムとして、メモリ検索を構築します。
MemR$3$は、2つの中核的なメカニズムを持つ: 1) 解答品質を最適化するために検索、反映、回答のアクションを選択するルータ; 2) 解答プロセスを透過的に描画し、証拠収集プロセスを追跡するグローバルエビデンスギャップトラッカー。
論文 参考訳(メタデータ) (2025-12-23T10:49:42Z) - MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning [73.27233666920618]
本稿では,メモリを反復的に保持し,現在のターンと組み合わせたエージェントワークフローであるMemSearcherを提案する。
それぞれのターンで、MemSearcherはユーザーの質問をメモリに融合させ、推論トレースを生成し、検索アクションを実行し、メモリを更新してタスクの解決に必要な情報のみを保持する。
我々は,MemSearcher Agents の推論,検索戦略,メモリ管理を協調的に最適化する,エンドツーエンドの RL フレームワークである Multi-context GRPO を紹介する。
論文 参考訳(メタデータ) (2025-11-04T18:27:39Z) - Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning [89.55738101744657]
大規模言語モデル(LLM)は、幅広いNLPタスクで印象的な機能を示しているが、基本的にはステートレスである。
本稿では,LLMに外部メモリを積極的に管理・活用する機能を備えた強化学習フレームワークであるMemory-R1を提案する。
論文 参考訳(メタデータ) (2025-08-27T12:26:55Z) - RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.449129198822476]
RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文 参考訳(メタデータ) (2025-08-06T21:59:34Z) - RMM: Reinforced Memory Management for Class-Incremental Learning [102.20140790771265]
クラスインクリメンタルラーニング(CIL)は、厳格な記憶予算の下で分類器を訓練する。
既存のメソッドは静的およびアドホックな戦略を使ってメモリ割り当てを行うが、これはしばしば準最適である。
本稿では,段階的な段階と異なるオブジェクトクラスに最適化された動的メモリ管理戦略を提案する。
論文 参考訳(メタデータ) (2023-01-14T00:07:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。