論文の概要: HiGMem: A Hierarchical and LLM-Guided Memory System for Long-Term Conversational Agents
- arxiv url: http://arxiv.org/abs/2604.18349v2
- Date: Wed, 22 Apr 2026 15:05:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:10.435751
- Title: HiGMem: A Hierarchical and LLM-Guided Memory System for Long-Term Conversational Agents
- Title(参考訳): HiGMem:長期会話エージェントのための階層型かつLLM型メモリシステム
- Authors: Shuqi Cao, Jingyi He, Fei Tan,
- Abstract要約: HiGMemは2段階のイベントターンメモリシステムで、イベントサマリーをセマンティックアンカーとして使用して、どのターンが読む価値があるかを予測している。
LoCoMo10ベンチマークでは、HiGMemは5つの質問カテゴリのうち4つで最高のF1を達成し、A-Memよりも逆F1を0.54から0.78に改善した。
- 参考スコア(独自算出の注目度): 9.454943641700392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Long-term conversational large language model (LLM) agents require memory systems that can recover relevant evidence from historical interactions without overwhelming the answer stage with irrelevant context. However, existing memory systems, including hierarchical ones, still often rely solely on vector similarity for retrieval. It tends to produce bloated evidence sets: adding many superficially similar dialogue turns yields little additional recall, but lowers retrieval precision, increases answer-stage context cost, and makes retrieved memories harder to inspect and manage. To address this, we propose HiGMem (Hierarchical and LLM-Guided Memory System), a two-level event-turn memory system that allows LLMs to use event summaries as semantic anchors to predict which related turns are worth reading. This allows the model to inspect high-level event summaries first and then focus on a smaller set of potentially useful turns, providing a concise and reliable evidence set through reasoning, while avoiding the retrieval overhead that would be excessively high compared to vector retrieval. On the LoCoMo10 benchmark, HiGMem achieves the best F1 on four of five question categories and improves adversarial F1 from 0.54 to 0.78 over A-Mem, while retrieving an order of magnitude fewer turns. Code is publicly available at https://github.com/ZeroLoss-Lab/HiGMem.
- Abstract(参考訳): 長期会話型大規模言語モデル (LLM) エージェントは,無関係な文脈で応答段階を克服することなく,歴史的相互作用から関連する証拠を回収するメモリシステムを必要とする。
しかし、階層的なメモリシステムを含む既存のメモリシステムは、検索にベクトル類似性のみに依存することが多い。
肥大化したエビデンスセットを生成する傾向があり、多くの表面上類似の対話を付加すると、リコールはほとんど得られないが、検索精度が低下し、応答ステージのコンテキストコストが上昇し、検索した記憶の検査と管理が困難になる。
本システムでは,イベントサマリーをセマンティックアンカーとして使用して,関連するターンの読み出し価値を予測する2段階のイベントターンメモリシステムであるHiGMemを提案する。
これにより、モデルはまずハイレベルなイベントサマリーを検査し、次に潜在的に有用なターンの小さなセットに集中し、推論によって設定された簡潔で信頼性の高いエビデンスを提供すると同時に、ベクトル検索と比較して過度に高い検索オーバーヘッドを回避することができる。
LoCoMo10ベンチマークでは、HiGMemは5つの質問カテゴリのうち4つで最高のF1を達成し、A-Mem上での対向F1を0.54から0.78に改善し、桁数を桁違いに減らした。
コードはhttps://github.com/ZeroLoss-Lab/HiGMemで公開されている。
関連論文リスト
- MemSearch-o1: Empowering Large Language Models with Reasoning-Aligned Memory Growth in Agentic Search [59.98962867649009]
本稿では,メモリ成長とリトラシングに基づくエージェント検索フレームワークであるMemSearch-o1を提案する。
MemSearch-o1はクエリからメモリシードトークンからきめ細かいメモリフラグメントを成長させ、コントリビューション関数を通じてメモリを再トレースし、深く洗練し、最終的にグローバルに接続されたメモリパスを再編成する。
論文 参考訳(メタデータ) (2026-04-19T05:35:06Z) - Lightweight LLM Agent Memory with Small Language Models [27.343533336242913]
LightMemは、Small Language Models (SLM)によって駆動されるより優れたエージェントメモリのための軽量メモリシステムである。
我々は,記憶を即時会話のための短期記憶(STM),再利用可能な対話要約のための中期記憶(MTM),統合された知識のための長期記憶(LTM)に整理する。
実験の結果,LoCoMoではF1が平均2.5向上し,より効率的で中央値の低いレイテンシ(83ms検索,581msエンドツーエンド)が得られた。
論文 参考訳(メタデータ) (2026-04-09T04:51:07Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation [22.803751188961865]
検索は類似性マッチングを超えて移動し、代わりに潜在コンポーネントを操作するべきだと我々は主張する。
我々は、無傷ユニットの階層を構築し、検索可能な高レベルノード組織を維持するxMemoryを提案する。
論文 参考訳(メタデータ) (2026-02-02T12:04:58Z) - From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents [79.87304940020256]
大言語モデル(LLM)は会話エージェントで広く採用されている。
MemGASは、多粒度アソシエーション、適応選択、検索を構築することにより、メモリ統合を強化するフレームワークである。
4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-05-26T06:13:07Z) - Rethinking Memory in AI: Taxonomy, Operations, Topics, and Future Directions [55.19217798774033]
メモリは、大規模言語モデル(LLM)ベースのエージェントを支える、AIシステムの基本コンポーネントである。
本稿ではまず,メモリ表現をパラメトリックおよびコンテキスト形式に分類する。
次に、コンソリデーション、更新、インデックス付け、フォッティング、検索、圧縮の6つの基本的なメモリ操作を紹介します。
論文 参考訳(メタデータ) (2025-05-01T17:31:33Z) - Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models [30.48902594738911]
長い会話をすると、大きな言語モデル(LLM)は過去の情報を思い出さず、一貫性のない応答を生成する傾向がある。
本稿では,長期記憶能力を高めるために,大規模言語モデル(LLM)を用いて要約/メモリを生成することを提案する。
論文 参考訳(メタデータ) (2023-08-29T04:59:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。