論文の概要: EviMem: Evidence-Gap-Driven Iterative Retrieval for Long-Term Conversational Memory
- arxiv url: http://arxiv.org/abs/2604.27695v1
- Date: Thu, 30 Apr 2026 10:37:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.04409
- Title: EviMem: Evidence-Gap-Driven Iterative Retrieval for Long-Term Conversational Memory
- Title(参考訳): EviMem: 長期会話記憶のためのエビデンス・ギャップ駆動反復検索
- Authors: Yuyang Li, Yime He, Zeyu Zhang, Dong Gong,
- Abstract要約: IRIS(Iterative Retrieval via Insufficiency Signals)とLaceMem(Layered Architecture for Conversational Evidence Memory)を組み合わせたEviMemを提案する。
LoCoMoでは、EviMemは、時間(73.3%から81.6%)とマルチホップ(65.9%から85.2%)の質問を4.5倍のレイテンシでMIRIXよりも精度を向上させる。
- 参考スコア(独自算出の注目度): 19.027571478872
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Long-term conversational memory requires retrieving evidence scattered across multiple sessions, yet single-pass retrieval fails on temporal and multi-hop questions. Existing iterative methods refine queries via generated content or document-level signals, but none explicitly diagnoses the evidence gap, namely what is missing from the accumulated retrieval set, leaving query refinement untargeted. We present EviMem, combining IRIS (Iterative Retrieval via Insufficiency Signals), a closed-loop framework that detects evidence gaps through sufficiency evaluation, diagnoses what is missing, and drives targeted query refinement, with LaceMem (Layered Architecture for Conversational Evidence Memory), a coarse-to-fine memory hierarchy supporting fine-grained gap diagnosis. On LoCoMo, EviMem improves Judge Accuracy over MIRIX on temporal (73.3% to 81.6%) and multi-hop (65.9% to 85.2%) questions at 4.5x lower latency. Code: https://github.com/AIGeeksGroup/EviMem.
- Abstract(参考訳): 長期会話記憶には複数のセッションに散在するエビデンスを取得する必要があるが、時間的およびマルチホップの質問ではシングルパス検索が失敗する。
既存の反復的手法は、生成されたコンテンツや文書レベルの信号を通じてクエリを精査するが、エビデンスギャップを明示的に診断するものではない。
本稿では,IRIS(Iterative Retrieval via Insufficiency Signals, IRIS)と,Sufficiency評価によるエビデンスギャップの検出,不足点の診断,ターゲットとするクエリ改善を,LaceMem(Layered Architecture for Conversational Evidence Memory)と組み合わせて提案する。
LoCoMoでは、EviMemは、時間(73.3%から81.6%)とマルチホップ(65.9%から85.2%)の質問を4.5倍のレイテンシでMIRIXよりも精度を向上させる。
コード:https://github.com/AIGeeksGroup/EviMem。
関連論文リスト
- HaS: Accelerating RAG through Homology-Aware Speculative Retrieval [9.230969223605602]
知識データベースのサイズが大きくなるにつれて、検索は時間がかかります。
ホモロジーを意識した投機的検索フレームワークHaSを提案する。
HaSは、現実世界の人気パターン下でのクエリの頻度から恩恵を受け、かなりの効率向上を達成する。
論文 参考訳(メタデータ) (2026-04-22T11:15:54Z) - MemSearch-o1: Empowering Large Language Models with Reasoning-Aligned Memory Growth in Agentic Search [59.98962867649009]
本稿では,メモリ成長とリトラシングに基づくエージェント検索フレームワークであるMemSearch-o1を提案する。
MemSearch-o1はクエリからメモリシードトークンからきめ細かいメモリフラグメントを成長させ、コントリビューション関数を通じてメモリを再トレースし、深く洗練し、最終的にグローバルに接続されたメモリパスを再編成する。
論文 参考訳(メタデータ) (2026-04-19T05:35:06Z) - HingeMem: Boundary Guided Long-Term Memory with Query Adaptive Retrieval for Scalable Dialogues [12.529136884264092]
HingeMemは、バウンダリトリガーされたハイパーエッジを介して解釈可能なインデックスインターフェースを構築する、バウンダリガイダンス付き長期メモリである。
クエリ適応型検索機構は、(a) textit Whatを検索する: 要素インデックスメモリ上のクエリ条件付きルーティングを決定する。
HingeMemはクエリカテゴリの仕様なしで、強いベースラインに対して約20%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2026-04-08T09:07:07Z) - All-Mem: Agentic Lifelong Memory via Dynamic Topology Evolution [20.68235182577703]
All-Memは明示的で非破壊的な統合を通じて構造化されたメモリバンクを維持している。
LLM診断器は定期的にオフラインで、SPLIT、MERGE、UPDATEの3つの演算子で実行される信頼性スコアトポロジ編集を提案する。
クエリ時には、タイプドリンクはホップバウンドで、アクティブアンカーから必要に応じてアーカイブされたエビデンスへの予算付き拡張を可能にする。
論文 参考訳(メタデータ) (2026-03-20T03:14:40Z) - AdaMem: Adaptive User-Centric Memory for Long-Horizon Dialogue Agents [49.63422082885992]
長軸対話エージェントのための適応型ユーザ中心メモリフレームワークであるAdaMemを提案する。
AdaMemは対話履歴をワーキング、エピソディック、ペルソナ、グラフメモリに整理する。
LoCoMo と PERSONAMEM ベンチマーク上での AdaMem の評価を行った。
論文 参考訳(メタデータ) (2026-03-17T13:22:54Z) - SmartSearch: How Ranking Beats Structure for Conversational Memory Retrieval [0.0]
SmartSearchは完全に決定論的パイプラインを使用して、生の非構造化会話履歴から検索する。
SmartSearchはLoCoMoで93.5%、LongMemEval-Sベンチマークで88.4%を達成した。
論文 参考訳(メタデータ) (2026-03-16T17:53:21Z) - LongVidSearch: An Agentic Benchmark for Multi-hop Evidence Retrieval Planning in Long Videos [7.139631028105273]
LongVidSearchは、ロングビデオにおけるエージェント的マルチホップエビデンス検索計画を評価するためのベンチマークである。
Hop-k の質問は、正確に k 個のエビデンス・クリップを必要とする。
論文 参考訳(メタデータ) (2026-03-15T16:20:23Z) - Evoking User Memory: Personalizing LLM via Recollection-Familiarity Adaptive Retrieval [59.295767860331004]
RF-Memは、親しみやすい不確実性誘導デュアルパスメモリレトリバーである。
それは、人間のようなデュアルプロセス認識をレトリバーに埋め込む。
一定の予算とレイテンシの制約の下で、ワンショット検索とフルコンテキスト推論を一貫して上回る。
論文 参考訳(メタデータ) (2026-03-10T06:31:44Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - MAGNET: A Multi-agent Framework for Finding Audio-Visual Needles by Reasoning over Multi-Video Haystacks [67.31276358668424]
AV-HaystacksQAという新しいタスクを導入し、クエリに応答して、異なるビデオにまたがる有能なセグメントを識別し、それらをリンクして最も有意義な回答を生成する。
AVHaystacksは、マルチビデオ検索および時間的グラウンドタスクにおけるLMMの能力を評価するために設計された3100の注釈付きQAペアからなるオーディオビジュアルベンチマークである。
提案するAVHaystackのQAタスクにおけるBLEU@4およびGPT評価スコアの基準値よりも89%と65%の相対的な改善を実現し、モデルに依存しないマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-08T06:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。