論文の概要: MemGuide: Intent-Driven Memory Selection for Goal-Oriented Multi-Session LLM Agents
- arxiv url: http://arxiv.org/abs/2505.20231v2
- Date: Wed, 13 Aug 2025 03:43:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 16:17:42.487392
- Title: MemGuide: Intent-Driven Memory Selection for Goal-Oriented Multi-Session LLM Agents
- Title(参考訳): MemGuide: Goal-Oriented Multi-Session LLMエージェントのインテント駆動メモリ選択
- Authors: Yiming Du, Bingbing Wang, Yang He, Bin Liang, Baojun Wang, Zhongyang Li, Lin Gui, Jeff Z. Pan, Ruifeng Xu, Kam-Fai Wong,
- Abstract要約: インテント駆動型メモリ選択のための2段階フレームワークであるMemGuideを紹介する。
MemGuideは、現在の対話コンテキストとメモリバンク内の格納されたインテント記述とを一致させる。
Missing-Aligned Guided Filteringでは、チェーンオブソートスロット推論器を使用して未充填スロットを列挙し、微調整のLLaMA-8Bフィルタを使用して検索したユニットを再ランクする。
- 参考スコア(独自算出の注目度): 46.21840714172862
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Modern task-oriented dialogue (TOD) systems increasingly rely on large language model (LLM) agents, leveraging Retrieval-Augmented Generation (RAG) and long-context capabilities for long-term memory utilization. However, these methods are primarily based on semantic similarity, overlooking task intent and reducing task coherence in multi-session dialogues. To address this challenge, we introduce MemGuide, a two-stage framework for intent-driven memory selection. (1) Intent-Aligned Retrieval matches the current dialogue context with stored intent descriptions in the memory bank, retrieving QA-formatted memory units that share the same goal. (2) Missing-Slot Guided Filtering employs a chain-of-thought slot reasoner to enumerate unfilled slots, then uses a fine-tuned LLaMA-8B filter to re-rank the retrieved units by marginal slot-completion gain. The resulting memory units inform a proactive strategy that minimizes conversational turns by directly addressing information gaps. Based on this framework, we introduce the MS-TOD, the first multi-session TOD benchmark comprising 132 diverse personas, 956 task goals, and annotated intent-aligned memory targets, supporting efficient multi-session task completion. Evaluations on MS-TOD show that MemGuide raises the task success rate by 11% (88% -> 99%) and reduces dialogue length by 2.84 turns in multi-session settings, while maintaining parity with single-session benchmarks.
- Abstract(参考訳): 現代のタスク指向対話(TOD)システムは、大規模言語モデル(LLM)エージェントにますます依存し、長期メモリ利用にRAG(Retrieval-Augmented Generation)と長期コンテキスト機能を活用している。
しかし、これらの手法は主に意味的類似性に基づいており、タスク意図を見落とし、マルチセッション対話におけるタスクコヒーレンスを低減する。
この課題に対処するため,インテント駆動型メモリ選択のための2段階フレームワークであるMemGuideを紹介した。
1)Intent-Aligned Retrievalは、現在の対話コンテキストとメモリバンク内の格納された意図記述とを一致させ、同じ目標を共有するQA形式のメモリユニットを取得する。
2)Missing-Slot Guided Filteringでは,未充足スロットを列挙するチェーン・オブ・シント・スロット・リアライザを用いて,細調整したLLaMA-8Bフィルタを用いて,検索したユニットを限界スロット・コンプリートゲインで再ランクする。
結果のメモリユニットは、情報ギャップに直接対処することにより会話のターンを最小限に抑えるプロアクティブ戦略を通知する。
このフレームワークをベースとして,132の多様なペルソナ,956のタスク目標,アノテートされたインテント整合メモリターゲットからなる最初のマルチセッションTODベンチマークであるMS-TODを導入し,効率的なマルチセッションタスク補完をサポートする。
MS-TODの評価によると、MemGuideはタスク成功率を11%(88% -> 99%)引き上げ、マルチセッション設定での対話長を2.84ターン削減し、シングルセッションベンチマークと同等に維持している。
関連論文リスト
- FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.89792845476579]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - Towards Multi-Granularity Memory Association and Selection for Long-Term Conversational Agents [73.77930932005354]
我々は,多粒度アソシエーション,適応選択,検索を構築することで,メモリ統合を向上するフレームワークであるMemGASを提案する。
MemGASは多粒度メモリユニットに基づいており、ガウス混合モデルを用いて新しい記憶と過去の記憶をクラスタリングし関連付けている。
4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-05-26T06:13:07Z) - Task-Core Memory Management and Consolidation for Long-term Continual Learning [62.880988004687815]
我々は、長期連続学習(CL)タスクに焦点を合わせ、時間とともに膨大なタスクのストリームからモデルを逐次学習する。
従来のCL設定とは異なり、長期CLははるかに多くのタスクを処理し、破滅的な忘れ込みの問題を悪化させる。
長期連続学習(Long-CL)のための人間の記憶機構に着想を得た新しい枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-15T04:22:35Z) - In Prospect and Retrospect: Reflective Memory Management for Long-term Personalized Dialogue Agents [70.12342024019044]
大規模言語モデル(LLM)は、オープンエンド対話において大きな進歩を遂げているが、関連する情報の保持と取得ができないため、その有効性は制限されている。
本稿では,長期対話エージェントのための新しいメカニズムであるリフレクティブメモリ管理(RMM)を提案する。
RMMは、LongMemEvalデータセットのメモリ管理なしでベースラインよりも10%以上精度が向上している。
論文 参考訳(メタデータ) (2025-03-11T04:15:52Z) - Interpersonal Memory Matters: A New Task for Proactive Dialogue Utilizing Conversational History [13.389395397698035]
メモリ・アウェア・プロアクティブ・ダイアログ(MapDia)という新しいタスクを導入する。
そのタスクにより、自動データ構築法を提案し、中国初のメモリ対応プロアクティブデータセット(ChMapData)を作成する。
さらに、トピック要約、トピック検索、アクティブなトピックシフト検出と生成の3つのモジュールを特徴とする、検索用拡張生成(RAG)に基づくジョイントフレームワークを導入する。
論文 参考訳(メタデータ) (2025-03-07T05:19:17Z) - On Memory Construction and Retrieval for Personalized Conversational Agents [69.46887405020186]
本稿では,セグメンテーションモデルを導入し,セグメントレベルでメモリバンクを構築するセグメンテーション手法であるSeComを提案する。
実験結果から,SeComは長期会話ベンチマークLOCOMOとLong-MT-Bench+のベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2025-02-08T14:28:36Z) - HiAgent: Hierarchical Working Memory Management for Solving Long-Horizon Agent Tasks with Large Language Model [39.169389255970806]
HiAgentは、サブゴールをメモリチャンクとして活用して、LLM(Large Language Model)ベースのエージェントの動作メモリを階層的に管理するフレームワークである。
その結果,HiAgentは成功率を2倍に向上し,平均ステップ数を3.8倍に削減した。
論文 参考訳(メタデータ) (2024-08-18T17:59:49Z) - TF-SASM: Training-free Spatial-aware Sparse Memory for Multi-object Tracking [6.91631684487121]
コンピュータビジョンにおけるマルチオブジェクト追跡(MOT)は依然として重要な課題であり、ビデオシーケンス内の複数のオブジェクトの正確な位置決めと連続的な追跡が必要である。
本稿では,オブジェクトの動きと重なり合う認識に基づいて,重要な特徴を選択的に記憶するメモリベースの新しいアプローチを提案する。
提案手法はDanceTrackテストセットのMOTRv2よりも有意に改善し,AsAスコアが2.0%,IFF1スコアが2.1%向上した。
論文 参考訳(メタデータ) (2024-07-05T07:55:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。