論文の概要: G-Long: Graph-Enhanced Memory Management for Efficient Long-Term Dialogue Agents
- arxiv url: http://arxiv.org/abs/2606.13115v1
- Date: Thu, 11 Jun 2026 09:42:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.705472
- Title: G-Long: Graph-Enhanced Memory Management for Efficient Long-Term Dialogue Agents
- Title(参考訳): G-Long:効率的な長期対話エージェントのためのグラフ強化メモリ管理
- Authors: Minjun Choi, Yoonjin Jang, Sangwon Youn, Youngjoong Ko,
- Abstract要約: G-Longは構造化三重項抽出と連想検索のためのグラフ強化フレームワークである。
G-Longは応答生成とメモリ検索の両方において最先端の性能を達成する。
- 参考スコア(独自算出の注目度): 16.113403291412805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While Large Language Models (LLMs) have advanced open-domain dialogue systems, maintaining long-term consistency remains a challenge due to inherent limitations in long-context reasoning and the inefficiency of processing extensive raw text. Existing approaches typically rely on either unstructured memory storage, which is prone to information loss, or computationally expensive LLMs that incur high latency. To address these limitations, we propose G-Long, a graph-enhanced framework that utilizes a fine-tuned small Language Model (sLM) for structured triplet extraction and associative retrieval, significantly reducing operational costs. Furthermore, we introduce the novel attention-aware importance scoring mechanism that leverages the intrinsic cross-attention signals of a T5 summarizer to identify salient memories. Extensive experiments across diverse benchmarks demonstrate that G-Long achieves state-of-the-art performance in both response generation and memory retrieval, yielding performance gains of up to 9.8% in response quality on MSC and 40.8% in retrieval recall on LME, while significantly minimizing computational overhead.
- Abstract(参考訳): 大規模言語モデル(LLM)は先進的なオープンドメイン対話システムを持っているが、長期の一貫性を維持することは、長文推論における固有の制限と広範囲な原文処理の非効率のため、依然として課題である。
既存のアプローチは、情報損失の少ない非構造化メモリストレージか、高い遅延を引き起こす計算コストのLLMに依存するのが一般的である。
これらの制約に対処するために、構造化三重項抽出と連想検索に細調整された小言語モデル(sLM)を利用するグラフ拡張フレームワークG-Longを提案する。
さらに,本研究では,T5要約器の内在的横断的アテンション信号を利用して,有意な記憶を識別する,新たなアテンション・アウェアの重要度評価機構を提案する。
様々なベンチマークによる大規模な実験により、G-Longは応答生成とメモリ検索の両方で最先端のパフォーマンスを達成し、MSCでの応答品質が9.8%、LCMでの検索リコールが40.8%まで向上し、計算オーバーヘッドを大幅に最小化している。
関連論文リスト
- LongR: Unleashing Long-Context Reasoning via Reinforcement Learning with Dense Utility Rewards [57.993003392037174]
LongRは動的"Think-and-Read"メカニズムを統合することで、長時間コンテキストのパフォーマンスを向上させるフレームワークである。
LongRは様々なRLアルゴリズムのパフォーマンスを継続的に向上する。
論文 参考訳(メタデータ) (2026-02-05T15:26:47Z) - Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文 参考訳(メタデータ) (2026-01-05T08:24:16Z) - TeleMem: Building Long-Term and Multimodal Memory for Agentic AI [43.36544433800511]
大規模言語モデル(LLM)は、多くのNLPタスクにおいて優れているが、対話履歴の拡張に対する注意が限られているため、長期的な相互作用を維持するのに苦労する。
本稿では,コヒーレントなユーザプロファイルを物語動的抽出により維持する,長期・マルチモーダル統合メモリシステムTeleMemを提案する。
TeleMemは最先端のMem0ベースラインを19%上回り、トークンは43%減り、ZH-4Oの長期ロールプレイゲームベンチマークでは2.1倍高速化された。
論文 参考訳(メタデータ) (2025-12-12T11:24:52Z) - GCAgent: Long-Video Understanding via Schematic and Narrative Episodic Memory [59.869552603264076]
GCAgent(Global-Context-Aware Agent)は,広義の長ビデオ理解を実現する新しいフレームワークである。
これは、イベントとその因果関係と時間的関係を、簡潔で組織化されたコンテキストに構造的にモデル化するものです。
実験により、GCAgentは、強力なMLLMベースライン上でのVideo-MME Long分割において、最大23.5%の精度向上を実現した。
論文 参考訳(メタデータ) (2025-11-15T04:29:00Z) - REFRAG: Rethinking RAG based Decoding [67.4862300145604]
REFRAGは効率的なデコードフレームワークで、RAGアプリケーションの遅延を圧縮し、感知し、拡張し、改善する。
本稿では,RAG,マルチターン会話,長期文書要約など,多種多様な長文タスクを対象としたREFRAGの厳密な検証を行う。
論文 参考訳(メタデータ) (2025-09-01T03:31:44Z) - From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents [79.87304940020256]
大言語モデル(LLM)は会話エージェントで広く採用されている。
MemGASは、多粒度アソシエーション、適応選択、検索を構築することにより、メモリ統合を強化するフレームワークである。
4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-05-26T06:13:07Z) - RAPID: Long-Context Inference with Retrieval-Augmented Speculative Decoding [7.785459677641105]
LLM(Long-context Large Language Model)は、従来の検索拡張世代(RAG)に代わる有望な代替手段を提供する。
本稿ではRAPID(Retrieval-Augmented Speculative Decoding)を提案する。
提案手法は,計算効率を維持しつつ,同一スケールあるいはそれ以上のLLMをRAGドラフトとして機能させる,新たなパラダイムを実現する。
論文 参考訳(メタデータ) (2025-02-27T17:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。