Fugu-MT 論文翻訳(概要): M+: Extending MemoryLLM with Scalable Long-Term Memory

論文の概要: M+: Extending MemoryLLM with Scalable Long-Term Memory

arxiv url: http://arxiv.org/abs/2502.00592v1
Date: Sat, 01 Feb 2025 23:13:10 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:53.957339
Title: M+: Extending MemoryLLM with Scalable Long-Term Memory
Title（参考訳）: M+: 拡張可能な長期メモリでメモリLLMを拡張する
Authors: Yu Wang, Dmitry Krotov, Yuanzhe Hu, Yifan Gao, Wangchunshu Zhou, Julian McAuley, Dan Gutfreund, Rogerio Feris, Zexue He,
Abstract要約: メモリLLMに基づくメモリ拡張モデルであるM+を導入し、長期情報保持を大幅に強化する。 M+は長期記憶機構と協調学習した検索装置を統合し、テキスト生成中に関連情報を動的に検索する。長いコンテキスト理解や知識保持タスクを含む様々なベンチマークでM+を評価する。
参考スコア（独自算出の注目度）: 43.638130657981534
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Equipping large language models (LLMs) with latent-space memory has attracted increasing attention as they can extend the context window of existing language models. However, retaining information from the distant past remains a challenge. For example, MemoryLLM (Wang et al., 2024a), as a representative work with latent-space memory, compresses past information into hidden states across all layers, forming a memory pool of 1B parameters. While effective for sequence lengths up to 16k tokens, it struggles to retain knowledge beyond 20k tokens. In this work, we address this limitation by introducing M+, a memory-augmented model based on MemoryLLM that significantly enhances long-term information retention. M+ integrates a long-term memory mechanism with a co-trained retriever, dynamically retrieving relevant information during text generation. We evaluate M+ on diverse benchmarks, including long-context understanding and knowledge retention tasks. Experimental results show that M+ significantly outperforms MemoryLLM and recent strong baselines, extending knowledge retention from under 20k to over 160k tokens with similar GPU memory overhead.
Abstract（参考訳）: 大規模言語モデル(LLM)を潜在空間メモリで取得することは、既存の言語モデルのコンテキストウィンドウを拡張できるため、注目を集めている。しかし、遠い過去からの情報を保持することは依然として困難である。例えば、MemoryLLM (Wang et al , 2024a)は、遅延空間メモリの代表的な作業として、過去の情報をすべての層にわたって隠された状態に圧縮し、1Bパラメータのメモリプールを形成する。最大16kトークンまでのシーケンスに有効だが、20kトークンを超える知識を維持するのに苦労している。本稿では,メモリLLMに基づくメモリ拡張モデルであるM+を導入し,長期情報保持を大幅に向上させることにより,この制限に対処する。 M+は長期記憶機構と協調学習した検索装置を統合し、テキスト生成中に関連情報を動的に検索する。長いコンテキスト理解や知識保持タスクを含む様々なベンチマークでM+を評価する。実験の結果、M+はメモリLLMと最近の強力なベースラインを著しく上回り、20k未満の知識保持をGPUメモリのオーバーヘッドに類似した160k以上のトークンに拡張した。

関連論文リスト

Evaluating Long-Term Memory for Long-Context Question Answering [100.1267054069757]
質問応答タスクにアノテートした合成長文対話のベンチマークであるLoCoMoを用いて,メモリ拡張手法の体系的評価を行う。以上の結果から,メモリ拡張アプローチによりトークン使用率が90%以上削減され,競争精度が向上した。
論文参考訳（メタデータ） (2025-10-27T18:03:50Z)
LightMem: Lightweight and Efficient Memory-Augmented Generation [72.21680105265824]
我々は、メモリシステムの性能と効率のバランスをとるLightMemという新しいメモリシステムを紹介した。人間の記憶のアトキンソン・シフリンモデルにインスパイアされたLightMemは、メモリを3つの相補的なステージにまとめる。 GPTとQwenのバックボーンを用いたLongMemEvalの実験では、LightMemは高いベースライン(最大10.9%のゲイン)を上回り、トークンの使用量を最大117倍に削減している。
論文参考訳（メタデータ） (2025-10-21T17:58:17Z)
Multiple Memory Systems for Enhancing the Long-term Memory of Agent [9.43633399280987]
MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文参考訳（メタデータ） (2025-08-21T06:29:42Z)
MOM: Memory-Efficient Offloaded Mini-Sequence Inference for Long Context Language Models [72.61076288351201]
メモリ効率の良いオフロードミニシーケンス推論(MOM)を提案する。 MOMは重要なレイヤを小さな“ミニシーケンス”に分割し、KVキャッシュのオフロードとシームレスに統合する。 Meta-Llama-3.2-8Bでは、単一のA100 80GB GPU上での最大コンテキスト長を155kから455kに拡張する。
論文参考訳（メタデータ） (2025-04-16T23:15:09Z)
MemLong: Memory-Augmented Retrieval for Long Text Modeling [37.49036666949963]
この研究はMemLong: Memory-Augmented Retrieval for Long Text Generationを紹介します。 MemLongは、非微分可能なret-mem'モジュールと部分的にトレーニング可能なデコーダのみの言語モデルを組み合わせる。複数の長文言語モデリングベンチマークに関する総合的な評価は、MemLongが他の最先端のLLMよりも一貫して優れていることを示している。
論文参考訳（メタデータ） (2024-08-30T02:01:56Z)
HMT: Hierarchical Memory Transformer for Long Context Language Processing [35.730941605490194]
Hierarchical Memory Transformer (HMT) は、モデル長文処理機能を実現し、改善する新しいフレームワークである。我々は,HMTがコンテキスト制約付き長文モデルの長文処理能力を着実に改善していることを示す。
論文参考訳（メタデータ） (2024-05-09T19:32:49Z)
MemLLM: Finetuning LLMs to Use An Explicit Read-Write Memory [49.96019697955383]
本稿では,構造化および明示的な読み書きメモリモジュールを統合することで,大規模言語モデル(LLM)の拡張手法であるMemLLMを紹介する。実験の結果, 言語モデリング, 特に知識集約型タスクにおいて, MemLLMはLLMの性能と解釈可能性を向上させることが示唆された。
論文参考訳（メタデータ） (2024-04-17T18:13:16Z)
Augmenting Language Models with Long-Term Memory [142.04940250657637]
既存の大規模言語モデル(LLM)では、入力長制限のため、固定サイズの入力しかできない。本稿では,Long-Term Memory (LongMem) を付加した言語モデルを提案する。
論文参考訳（メタデータ） (2023-06-12T15:13:39Z)
RET-LLM: Towards a General Read-Write Memory for Large Language Models [53.288356721954514]
RET-LLMは、大規模な言語モデルに一般的な読み書きメモリユニットを装備する新しいフレームワークである。デビッドソンのセマンティクス理論に触発され、三重項の形で知識を抽出し保存する。本フレームワークは,時間に基づく質問応答タスクの処理において,堅牢な性能を示す。
論文参考訳（メタデータ） (2023-05-23T17:53:38Z)
LaMemo: Language Modeling with Look-Ahead Memory [50.6248714811912]
右側トークンへの漸進的参加により再帰記憶を向上させるLook-Ahead Memory(LaMemo)を提案する。 LaMemoは、メモリ長に比例した追加のオーバーヘッドで、双方向の注意とセグメントの再発を受け入れる。広く使われている言語モデリングベンチマークの実験は、異なる種類のメモリを備えたベースラインよりも優れていることを示した。
論文参考訳（メタデータ） (2022-04-15T06:11:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。