論文の概要: Mem-$π$: Adaptive Memory through Learning When and What to Generate
- arxiv url: http://arxiv.org/abs/2605.21463v1
- Date: Wed, 20 May 2026 17:51:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.825295
- Title: Mem-$π$: Adaptive Memory through Learning When and What to Generate
- Title(参考訳): Mem-$π$: 学習時間と生成方法による適応メモリ
- Authors: Xiaoqiang Wang, Chao Wang, Hadi Nekoei, Christopher Pal, Alexandre Lacoste, Spandana Gella, Bang Liu, Perouz Taslakian,
- Abstract要約: 本稿では,大規模言語モデル(LLM)エージェントにおける適応メモリのためのフレームワークを提案する。
Mem-$は検索ベースとRL最適化メモリベースラインを一貫して上回る。
- 参考スコア(独自算出の注目度): 65.31077328444077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Mem-$π$, a framework for adaptive memory in large language model (LLM) agents, where useful guidance is generated on demand rather than retrieved from external memory stores. Existing memory-augmented agents typically rely on similarity-based retrieval from episodic memory banks or skill libraries, returning static entries that often misalign with the current context. In contrast, Mem-$π$ uses a dedicated language or vision-language model with its own parameters, separate from the downstream agent, to generate context-specific guidance for complex tasks. Conditioned on the current agent context, the model jointly decides when to produce guidance and what guidance to produce. We train it with a decision-content decoupled reinforcement learning (RL) objective, enabling it to abstain when generation would not help and otherwise produce concise, useful guidance. Across diverse agentic benchmarks spanning web navigation, terminal-based tool use, and text-based embodied interaction, Mem-$π$ consistently outperforms retrieval-based and prior RL-optimized memory baselines, achieving over 30% relative improvement on web navigation tasks.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)エージェントにおける適応メモリのためのフレームワークであるMem-$π$について述べる。
既存のメモリ拡張エージェントは、典型的には、エピソードメモリバンクやスキルライブラリからの類似性に基づく検索に依存し、しばしば現在のコンテキストと不一致な静的エントリを返す。
対照的に、Mem-$π$は、ダウンストリームエージェントとは別の独自のパラメータを持つ専用言語またはビジョン言語モデルを使用して、複雑なタスクのコンテキスト固有のガイダンスを生成する。
現在のエージェントコンテキストに基づいて、モデルは、いつガイダンスを作成するか、どのガイダンスを作成するかを共同で決定する。
我々は、RL(Decision-content Decoupled reinforcement Learning)目標を用いて学習し、世代が役に立たないときを排除し、簡潔で有用なガイダンスを作成できるようにする。
Webナビゲーション、端末ベースのツール使用、テキストベースのエボダイドインタラクションにまたがるさまざまなエージェントベンチマークにおいて、Mem-$π$は検索ベースと以前のRL最適化メモリベースラインを一貫して上回り、Webナビゲーションタスクの30%以上の相対的な改善を実現している。
関連論文リスト
- MemORAI: Memory Organization and Retrieval via Adaptive Graph Intelligence for LLM Conversational Agents [14.16693343382686]
大きな言語モデル(LLM)は、長期的なパーソナライズされた会話のための永続的なメモリを欠いている。
既存のグラフベースのメモリシステムは、情報希釈、前兆追跡の欠如、クエリコンテキストを無視した一様検索に悩まされている。
MemORAIは,ユーザ個人関連コンテンツを保持するための2層圧縮による選択的メモリフィルタリング,ターンレベルにおける実データ追跡の証明付きマルチリレーショナルグラフ,動的重み付きPageRankを用いたクエリ適応サブグラフ検索という,3つのイノベーションを統合したフレームワークである。
論文 参考訳(メタデータ) (2026-05-02T11:20:34Z) - Memory-Augmented LLM-based Multi-Agent System for Automated Feature Generation on Tabular Data [52.80567461420316]
メモリ拡張LPMに基づくマルチエージェントシステム(textbfMALMAS)を提案する。
MALMASは生成プロセスを独立した責任を持つエージェントに分解し、ルータエージェントはイテレーション毎にエージェントの適切なサブセットを起動する。
さらに、手続きメモリ、フィードバックメモリ、概念記憶を含むメモリモジュールを統合し、その後の特徴生成を適応的に導く反復的改善を可能にする。
論文 参考訳(メタデータ) (2026-04-22T07:09:30Z) - TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA [8.036549927091286]
大規模言語モデル(LLM)は、様々なドメインにわたるテキストベースのコンテキストにおいて強力な推論能力を示した。
コンテキストウィンドウの制限は、長距離推論タスクにおけるモデルの課題を引き起こす。
ツール拡張型自律メモリ検索フレームワーク(TA-Mem)を導入する。
TA-MemはLoCoMoデータセットで評価され、既存のベースラインアプローチよりも大幅にパフォーマンスが向上した。
論文 参考訳(メタデータ) (2026-03-10T07:27:01Z) - UMEM: Unified Memory Extraction and Management Framework for Generalizable Memory [46.87954895079213]
自己進化型メモリは、大規模言語モデル(LLM)のトレーニング可能なパラメータとして機能する
既存の方法は、メモリ抽出を静的プロセスとして扱いながら、メモリ管理を優先的に最適化する。
本稿では,大言語モデルを協調的に最適化し,メモリの抽出と管理を同時に行うための統一メモリ抽出管理(UMEM)を提案する。
論文 参考訳(メタデータ) (2026-02-11T08:58:41Z) - Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory [89.65731902036669]
Evo-Memoryは、大規模言語モデル(LLM)エージェントで自己進化型メモリを評価するための、ストリーミングベンチマークとフレームワークである。
10以上の代表的なメモリモジュールを評価し、10種類の多ターンゴール指向およびシングルターン推論およびQAデータセットで評価した。
論文 参考訳(メタデータ) (2025-11-25T21:08:07Z) - MemOS: A Memory OS for AI System [116.87568350346537]
大規模言語モデル(LLM)は、人工知能(AGI)にとって不可欠な基盤となっている。
既存のモデルは、主に静的パラメータと短命なコンテキスト状態に依存しており、ユーザの好みを追跡したり、長い期間にわたって知識を更新する能力を制限する。
MemOSはメモリを管理可能なシステムリソースとして扱うメモリオペレーティングシステムである。
論文 参考訳(メタデータ) (2025-07-04T17:21:46Z) - Memory Sharing for Large Language Model based Agents [43.53494041932615]
本稿では,リアルタイムメモリフィルタ,ストレージ,検索を統合し,In-Context学習プロセスを強化するためのフレームワークであるMemory Sharingを紹介する。
実験の結果,MSフレームワークはオープンな質問に対処する際のエージェントの性能を大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-04-15T17:57:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。