論文の概要: MemToolAgent: Leveraging Memory for Tool Using Agents Based on Environment and User Feedback
- arxiv url: http://arxiv.org/abs/2606.07909v2
- Date: Wed, 10 Jun 2026 16:54:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 14:23:44.344678
- Title: MemToolAgent: Leveraging Memory for Tool Using Agents Based on Environment and User Feedback
- Title(参考訳): MemToolAgent:環境とユーザフィードバックに基づいたエージェントによるツールのメモリ活用
- Authors: Suleyman Armagan Er, Danilo Ribeiro, Yogesh Virkar, Surafel Lakew, Adi Kalyanpur, James Gung, Thomas Delteil, Arshit Gupta,
- Abstract要約: 本稿では,メモリ管理によるツール使用を改善するフレームワークであるMemToolAgentを提案する。
本研究は,(1)汎用・パーソナライズされたツールの使用を微調整なしで改善する統一型メモリエントリフォーマット,(2)環境やユーザからのフィードバックを取り入れたリフレクションベースのメモリ抽出,(3)メモリ類似度分布に基づく過去の経験数を選択する検索モジュールの3つの主要なコントリビューションを有する。
- 参考スコア(独自算出の注目度): 5.237822504687579
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Modern large language model (LLM) agents can use external tools to help users solve complex tasks. However, for problems that require learning from long-term historical events or from previous agent-environment interactions, LLM agents are required to use memory mechanisms to store and retrieve experiences. While sophisticated memory systems exist for dialogue agents, few studies have empirically examined how to improve agents' tool-using capabilities through past user-agent conversations. We propose MemToolAgent, a framework that improves tool use through memory management. Our approach contains a memory extraction module that processes past experiences into structured memory entries, and a retrieval module that dynamically selects a subset of the stored memory entries. This enables more personalized and accurate responses aligned with user preferences and feedback without requiring LLM fine-tuning. In summary, this work has three main contributions: (1) a unified memory entry format that improves both general-purpose and personalized tool use without LLM fine-tuning, (2) a reflection-based memory extraction that uses environment and user feedback to distill wrong executions into critiques to store, and (3) a retrieval module that chooses how many past experiences to use based on the memory similarity distribution. MemToolAgent achieves 29%, 80%, and 17% relative improvements compared to strong baselines on the WorkBench, NESTFUL, and PEToolBench benchmarks, respectively.
- Abstract(参考訳): 現代の大規模言語モデル(LLM)エージェントは、複雑なタスクを解決するために外部ツールを使用することができる。
しかし、長期の歴史的出来事やエージェントと環境の相互作用から学ぶ必要がある問題に対しては、LLMエージェントは記憶機構を用いて経験を保存・取得する必要がある。
対話エージェントには高度なメモリシステムが存在するが、過去のユーザエージェントの会話を通じてエージェントのツール使用能力を改善する方法を実証的に検討する研究はほとんどない。
本稿では,メモリ管理によるツール使用を改善するフレームワークであるMemToolAgentを提案する。
提案手法は,過去の経験を構造化メモリエントリに処理するメモリ抽出モジュールと,記憶メモリエントリのサブセットを動的に選択する検索モジュールを含む。
これにより、LDMの微調整を必要とせずに、ユーザの好みやフィードバックに合わせて、よりパーソナライズされ、正確なレスポンスが可能になる。
要約すると,本研究は,(1)LLM微調整なしで汎用ツールとパーソナライズツールの両方の使用を改善する統一メモリエントリフォーマット,(2)環境とユーザフィードバックを併用したリフレクションベースのメモリ抽出,(3)メモリ類似度分布に基づく過去の経験数を選択する検索モジュールの3つの主要なコントリビューションを有する。
MemToolAgentは、WorkBench、NESTFUL、PEToolBenchベンチマークの強いベースラインと比較して、29%、80%、および17%の相対的な改善を実現している。
関連論文リスト
- Beyond Similarity: Trustworthy Memory Search for Personal AI Agents [25.265839311088516]
個人AIエージェントにおける信頼境界としてのメモリ探索について検討する。
MemGateは、信頼性の高いメモリ検索のための軽量でデプロイ可能なメモリプラグインである。
論文 参考訳(メタデータ) (2026-06-04T11:54:29Z) - MemGym: a Long-Horizon Memory Environment for LLM Agents [69.79226770543049]
本稿では,エージェントメモリのベンチマークであるMemGymを紹介する。
MemGymは、メモリパフォーマンスを推論、検索、ツール使用能力から切り離すメモリアイソレーションスコアを報告している。
MEMGYM-CODEQAとMEMGYM-DRの合成パイプラインは、長さ制御可能であり、各ステージでアブレーションを検証可能であり、下流のシナリオと密に整合している。
論文 参考訳(メタデータ) (2026-05-20T07:25:33Z) - TA-Mem: Tool-Augmented Autonomous Memory Retrieval for LLM in Long-Term Conversational QA [8.036549927091286]
大規模言語モデル(LLM)は、様々なドメインにわたるテキストベースのコンテキストにおいて強力な推論能力を示した。
コンテキストウィンドウの制限は、長距離推論タスクにおけるモデルの課題を引き起こす。
ツール拡張型自律メモリ検索フレームワーク(TA-Mem)を導入する。
TA-MemはLoCoMoデータセットで評価され、既存のベースラインアプローチよりも大幅にパフォーマンスが向上した。
論文 参考訳(メタデータ) (2026-03-10T07:27:01Z) - Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents [57.38404718635204]
大規模言語モデル (LLM) エージェントは、有限コンテキストウィンドウによる長距離推論において基本的な制限に直面している。
既存のメソッドは通常、長期記憶(LTM)と短期記憶(STM)を独立したコンポーネントとして扱う。
本稿では,エージェントのポリシーに LTM と STM 管理を直接統合する統合フレームワークである Agentic Memory (AgeMem) を提案する。
論文 参考訳(メタデータ) (2026-01-05T08:24:16Z) - Memory-R1: Enhancing Large Language Model Agents to Manage and Utilize Memories via Reinforcement Learning [89.55738101744657]
大規模言語モデル(LLM)は、幅広いNLPタスクで印象的な機能を示しているが、基本的にはステートレスである。
本稿では,LLMに外部メモリを積極的に管理・活用する機能を備えた強化学習フレームワークであるMemory-R1を提案する。
論文 参考訳(メタデータ) (2025-08-27T12:26:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。