論文の概要: MEMTIER: Tiered Memory Architecture and Retrieval Bottleneck Analysis for Long-Running Autonomous AI Agents
- arxiv url: http://arxiv.org/abs/2605.03675v1
- Date: Tue, 05 May 2026 12:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.92443
- Title: MEMTIER: Tiered Memory Architecture and Retrieval Bottleneck Analysis for Long-Running Autonomous AI Agents
- Title(参考訳): MEMTIER:長期的な自律AIエージェントのための階層記憶アーキテクチャと検索ボットネック分析
- Authors: Bronislav Sidik, Lior Rokach,
- Abstract要約: 提案するMEMTIERは,OpenClawエージェントのための三部構成メモリアーキテクチャである。
完全なLongMemEval-Sベンチマークでは、MEMTIERは6GBのGPU上でQwen2.5-7BでAcc.382, F1=.412を達成する。
DeepSeek-V4-Flashでは、シングルセッションリコールは0.686-0.714に達し、これらのカテゴリのRAG GPT-4oを上回っている。
- 参考スコア(独自算出の注目度): 6.8552591401084015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Long-running autonomous AI agents suffer from a well-documented memory coherence problem: tool-execution success rates degrade 14 percentage points over 72-hour operation windows due to four compounding failure modes in existing flat-file memory systems. We present MEMTIER, a tripartite memory architecture for the OpenClaw agent runtime that introduces a structured episodic JSONL store, a five-signal weighted retrieval engine, an attention-attributed cognitive weight update loop, an asynchronous consolidation daemon promoting episodic facts to a semantic tier, and a PPO-based policy framework for adapting retrieval weights (infrastructure validated; performance gains pending camera-ready). On the full 500-question LongMemEval-S benchmark (Wu et al., 2025), MEMTIER achieves Acc=0.382, F1=0.412 with Qwen2.5-7B on a consumer 6GB GPU - a +33 percentage point improvement over the full-context baseline (0.050 -> 0.382, i.e., 5% -> 38%). With DeepSeek-V4-Flash fact pre-population, single-session recall reaches 0.686-0.714, exceeding the paper's RAG BM25 GPT-4o baseline (0.560) on those categories. Temporal reasoning rises to 0.323 and multi-session synthesis to 0.173, demonstrating that structured semantic pre-population qualitatively changes what lightweight retrieval can achieve. All phases run locally on a consumer laptop with a 6GB GPU.
- Abstract(参考訳): ツール実行の成功率は、既存のフラットファイルメモリシステムで4つの複合的な障害モードのため、72時間動作ウィンドウで14パーセント低下する。
本稿では,構造化されたエピソードJSONLストア,5信号重み付き検索エンジン,注目型認知重み更新ループ,セマンティック層にエピソード事実をプロモートする非同期統合デーモン,および検索重みを適応するためのPPOベースのポリシーフレームワークを提案する。
500-question LongMemEval-Sベンチマーク(Wu et al , 2025)では、MEMTIERがAcc=0.382, F1=0.412、Qwen2.5-7Bを6GB GPUで達成した。
DeepSeek-V4-Flashでは、シングルセッションリコールが0.686-0.714に達し、これらのカテゴリのRAG BM25 GPT-4oベースライン(0.560)を超えた。
時間的推論は0.323に増加し、マルチセッション合成は0.173に上昇し、構造化されたセマンティックプレポピュレーションは、軽量な検索が達成できることを質的に変化させることを示した。
すべてのフェーズは,6GBのGPUを備えたコンシューマラップトップ上でローカルで動作する。
関連論文リスト
- ZenBrain: A Neuroscience-Inspired 7-Layer Memory Architecture for Autonomous AI Systems [51.56484100374058]
LongMemEval-500では、ZenBrainは長いコンテキストのオラクルのバイナリ・ジャッジの精度を4.5pp以内と一致させる。
ZenBrainは7層の神経科学にインスパイアされたメモリアーキテクチャである。
論文 参考訳(メタデータ) (2026-04-26T20:39:19Z) - Predictive Multi-Tier Memory Management for KV Cache in Large-Scale GPU Inference [0.0]
キーバリュー(KV)キャッシュメモリ管理は、大規模GPU推論サービスにおける主要なボトルネックである。
現在のシステムは3つの複合的非効率性に悩まされている。
3つの問題すべてに対処する統一システムを提案する。
論文 参考訳(メタデータ) (2026-04-19T21:34:09Z) - MemMachine: A Ground-Truth-Preserving Memory System for Personalized AI Agents [2.541923091180284]
大規模言語モデル(LLM)エージェントはパーソナライゼーション、事実連続性、長期的推論を維持するために永続記憶を必要とする。
本稿では,短期,長期,プロファイルメモリを統合したオープンソースのメモリシステムであるMemMachineを紹介する。
MemMachineは、コンテキスト化された検索を使用して、周囲のコンテキストにマッチする核を拡大し、関連するエビデンスが複数の対話にまたがる場合のリコールを改善する。
論文 参考訳(メタデータ) (2026-04-06T16:57:06Z) - SuperLocalMemory V3.3: The Living Brain -- Biologically-Inspired Forgetting, Cognitive Quantization, and Multi-Channel Retrieval for Zero-LLM Agent Memory Systems [0.0]
ローカルファーストのエージェントメモリシステムであるSuperLocalMemory V3.3("The Living Brain")を提案する。
認知記憶の完全な分類と数学的ライフサイクルのダイナミクスを実装している。
Elastic License 2.0の下でオープンソースで、完全にCPUで動作し、毎月5000回以上ダウンロードされている。
論文 参考訳(メタデータ) (2026-04-06T08:27:26Z) - Omni-SimpleMem: Autoresearch-Guided Discovery of Lifelong Multimodal Agent Memory [76.63021613850093]
我々は、生涯にわたるAIエージェントのための統合マルチモーダルメモリフレームワークであるOmni-SimpleMemを発見するために、自律的な研究パイプラインをデプロイする。
システムは2つのベンチマークで最先端を実現し、LoCoMoではF1を+411%改善し、Mem-Galleryでは+214%向上した。
本稿では,6種類の発見型を分類し,特に自動検索に適したマルチモーダルメモリを実現する4つの特性を同定する。
論文 参考訳(メタデータ) (2026-04-01T15:06:23Z) - Resource-Efficient Iterative LLM-Based NAS with Feedback Memory [49.44875022114861]
ニューラルアーキテクチャサーチ(NAS)はネットワーク設計を自動化するが、従来の手法ではかなりの計算資源を必要とする。
本稿では,大規模言語モデル(LLM)を活用して,畳み込みニューラルネットワークアーキテクチャを反復的に生成し,評価し,洗練するクローズドループパイプラインを提案する。
論文 参考訳(メタデータ) (2026-03-12T16:00:22Z) - A Dynamic Retrieval-Augmented Generation System with Selective Memory and Remembrance [0.0]
Emph Adaptive RAG Memory (ARM) は,静的ベクトルインデックスをEmphdynamicメモリ基板に置き換える検索拡張生成(RAG)フレームワークである。
ARMは、軽量な検索ベンチマークで最先端のパフォーマンスに近づいた。
ARMは、ジェネレータカラーブラックを再トレーニングすることなく、競合精度、自己正規化メモリ成長、解釈可能な保持ダイナミクスを出力し、生産・研究RAGシステムの品質、レイテンシ、メモリ効率のトレードオフを実践する。
論文 参考訳(メタデータ) (2026-01-04T21:51:41Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。