論文の概要: Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents
- arxiv url: http://arxiv.org/abs/2604.22085v1
- Date: Thu, 23 Apr 2026 21:34:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.27512
- Title: Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents
- Title(参考訳): Memanto:ロングホライゾンエージェントのための情報理論検索型セマンティックメモリ
- Authors: Seyed Moein Abtahi, Rasa Rahnema, Hetkumar Patel, Neel Patel, Majid Fekri, Tara Khani,
- Abstract要約: メモリは、プロダクショングレードのエージェントシステムのデプロイにおいて、主要なアーキテクチャ上のボトルネックである。
Memantoは、エージェント人工知能のための普遍記憶層である。
メマントは、それぞれ89.8%と87.1%の精度を達成している。
- 参考スコア(独自算出の注目度): 0.4464102544889847
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The transition from stateless language model inference to persistent, multi session autonomous agents has revealed memory to be a primary architectural bottleneck in the deployment of production grade agentic systems. Existing methodologies largely depend on hybrid semantic graph architectures, which impose substantial computational overhead during both ingestion and retrieval. These systems typically require large language model mediated entity extraction, explicit graph schema maintenance, and multi query retrieval pipelines. This paper introduces Memanto, a universal memory layer for agentic artificial intelligence that challenges the prevailing assumption that knowledge graph complexity is necessary to achieve high fidelity agent memory. Memanto integrates a typed semantic memory schema comprising thirteen predefined memory categories, an automated conflict resolution mechanism, and temporal versioning. These components are enabled by Moorcheh's Information Theoretic Search engine, a no indexing semantic database that provides deterministic retrieval within sub ninety millisecond latency while eliminating ingestion delay. Through systematic benchmarking on the LongMemEval and LoCoMo evaluation suites, Memanto achieves state of the art accuracy scores of 89.8 percent and 87.1 percent respectively. These results surpass all evaluated hybrid graph and vector based systems while requiring only a single retrieval query, incurring no ingestion cost, and maintaining substantially lower operational complexity. A five stage progressive ablation study is presented to quantify the contribution of each architectural component, followed by a discussion of the implications for scalable deployment of agentic memory systems.
- Abstract(参考訳): ステートレス言語モデル推論から永続的なマルチセッション自律エージェントへの移行により、プロダクショングレードのエージェントシステムのデプロイにおいて、メモリが主要なアーキテクチャ上のボトルネックであることが判明した。
既存の手法は主にハイブリッドなセマンティックグラフアーキテクチャに依存しており、これは摂取と検索の両方でかなりの計算オーバーヘッドを課している。
これらのシステムは通常、エンティティ抽出、明示的なグラフスキーマのメンテナンス、マルチクエリ検索パイプラインを必要とする。
本稿では,エージェント・インテリジェンスのための汎用記憶層であるMemantoを紹介する。
Memantoは、事前に定義された13のメモリカテゴリ、自動コンフリクト解決機構、テンポラリバージョニングで構成される型付きセマンティックメモリスキーマを統合している。
これらのコンポーネントはMoorchehのInformation Theoretic Searchエンジンによって実現されている。これはインデクシングセマンティックデータベースで、90ミリ秒以下のレイテンシ内で決定論的検索を提供しながら、摂取遅延を排除している。
LongMemEvalとLoCoMoの評価スイートの体系的なベンチマークを通じて、Memantoはそれぞれ89.8%と87.1%の最先端の精度スコアを達成している。
これらの結果は、単一の検索クエリのみを必要としながら、評価された全てのハイブリッドグラフとベクトルベースシステムを超え、摂取コストを発生せず、運用上の複雑さを大幅に低減する。
5段階のプログレッシブアブレーション研究は、各アーキテクチャコンポーネントのコントリビューションを定量化するために提案され、続いてエージェントメモリシステムの拡張性に関する議論が行われた。
関連論文リスト
- MemSearch-o1: Empowering Large Language Models with Reasoning-Aligned Memory Growth in Agentic Search [59.98962867649009]
本稿では,メモリ成長とリトラシングに基づくエージェント検索フレームワークであるMemSearch-o1を提案する。
MemSearch-o1はクエリからメモリシードトークンからきめ細かいメモリフラグメントを成長させ、コントリビューション関数を通じてメモリを再トレースし、深く洗練し、最終的にグローバルに接続されたメモリパスを再編成する。
論文 参考訳(メタデータ) (2026-04-19T05:35:06Z) - From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents [78.30630000529133]
本稿ではファジィトレース理論に基づくピラミッド型マルチモーダルメモリアーキテクチャMM-Memを提案する。
MM-Memメモリは階層的に感覚バッファ、エピソードストリーム、シンボリックに構造する。
実験により、MM-Memがオフラインタスクとストリーミングタスクの両方で有効であることが確認された。
論文 参考訳(メタデータ) (2026-03-02T05:12:45Z) - Understand Then Memory: A Cognitive Gist-Driven RAG Framework with Global Semantic Diffusion [14.538534837583931]
Retrieval-Augmented Generation (RAG)は、外部知識を取り入れることで、LLMの幻覚を効果的に緩和する。
本稿では,認知記憶過程をシミュレートするRAGフレームワークであるCogitoRAGを提案する。
CogitoRAGは最先端のRAG手法よりも優れており、複雑な知識の統合や推論において優れた能力を示している。
論文 参考訳(メタデータ) (2026-02-11T12:58:08Z) - Graph-based Agent Memory: Taxonomy, Techniques, and Applications [63.70340159016138]
メモリはLarge Language Model(LLM)ベースのエージェントの中核モジュールとして出現する。
さまざまなパラダイムの中でグラフは、関係依存をモデル化する本質的な能力のため、エージェントメモリの強力な構造として際立っている。
本調査では, エージェントメモリの総合的な検討について, グラフベースの観点から述べる。
論文 参考訳(メタデータ) (2026-02-05T13:49:05Z) - E-mem: Multi-agent based Episodic Context Reconstruction for LLM Agent Memory [4.8183840404266185]
E-memは、メモリ前処理からエピソードコンテキスト再構成に移行するフレームワークである。
E-memは54%以上のF1を達成し、最先端のGAMを7.75%上回り、トークンコストを70%以上削減している。
論文 参考訳(メタデータ) (2026-01-29T13:42:42Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - The AI Hippocampus: How Far are We From Human Memory? [77.04745635827278]
インプリシットメモリは、事前訓練されたトランスフォーマーの内部パラメータに埋め込まれた知識を指す。
明示メモリは、動的でクエリ可能な知識表現でモデル出力を増大させるように設計された外部ストレージと検索コンポーネントを含んでいる。
エージェントメモリは、自律エージェント内に永続的、時間的に拡張されたメモリ構造を導入する。
論文 参考訳(メタデータ) (2026-01-14T03:24:08Z) - SYNAPSE: Empowering LLM Agents with Episodic-Semantic Memory via Spreading Activation [29.545442480332515]
プリコンパイルされたリンクではなく静的を超越する統一メモリアーキテクチャであるSynapseを紹介する。
この結果から,Synapseは時間的およびマルチホップの複雑な推論タスクにおいて,最先端の手法を著しく上回ることがわかった。
私たちのコードとデータは受け入れ次第公開されます。
論文 参考訳(メタデータ) (2026-01-06T06:19:58Z) - From HNSW to Information-Theoretic Binarization: Rethinking the Architecture of Scalable Vector Search [0.7804710977378487]
本稿では,支配的な"HNSW + float32 + cosine similarity"スタックのアーキテクチャ的制約を分析する。
最大情報二項化(MIB)に基づく代替情報理論アーキテクチャの導入と実証評価を行った。
その結果,完全精度のシステムに匹敵する検索品質を示すとともに,レイテンシを大幅に低減し,高い要求レートで一定のスループットを維持することができた。
論文 参考訳(メタデータ) (2025-12-16T23:24:37Z) - Hierarchical Memory for High-Efficiency Long-Term Reasoning in LLM Agents [19.04968632268433]
大規模言語モデルエージェント(LLMエージェント)のための階層型メモリアーキテクチャを提案する。
各メモリベクトルは、次の層のセマンティック関連サブメモリを指し示す位置インデックスが埋め込まれている。
推論フェーズにおいて、インデックスベースのルーティング機構は、網羅的な類似性計算を行うことなく、効率的な層間検索を可能にする。
論文 参考訳(メタデータ) (2025-07-23T12:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。