論文の概要: AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents
- arxiv url: http://arxiv.org/abs/2603.03290v1
- Date: Thu, 05 Feb 2026 22:19:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:08.111756
- Title: AriadneMem: Threading the Maze of Lifelong Memory for LLM Agents
- Title(参考訳): AriadneMem: LLMエージェントの生涯記憶の迷路をスレッディングする
- Authors: Wenhui Zhu, Xiwen Chen, Zhipeng Wang, Jingjing Wang, Xuanzhao Dong, Minzhou Huang, Rui Cai, Hejian Sang, Hao Wang, Peijie Qiu, Yueyue Deng, Prayag Tiwari, Brendan Hogan Rappazzo, Yalin Wang,
- Abstract要約: 本稿では,長期対話における問題に対処する構造化メモリシステムであるAriadneMemを提案する。
AriadneMem は textbfMulti-Hop F1 を 15.2% 改善し, textbfAverage F1 を 9.0 % 改善したことを示す。
グラフ層への推論をオフロードすることで、AriadneMemはtextbf497コンテキストトークンのみを使用して、textbftotalランタイムを77.8%削減する。
- 参考スコア(独自算出の注目度): 26.029549618318086
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Long-horizon LLM agents require memory systems that remain accurate under fixed context budgets. However, existing systems struggle with two persistent challenges in long-term dialogue: (i) \textbf{disconnected evidence}, where multi-hop answers require linking facts distributed across time, and (ii) \textbf{state updates}, where evolving information (e.g., schedule changes) creates conflicts with older static logs. We propose AriadneMem, a structured memory system that addresses these failure modes via a decoupled two-phase pipeline. In the \textbf{offline construction phase}, AriadneMem employs \emph{entropy-aware gating} to filter noise and low-information message before LLM extraction and applies \emph{conflict-aware coarsening} to merge static duplicates while preserving state transitions as temporal edges. In the \textbf{online reasoning phase}, rather than relying on expensive iterative planning, AriadneMem executes \emph{algorithmic bridge discovery} to reconstruct missing logical paths between retrieved facts, followed by \emph{single-call topology-aware synthesis}. On LoCoMo experiments with GPT-4o, AriadneMem improves \textbf{Multi-Hop F1 by 15.2\%} and \textbf{Average F1 by 9.0\%} over strong baselines. Crucially, by offloading reasoning to the graph layer, AriadneMem reduces \textbf{total runtime by 77.8\%} using only \textbf{497} context tokens. The code is available at https://github.com/LLM-VLM-GSL/AriadneMem.
- Abstract(参考訳): ロングホライゾンLSMエージェントは、固定されたコンテキスト予算の下で正確であるメモリシステムを必要とする。
しかし、既存のシステムは長期的な対話において2つの永続的な課題に苦しむ。
i) マルチホップ回答が時間にわたって分散したリンク事実を必要とする場合、及び
(ii) \textbf{state update} – 進化する情報(例えばスケジュール変更)が古い静的ログとの競合を生成する。
本稿では、分離した2相パイプラインを介して、これらの障害モードに対処する構造化メモリシステムであるAriadneMemを提案する。
textbf{offline construction phase} では、AriadneMem は LLM 抽出の前にノイズや低情報メッセージのフィルタリングに \emph{entropy-aware gating} を使用し、時間エッジとして状態遷移を保持しながら静的な重複をマージするために \emph{conflict-aware coarsening} を適用している。
高価な反復計画に頼るのではなく、'textbf{online reasoning phase} において、AriadneMem は、取得した事実間の論理的経路を再構築するために \emph{algorithmic bridge discovery} を実行し、次に 'emph{single-call topology-aware synthesis} を実行する。
GPT-4o を用いた LoCoMo の実験では、アリアドネメムは強基底線上で \textbf{Multi-Hop F1 を 15.2\% 、 \textbf{Average F1 を 9.0\% 改善する。
重要なことに、グラフ層に推論をオフロードすることで、AriadneMemは \textbf{total Runtime を 77.8\%} に減らし、 \textbf{497} コンテキストトークンのみを使用する。
コードはhttps://github.com/LLM-VLM-GSL/AriadneMemで入手できる。
関連論文リスト
- Learning to Forget Attention: Memory Consolidation for Adaptive Compute Reduction [6.908972852063454]
状態空間モデルと注意を結合したハイブリッドアーキテクチャは、高い効率品質のトレードオフを実現している。
テキストbf88%の注意操作は、モデルの隠れた状態から既に予測可能な情報を取得する。
textbfours (textbfConsolidation-based textbfRouting for textbfAdaptive textbfMemory) は生物学的にインスパイアされたメモリ統合機構で、エピソード検索をパラメトリックセマンティックメモリに徐々に蒸留する。
論文 参考訳(メタデータ) (2026-02-12T17:40:15Z) - LoRA-Drop: Temporal LoRA Decoding for Efficient LLM Inference [4.771191010592548]
textbfLoRA-Dropは,中間層の固定部分集合に時空間計算スケジュールを適用することでデコーディングを高速化する,プラグアンドプレイ推論フレームワークである。
LoRA-Dropはルーティングネットワークを必要とせず、標準的なKVキャッシュと互換性があり、LoRAステップ中にドロップパブル層でKV更新をスキップして定期的にリフレッシュすることで、KVキャッシュのフットプリントを削減することができる。
論文 参考訳(メタデータ) (2026-01-05T21:47:47Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - Shorter but not Worse: Frugal Reasoning via Easy Samples as Length Regularizers in Math RLVR [21.593023093509302]
我々は, 緩やかに上向きに上向きに重み付けする問題は, 暗黙的な長さ正規化器として機能することを示した。
textitQwen3-4B-Thinking-2507でこのアプローチを使用した実験では,ベースラインパス@1 AIME25の精度が向上し,平均2倍近いソリューションが生成される。
論文 参考訳(メタデータ) (2025-11-02T17:29:16Z) - Mem4Nav: Boosting Vision-and-Language Navigation in Urban Environments with a Hierarchical Spatial-Cognition Long-Short Memory System [9.687946545604492]
大規模都市環境における視覚・言語ナビゲーション (VLN) は、複雑な場面で言語指導を行うための具体的エージェントを必要とする。
階層型空間認識長短メモリシステムである textbfMem4Nav を導入し,任意のVLNバックボーンを拡張できる。
論文 参考訳(メタデータ) (2025-06-24T09:00:43Z) - Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights [75.83625828306839]
textbfDrag-and-Drop LLMs (textitDnD)は、未ラベルのタスクプロンプトをLoRAの重み更新に直接マッピングすることで、タスク単位のトレーニングを廃止する。
ライトウェイトテキストエンコーダは、各プロンプトバッチを条件埋め込みに蒸留し、カスケードされた超畳み込みデコーダによって全LORA行列に変換する。
論文 参考訳(メタデータ) (2025-06-19T15:38:21Z) - On-the-Fly Adaptive Distillation of Transformer to Dual-State Linear Attention [53.22963042513293]
大規模言語モデル(LLM)は、自己アテンションを通じてグローバルトークンの依存関係をキャプチャするが、長い入力に対する計算とメモリコストに直面する。
まず,二状態線形注意(Dual-state linear attention, A)を提案する。これは2つの隠れ状態を保持する設計であり,その1つは,リニアアテンションアーキテクチャの典型的な短距離バイアスを緩和し,リニアアテンションを追尾するものである。
本稿では,DSLA層を段階的に置き換えるオンライン適応蒸留フレームワークであるDSLA-Serveを紹介する。
論文 参考訳(メタデータ) (2025-06-11T01:25:06Z) - Two-Timescale Gradient Descent Ascent Algorithms for Nonconvex Minimax Optimization [77.3396841985172]
我々は、構造化された非極小最適化問題の解法として、2時間勾配上昇(TTGDA)を統一的に解析する。
我々の貢献はTTGDAアルゴリズムを設計することであり、設定を超えて効果的です。
論文 参考訳(メタデータ) (2024-08-21T20:14:54Z) - Hierarchical Context Merging: Better Long Context Understanding for Pre-trained LLMs [61.40047491337793]
本稿では,大規模言語モデルの制約を克服する新しいトレーニングフリースキームである階層型cOntext MERging(HOMER)を提案する。
HomeRは、長いインプットを管理可能なチャンクに分割する、分別/対数アルゴリズムを使用する。
トークン削減技術がマージ毎に先行し、メモリ使用効率が保証される。
論文 参考訳(メタデータ) (2024-04-16T06:34:08Z) - Interleaving Retrieval with Chain-of-Thought Reasoning for
Knowledge-Intensive Multi-Step Questions [50.114651561111245]
マルチステップ質問応答のための新しいアプローチであるIRCoTを提案する。
CoTのステップで検索をインターリーブし、CoTで検索を誘導し、検索結果を用いてCoTを改善する。
論文 参考訳(メタデータ) (2022-12-20T18:26:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。