論文の概要: Organize then Retrieve: Hierarchical Memory Navigation for Efficient Agents
- arxiv url: http://arxiv.org/abs/2606.11680v1
- Date: Wed, 10 Jun 2026 05:49:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.312614
- Title: Organize then Retrieve: Hierarchical Memory Navigation for Efficient Agents
- Title(参考訳): 組織化して検索する: 効率的なエージェントのための階層型メモリナビゲーション
- Authors: Hao-Lun Hsu, Nikki Lijing Kuang, Boyi Liu, Zhewei Yao, Yuxiong He,
- Abstract要約: HORMAは、大規模な言語モデルのための階層的なオーガナイズ・アンド・レトリーブメモリエージェントである。
ワーキングメモリを構造化メモリ構築とナビゲーションベースの検索の2つのステージに分割する。
優れた効率性とパフォーマンスのトレードオフを一貫して達成し、目に見えないタスクに効果的に一般化する。
- 参考スコア(独自算出の注目度): 29.28371047415946
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language model (LLM) agents struggle with long-horizon tasks due to their inherent statelessness, requiring all task-relevant information to be encoded in growing input contexts. The resulting degraded reasoning quality, increased inference cost, and higher latency necessitate efficient working memory mechanisms. However, existing approaches either rely on lossy compression or similarity-based retrieval, which often fail to capture temporal structure and causal dependencies required for multi-step agentic tasks. In this work, we present HORMA, a Hierarchical Organize-and-Retrieve Memory Agent that organizes experience into a file-system-like hierarchical structure, where summarized entities are linked to the corresponding raw trajectories, enabling efficient access without losing detailed information. HORMA decomposes working memory into two stages: structured memory construction and navigation-based retrieval. The construction module iteratively refines how experiences are structured by distinguishing between failures caused by missing information and those caused by misleading or overloaded context. The navigation module retrieves task-relevant context by traversing the hierarchy using a lightweight agent trained with reinforcement learning to select minimal yet sufficient context, thereby reducing latency along the critical execution path. Across ALFWorld, LoCoMo, and LongMemEval, HORMA improves task performance under constrained context budgets while requiring at most 22.17% of the baseline token usage in long conversation tasks. Compared to existing methods, it consistently achieves better efficiency-performance trade-offs and generalizes effectively to unseen tasks.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、その固有のステートレス性のために、長い水平タスクに苦しむ。
その結果、劣化した推論品質、推論コストの増大、高いレイテンシは効率的なワーキングメモリ機構を必要とする。
しかし、既存の手法は圧縮の欠如や類似性に基づく検索に依存しており、多段階のエージェントタスクに必要な時間的構造や因果関係を捉えるのに失敗することが多い。
本稿では,階層型組織記憶エージェントであるHORMAについて述べる。このHORMAは,経験をファイルシステムのような階層構造に整理し,要約されたエンティティを対応する生のトラジェクトリにリンクし,詳細な情報を失うことなく効率的なアクセスを可能にする。
HORMAは、ワーキングメモリを構造化メモリ構築とナビゲーションベースの検索の2つのステージに分解する。
構築モジュールは、情報不足に起因する障害と、誤解を招いたり過負荷になったりするコンテキストによって引き起こされる障害を区別することで、経験がどのように構造化されるかを繰り返し洗練する。
ナビゲーションモジュールは、強化学習で訓練された軽量エージェントを使用して階層をトラバースすることでタスク関連コンテキストを検索し、最小限の十分なコンテキストを選択することにより、クリティカル実行パスに沿ったレイテンシを低減する。
ALFWorld、LoCoMo、LongMemEval全体で、HORMAは制約付きコンテキスト予算下でのタスクパフォーマンスを改善し、長い会話タスクにおいて、ベースライントークンの使用の少なくとも22.17%を必要としている。
既存の手法と比較して、優れた効率と性能のトレードオフを一貫して達成し、目に見えないタスクに効果的に一般化する。
関連論文リスト
- Task-Aware Structured Memory for Dynamic Multi-modal In-Context Learning [40.577016426387694]
MLLM(Multi-modal large language model)は、テキスト内学習(ICL)に依存して高速なタスク適応を行う。
既存のメモリ圧縮アプローチは、厳密なトークン除去やサンプル依存の重要度推定に依存している。
TASMは,タスク認識,構造保存,動的アクセス可能なメモリ構成を通じて,これらの制約に対処する,トレーニング不要のフレームワークである。
論文 参考訳(メタデータ) (2026-06-10T09:30:25Z) - AMA: Adaptive Memory via Multi-Agent Collaboration [54.490349689939166]
複数の粒度にまたがるメモリ管理に協調エージェントを活用する新しいフレームワークであるAMA(Adaptive Memory via Multi-Agent Collaboration)を提案する。
AMAは、ステート・オブ・ザ・アートのベースラインを著しく上回り、トークンの消費をフルコンテキストの手法と比べて約80%削減する。
論文 参考訳(メタデータ) (2026-01-28T08:09:49Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - CAM: A Constructivist View of Agentic Memory for LLM-Based Reading Comprehension [55.29309306566238]
現在のLarge Language Models (LLM) は、長文文書を解釈する際に圧倒的な情報量に直面している。
この課題は、バニラLSMを自律的な読み出しエージェントに高めることができる凝集性メモリモジュールの必須性を高める。
我々はジャン・ピアジェの構成主義理論(Constructivist Theory)からインスピレーションを得て、エージェントメモリの3つの特性(構造化スキーマ、フレキシブルな同化、動的調節)を表現した。
論文 参考訳(メタデータ) (2025-10-07T02:16:30Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z) - Task Memory Engine (TME): Enhancing State Awareness for Multi-Step LLM Agent Tasks [0.0]
階層型タスクメモリツリー(TMT)を用いてタスク実行を追跡する軽量で構造化されたメモリモジュールを提案する。
TMEはグラフ対応に設計されており、再利用可能なサブステップ、タスクパスの収束、依存関係の共有をサポートする。
論文 参考訳(メタデータ) (2025-04-11T13:38:36Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。