論文の概要: Grounding Agent Memory in Contextual Intent
- arxiv url: http://arxiv.org/abs/2601.10702v1
- Date: Thu, 15 Jan 2026 18:55:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.285331
- Title: Grounding Agent Memory in Contextual Intent
- Title(参考訳): 文脈インテントにおける接地エージェント記憶
- Authors: Ruozhen Yang, Yucheng Jiang, Yueqi Jiang, Priyanka Kargupta, Yunyi Zhang, Jiawei Han,
- Abstract要約: STITCHは、各トラジェクトリステップに構造化された検索キュー、コンテキスト意図をインデックスし、現在のステップの意図にマッチして履歴を検索するメモリシステムである。
CAME-Benchは,現実的,動的,目標指向の軌道における文脈認識検索のベンチマークである。
分析の結果,意図インデクシングは検索ノイズを大幅に低減し,頑健なロングホライゾン推論のためのインテント・アウェア・メモリをサポートした。
- 参考スコア(独自算出の注目度): 22.299598216046103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying large language models in long-horizon, goal-oriented interactions remains challenging because similar entities and facts recur under different latent goals and constraints, causing memory systems to retrieve context-mismatched evidence. We propose STITCH (Structured Intent Tracking in Contextual History), an agentic memory system that indexes each trajectory step with a structured retrieval cue, contextual intent, and retrieves history by matching the current step's intent. Contextual intent provides compact signals that disambiguate repeated mentions and reduce interference: (1) the current latent goal defining a thematic segment, (2) the action type, and (3) the salient entity types anchoring which attributes matter. During inference, STITCH filters and prioritizes memory snippets by intent compatibility, suppressing semantically similar but context-incompatible history. For evaluation, we introduce CAME-Bench, a benchmark for context-aware retrieval in realistic, dynamic, goal-oriented trajectories. Across CAME-Bench and LongMemEval, STITCH achieves state-of-the-art performance, outperforming the strongest baseline by 35.6%, with the largest gains as trajectory length increases. Our analysis shows that intent indexing substantially reduces retrieval noise, supporting intent-aware memory for robust long-horizon reasoning.
- Abstract(参考訳): 長期にわたって大きな言語モデルをデプロイすることは、同じエンティティや事実が異なる遅延した目標や制約の下で再帰し、メモリシステムがコンテキストミスの証拠を取得するため、依然として困難である。
そこで本稿では,STITCH (Structured Intent Tracking in Contextual History) を提案する。
コンテキスト意図(Contextual intent)は、繰り返し言及を曖昧にし、干渉を減らすコンパクトな信号を提供する。(1) テーマセグメントを定義する現在の潜在目標、(2) アクションタイプ、(3) 属性が重要となる有能なエンティティタイプ。
推論中、STITCHはインテント互換性によってメモリスニペットをフィルタリングし優先順位付けし、意味論的に類似しているがコンテキスト非互換な履歴を抑圧する。
CAME-Benchは,現実的,動的,目標指向の軌道における文脈認識検索のベンチマークである。
CAME-Bench と LongMemEval 全体では、STITCH は最先端のパフォーマンスを達成し、軌道長が増大するにつれて、最強のベースラインを35.6%上回っている。
分析の結果,意図インデクシングは検索ノイズを大幅に低減し,頑健なロングホライゾン推論のためのインテント・アウェア・メモリをサポートした。
関連論文リスト
- ES-Mem: Event Segmentation-Based Memory for Long-Term Dialogue Agents [25.10969436399974]
ES-Memは、長期のインタラクションを、異なる境界を持つセマンティックな一貫性のあるイベントに分割するフレームワークである。
ES-Memはベースライン法よりも一貫した性能向上を示す。
提案したイベントセグメンテーションモジュールは、対話セグメンテーションデータセットに堅牢な適用性を示す。
論文 参考訳(メタデータ) (2026-01-12T14:33:32Z) - Memory Matters More: Event-Centric Memory as a Logic Map for Agent Searching and Reasoning [55.251697395358285]
大規模言語モデル(LLM)は、環境を推論し、計画し、相互作用するインテリジェントエージェントとして、ますます多くデプロイされている。
長期のシナリオに効果的にスケールするには、そのようなエージェントの重要な機能は、過去の経験を保持し、整理し、取り出すことができるメモリメカニズムである。
イベント理論にインスパイアされたイベント中心のメモリフレームワークであるCompassMemを提案する。
論文 参考訳(メタデータ) (2026-01-08T08:44:07Z) - SimpleMem: Efficient Lifelong Memory for LLM Agents [73.74399447715052]
セマンティックロスレス圧縮に基づく効率的なメモリフレームワークSimpleMemを紹介する。
本稿では,情報密度とトークン利用量の最大化を目的とした3段階パイプラインを提案する。
ベンチマークデータセットを用いた実験により,提案手法は精度,検索効率,推論コストにおいて,ベースラインアプローチを一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2026-01-05T21:02:49Z) - AssoMem: Scalable Memory QA with Multi-Signal Associative Retrieval [28.858496175399623]
本稿では,対話発話をアンロックして手がかりを自動的に抽出する連想記憶グラフ構築フレームワークAssoMemを提案する。
AssoMemはSOTAベースラインを一貫して上回り、コンテキスト対応メモリリコールにおいてその優位性を検証する。
論文 参考訳(メタデータ) (2025-10-12T01:23:23Z) - WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文 参考訳(メタデータ) (2025-09-16T17:57:21Z) - Semantic Anchoring in Agentic Memory: Leveraging Linguistic Structures for Persistent Conversational Context [0.0]
本稿では,ベクトルベースストレージを明示的な言語的手がかりで強化し,ニュアンス付きコンテキスト豊富な交換のリコールを改善するハイブリッド型エージェントメモリアーキテクチャを提案する。
適応した長期対話データセットの実験では、意味的アンカーがRAGベースラインよりも最大18%、事実的リコールと談話のコヒーレンスを改善することが示されている。
論文 参考訳(メタデータ) (2025-08-18T05:14:48Z) - ELITE: Embedding-Less retrieval with Iterative Text Exploration [5.8851517822935335]
大規模言語モデル(LLM)は自然言語処理において顕著な進歩を遂げた。
長期のコンテキスト制約を維持する能力は、ドキュメントレベルやマルチターンタスクのパフォーマンスを制限します。
論文 参考訳(メタデータ) (2025-05-17T08:48:43Z) - From Objects to Events: Unlocking Complex Visual Understanding in Object Detectors via LLM-guided Symbolic Reasoning [71.41062111470414]
現在のオブジェクト検出器は、エンティティのローカライゼーションと分類において優れているが、イベント認識機能には固有の制限がある。
本稿では,単なるオブジェクト認識以上の標準オブジェクト検出能力を,複雑なイベント理解に拡張する新しいフレームワークを提案する。
私たちの重要なイノベーションは、高価なタスク固有のトレーニングを必要とせずに、オブジェクト検出とイベント理解のセマンティックなギャップを埋めることです。
論文 参考訳(メタデータ) (2025-02-09T10:30:54Z) - The Devil is in the Spurious Correlations: Boosting Moment Retrieval with Dynamic Learning [49.40254251698784]
本稿では,モーメント検索のための動的学習手法を提案する。
まず、クエリーモーメントの動的コンテキストを構築するための新しいビデオ合成手法を提案する。
第2に、背景との過度な関連を緩和するために、テキストと力学の相互作用を組み込むことで、時間的に表現を強化する。
論文 参考訳(メタデータ) (2025-01-13T13:13:06Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。