論文の概要: EvoEmbedding: Evolvable Representations for Long-Context Retrieval and Agentic Memory
- arxiv url: http://arxiv.org/abs/2606.21649v1
- Date: Fri, 19 Jun 2026 17:59:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 04:18:34.150266
- Title: EvoEmbedding: Evolvable Representations for Long-Context Retrieval and Agentic Memory
- Title(参考訳): EvoEmbedding: 長期検索とエージェント記憶のための進化可能な表現
- Authors: Chang Nie, Chaoyou Fu, Junlan Feng, Caifeng Shan,
- Abstract要約: EvoEmbeddingは、検索のための進化可能な表現を生成する新しい埋め込みモデルである。
情報は動的でシーケンシャルで、継続的な状態追跡を必要とする、長期コンテキストシナリオ用に調整されている。
EvoEmbeddingは、パフォーマンスを高めるためにエージェントにシームレスに統合される。
- 参考スコア(独自算出の注目度): 46.411965241105804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing embedding models are inherently static: they encode text segments in isolation, ignoring their surrounding context and temporal order. This paper introduces EvoEmbedding, a novel embedding model that generates evolvable representations for retrieval. It is tailored for long-context scenarios, where information is dynamic, sequential, and requires continuous state tracking. Our design is simple: EvoEmbedding maintains a continuously updated latent memory as it sequentially processes inputs, and uses it alongside the raw content to jointly generate evolvable embeddings. Consequently, for the same query, our model adapts its representation to retrieve distinct targets based on the evolving context, going beyond static semantic search. To equip the model with this capability, we construct EvoTrain-180K, a diverse dataset for the joint optimization of latent memory and retrieval. Furthermore, we introduce a memory queue to prevent representation collapse during recurrent encoding, alongside segment-batching techniques that tackle significant length variance and accelerate training by 3.8$\times$. Extensive experiments show that our model not only outperforms larger-scale specialists (e.g., Qwen3-Embedding-8B and KaLM-Embedding-Gemma3-12B) across a range of long-context retrieval benchmarks, but also generalizes well to downstream tasks (e.g., personalization) with contexts 10$\times$ longer than its training window. Notably, EvoEmbedding seamlessly integrates into agentic workflows to boost performance. For instance, a naive RAG pipeline equipped with our model surpasses dedicated agentic memory systems. Project Page: https://clare-nie.github.io/EvoEmbedding.
- Abstract(参考訳): 既存の埋め込みモデルは本質的に静的で、テキストセグメントを分離してエンコードし、周囲のコンテキストや時間順を無視します。
本稿では,進化可能な表現を生成する新しい埋め込みモデルであるEvoEmbeddingを紹介する。
情報は動的でシーケンシャルで、継続的な状態追跡を必要とする、長期コンテキストシナリオ用に調整されている。
EvoEmbeddingは、連続的に更新された潜時メモリを維持し、入力を逐次処理し、それを生のコンテンツと一緒に使用して、進化可能な埋め込みを生成する。
したがって、同じクエリに対して、我々のモデルは、静的なセマンティックサーチを超えて、進化するコンテキストに基づいて異なるターゲットを検索するために、その表現に適応する。
この能力をモデルとして,潜在記憶と検索の協調最適化のための多様なデータセットであるEvoTrain-180Kを構築した。
さらに,逐次符号化における表現の崩壊を防止するためのメモリキューを導入し,セグメントバッチ技術により,大幅な長さの分散に対処し,3.8$\times$のトレーニングを高速化する。
広範囲な実験により,我々のモデルは,大規模専門家(例えば Qwen3-Embedding-8B や KaLM-Embedding-Gemma3-12B など)よりも長いコンテキストの検索ベンチマークに優れるだけでなく,トレーニングウィンドウよりも10$\times$長いコンテキストで,下流タスク(例えばパーソナライズ)に最適化できることがわかった。
特に、EvoEmbeddingは、パフォーマンスを高めるためにエージェントワークフローにシームレスに統合される。
例えば、当社のモデルを備えたナイーブなRAGパイプラインは、専用のエージェントメモリシステムを超えています。
Project Page: https://clare-nie.github.io/EvoEmbedding.com
関連論文リスト
- From Atom to Community: Structured and Evolving Agent Memory for User Behavior Modeling [25.74573956240653]
STEAM(textittextbfSTructured and textbfEvolving textbfAgent textbfMemory)は、エージェントメモリの編成と更新方法を再定義する新しいフレームワークである。
好みを原子記憶単位に分解し、それぞれが観察された行動に明示的なリンクで異なる関心領域をキャプチャする。
協調的パターンを活用するために、STEAMは、ユーザ間で類似した記憶をコミュニティに整理し、信号伝達のためのプロトタイプメモリを生成する。
論文 参考訳(メタデータ) (2026-01-23T16:24:57Z) - Evo-Memory: Benchmarking LLM Agent Test-time Learning with Self-Evolving Memory [89.65731902036669]
Evo-Memoryは、大規模言語モデル(LLM)エージェントで自己進化型メモリを評価するための、ストリーミングベンチマークとフレームワークである。
10以上の代表的なメモリモジュールを評価し、10種類の多ターンゴール指向およびシングルターン推論およびQAデータセットで評価した。
論文 参考訳(メタデータ) (2025-11-25T21:08:07Z) - SitEmb-v1.5: Improved Context-Aware Dense Retrieval for Semantic Association and Long Story Comprehension [77.93156509994994]
本研究では,検索性能を向上させるために,より広いコンテキストウインドウに条件付きで短いチャンクを表現する方法を示す。
既存の埋め込みモデルは、そのような場所のコンテキストを効果的にエンコードするのに十分な装備がない。
我々の手法は、最先端の埋め込みモデルよりも大幅に優れている。
論文 参考訳(メタデータ) (2025-08-03T23:59:31Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - PersonalAI: A Systematic Comparison of Knowledge Graph Storage and Retrieval Approaches for Personalized LLM agents [15.524189150821147]
大規模言語モデル (LLM) とRetrieval-Augmented Generation (RAG) の組み合わせは、複雑な長期的相互作用においてスケールできない。
LLM自体によって自動的に構築・更新される知識グラフに基づくフレキシブルな外部メモリフレームワークを提案する。
AriGraphアーキテクチャに基づいて、標準エッジと2種類のハイパーエッジの両方をサポートする新しいハイブリッドグラフ設計を導入する。
本稿では,TriviaQA,HotpotQA,DiaASQ-demonstratingの3つのベンチマークを用いて,メモリと検索の異なる構成でタスクに応じて最適な性能が得られることを示す。
論文 参考訳(メタデータ) (2025-06-20T13:52:15Z) - KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable Approaches [52.02764371205856]
長期の文脈能力は、大規模言語モデル(LLM)にとって重要な能力である
この研究は、現在の手法の分類を提供し、長いコンテキストタスクの7つのカテゴリにまたがる10以上の最先端のアプローチを評価する。
論文 参考訳(メタデータ) (2024-07-01T17:59:47Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。