論文の概要: PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents
- arxiv url: http://arxiv.org/abs/2605.19932v1
- Date: Tue, 19 May 2026 14:51:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.448888
- Title: PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents
- Title(参考訳): PEEK: 長期LLMエージェントの向き付けキャッシュとしてのコンテキストマップ
- Authors: Zhuohan Gu, Qizheng Zhang, Omar Khattab, Samuel Madden,
- Abstract要約: 大規模言語モデル(LLM)エージェントは、長く繰り返される外部コンテキストに対してますます機能する。
既存のアプローチでは、エージェントの軌道、原料への受動的アクセス、タスクレベルの戦略のいずれかを保持する。
我々は,この向きの知識をコンテキストマップとしてキャッシュし,維持するシステムであるPEEKを紹介する。
- 参考スコア(独自算出の注目度): 10.630364463975388
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model (LLM) agents increasingly operate over long and recurring external contexts, like document corpora and code repositories. Across invocations, existing approaches preserve either the agent's trajectory, passive access to raw material, or task-level strategies. None of them preserves what we argue is most needed for repeated same-context workloads: reusable orientation knowledge (e.g., what the context contains, how it is organized, and which entities, constants, and schemas have historically been useful) about the recurring context itself. We introduce PEEK, a system that caches and maintains this orientation knowledge as a context map: a small, constant-sized artifact in the agent's prompt that gives it a persistent peek into the external context. The map is maintained by a programmable cache policy with three modules: a Distiller that extracts transferable knowledge from inference-time signals, a Cartographer that translates it into structured edits, and a priority-based Evictor that enforces a fixed token budget. On long-context reasoning and information aggregation, PEEK improves over strong baselines by 6.3-34.0% while using 93-145 fewer iterations and incurring 1.7-5.8x lower cost than the state-of-the-art prompt-learning framework, ACE. On context learning, PEEK improves solving rate and rubric accuracy by 6.0-14.0% and 7.8-12.1%, respectively, at 1.4x lower cost than ACE. These gains generalize across LMs and agent architectures, including OpenAI Codex, a production-grade coding agent. Together, these results show that a context map helps long-context LLM agents interact with recurring external contexts more accurately and efficiently.
- Abstract(参考訳): 大規模言語モデル(LLM)エージェントは、ドキュメントコーパスやコードリポジトリなど、長く繰り返される外部コンテキストに対して、ますます運用されるようになる。
呼び出し全体を通じて、既存のアプローチはエージェントの軌道、原料への受動的アクセス、タスクレベルの戦略のいずれかを保持します。
再利用可能なオリエンテーションの知識(例えば、コンテキストが何を含んでいるか、どのように構成されているか、どのエンティティ、定数、スキーマが歴史的に有用か)。
PEEKは,エージェントのプロンプト内の小さな,一定サイズのアーティファクトをコンテキストマップとしてキャッシュし,維持するシステムである。
マップは、推論時信号から転送可能な知識を抽出するDistiller、構造化された編集に変換するCartographer、固定されたトークン予算を強制する優先度ベースのEvictorの3つのモジュールでプログラム可能なキャッシュポリシーによって維持される。
長いコンテキストの推論と情報集約において、PEEKは93-145のイテレーションを減らし、最先端のプロンプト学習フレームワークであるACEの1.7-5.8倍のコストで強力なベースラインを6.3-34.0%改善した。
文脈学習では、PEEKはACEの1.4倍のコストで6.0-14.0%と7.8-12.1%の解法率と解法精度を向上させる。
これらの成果は、プロダクショングレードのコーディングエージェントであるOpenAI Codexなど、LMとエージェントアーキテクチャにまたがって一般化される。
これらの結果から,長期コンテキストLLMエージェントが外部コンテキストとより正確かつ効率的に対話する上で,コンテキストマップが有効であることが示唆された。
関連論文リスト
- ByteRover: Agent-Native Memory Through LLM-Curated Hierarchical Context [7.906778920268216]
本稿では,メモリパイプラインを反転させるエージェントネイティブメモリアーキテクチャByteRoverを提案する。
ByteRoverは、ドメイン、トピック、サブトピック、エントリとして整理されたファイルベースの知識グラフである階層的コンテキストツリーにおける知識を表す。
LoCoMoとLongMemEvalの実験は、ByteRoverがLoCoMoの最先端の精度とLongMemEvalの競争結果を達成することを示した。
論文 参考訳(メタデータ) (2026-04-02T04:15:42Z) - Coding Agents are Effective Long-Context Processors [32.55917012704666]
長いコンテキスト処理は、潜在的注意から明示的で実行可能な相互作用へと外部化することができる。
コーディングエージェントは、平均して17.3%の最先端を公表している。
論文 参考訳(メタデータ) (2026-03-20T19:03:20Z) - LOCA-bench: Benchmarking Language Agents Under Controllable and Extreme Context Growth [32.1520194112537]
大規模言語モデル(LLM)は、長期の現実世界のタスクを実行する能力がますます高まっている。
文脈の量が増えるにつれて、その信頼性はしばしば悪化し、これは"context rot"と呼ばれる現象である。
論文 参考訳(メタデータ) (2026-02-08T13:20:39Z) - Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.17610617854247]
本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。
ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。
ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文 参考訳(メタデータ) (2025-12-31T14:03:39Z) - Event Extraction in Large Language Model [99.94321497574805]
私たちは、LLM中心のソリューションに認知的な足場を提供するシステムコンポーネントとして、EEは見なされるべきである、と論じます。
この調査では、EEのテキストとマルチモーダル設定、タスクと分類の整理、ルールベースとニューラルモデルから命令駆動および生成フレームワークへのメソッド進化のトレースについて取り上げている。
論文 参考訳(メタデータ) (2025-12-22T16:22:14Z) - RePo: Language Models with Context Re-Positioning [10.269249887819988]
In-context Learning is fundamental to modern Large Language Models (LLMs)
一般的なアーキテクチャは、線形または定位置の指標を割り当てることで、厳密で固定された文脈構造を課します。
本稿では,コンテキスト再配置による余剰負荷を低減する機構であるRePoを提案する。
論文 参考訳(メタデータ) (2025-12-16T13:30:30Z) - Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models [18.829572148850563]
ACE(Agentic Context Engineering)は、コンテキストを進化するプレイブックとして扱うフレームワークである。
エージェントとドメイン固有のベンチマークを通じて、ACEは一貫して強力なベースラインを上回っている。
ACEは、ラベル付けされた監視なしに効果的に適応することができ、代わりに自然な実行フィードバックを活用することができる。
論文 参考訳(メタデータ) (2025-10-06T09:30:18Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents [84.62985963113245]
我々は,長時間のマルチターンタスクに対して,エージェントが一定のメモリで動作可能な,エンドツーエンドの強化学習フレームワークMEM1を紹介する。
各ターンでMEM1は、メモリ統合と推論を共同でサポートするコンパクトな共有内部状態を更新する。
その結果,MEM1-7Bは16目的のマルチホップQAタスクにおいて,Qwen2.5-14B-Instructと比較してメモリ使用量を3.7倍削減し,3.5倍の性能向上を示す。
論文 参考訳(メタデータ) (2025-06-18T19:44:46Z) - KnowTrace: Bootstrapping Iterative Retrieval-Augmented Generation with Structured Knowledge Tracing [64.38243807002878]
我々は、大規模言語モデルにおけるコンテキスト過負荷を軽減するためのエレガントなRAGフレームワークであるKnowTraceを紹介する。
KnowTraceは、必要な知識三つ子を自律的に追跡して、入力された質問に関連する特定の知識グラフを整理する。
3つのマルチホップ質問応答ベンチマークで、既存のメソッドを一貫して上回っている。
論文 参考訳(メタデータ) (2025-05-26T17:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。