論文の概要: Beyond Compaction: Structured Context Eviction for Long-Horizon Agents
- arxiv url: http://arxiv.org/abs/2606.11213v1
- Date: Fri, 01 May 2026 18:39:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.840489
- Title: Beyond Compaction: Structured Context Eviction for Long-Horizon Agents
- Title(参考訳): 圧縮を超える:長軸エージェントの構造的コンテキスト推定
- Authors: Andrew Semenov, Svyatoslav Dorofeev,
- Abstract要約: 本研究では,長期LLMエージェントに効果的に非有界な作業地平線を与えるコンテキスト管理方式であるContext Window Lifecycle (CWL)を提案する。
セッションが履歴を蓄積するにつれて、CWLは、完了した意味論的に認識された定義を通じて、コンテキストを予算内に保持する。
本稿では, アノテーションプロトコル, エピソードグラフ, 消去ポリシー, トークンカウントループについて記述し, 長期エージェントベンチマークによるCWLの評価を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present Context Window Lifecycle (CWL), a context-management scheme that gives long-horizon LLM agents an effectively unbounded working horizon. As a session accumulates history, CWL keeps the context within budget through graduated, semantically-aware eviction: the agent annotates its trajectory as typed, dependency-linked episodes as work proceeds, and a deterministic, LLM-free policy evicts content in priority order within that structure when a token budget is exceeded. CWL preserves user turns and the exploratory context the agent is actively reasoning over, while aggressively shedding action episodes whose effects are already persisted in the environment, keeping active context near a stable ceiling that also avoids the performance degradation associated with very large prompts. Compared to summarization-based compaction, CWL avoids four well-known limitations: unpredictable lossiness, destruction of causal structure, blocking model cost, and compression-induced hallucination. Compared to recency truncation, CWL is semantically aware: it drops the oldest-and-most-recoverable content according to the dependency graph rather than oldest-in-time regardless of relevance. We describe the annotation protocol, the episode graph, the eviction policy, and the token-accounting loop, and evaluate CWL on long-horizon agentic benchmarks: a single agent session completing 89 sequential tasks across 80 million tokens with no measurable degradation in task accuracy relative to per-task isolated sessions
- Abstract(参考訳): 本研究では,長期LLMエージェントに効果的に非有界な作業地平線を与えるコンテキスト管理方式であるContext Window Lifecycle (CWL)を提案する。
セッションが履歴を蓄積すると、CWLは、完了したセマンティックな信念を通じて、コンテキストを予算内に保持する: エージェントは、作業が進むにつれて、その軌道をタイプされた、依存性にリンクされたエピソードとして注釈付けし、決定論的でLLMのないポリシーは、トークン予算を超えると、その構造内でコンテンツを優先的に削除する。
CWLは、エージェントが積極的に推論している探索的コンテキストを保ちつつ、環境にすでに効果が持続しているアクションエピソードを積極的に隠蔽し、非常に大きなプロンプトに関連するパフォーマンス劣化を回避する安定した天井付近でアクティブなコンテキストを維持する。
要約に基づく圧縮と比較して、CWLは予測不能な損失性、因果構造の破壊、ブロックモデルコスト、圧縮誘発幻覚の4つの有名な制限を回避している。
CWLは、関連性によらず、依存関係グラフに従って最も古い、最も回復可能なコンテンツを削除します。
アノテーションプロトコル,エピソードグラフ,エビクションポリシ,トークンカウントループを記述し,長期エージェントベンチマークによるCWLの評価を行う。
関連論文リスト
- IS-CoT: Breaking the Long-form Generation Collapse via Interleaved Structural Thinking [50.381430711141995]
本稿では,Interleaved Structure Chain-of-Thought (IS-CoT) フレームワークを紹介する。
IS-CoTは動的Plan-Write-Reflectサイクルを生成プロセスに埋め込む。
我々は、多教師パイプラインを介して、インターリーブされた推論トレースの高品質なデータセットを構築し、IS-Writer-8Bを訓練する。
論文 参考訳(メタデータ) (2026-06-08T16:31:00Z) - Agent-BRACE: Decoupling Beliefs from Actions in Long-Horizon Tasks via Verbalized State Uncertainty [70.43119366710778]
本稿では,Agens-BRACE: Agent Belief state Representation by Abstraction and Confidence Estimationを紹介する。
LLMエージェントを信頼状態モデルと政策モデルに分離し、強化学習を通じて協調的に最適化する手法である。
長期にわたる部分的に観察可能な言語環境において、平均して+14.5%の絶対的な改善を実現している。
論文 参考訳(メタデータ) (2026-05-12T02:37:04Z) - Slipstream: Trajectory-Grounded Compaction Validation for Long-Horizon Agents [8.880437352929315]
Slipstream(スリップストリーム)は、判断器を用いてエージェントの継続的な推論に対して候補の要約を検証する、軌道上の圧縮システムである。
タスクの精度を最大8.8ポイント改善し、エンドツーエンドのレイテンシを最大39.7%削減する。
論文 参考訳(メタデータ) (2026-05-09T00:47:43Z) - ClawVM: Harness-Managed Virtual Memory for Stateful Tool-Using LLM Agents [0.7377939119373589]
textscClawVMは仮想メモリ層で、最小フィデリティ不変量を持つ型付きページとして状態を管理する。
textscClawVMは、最小忠実度セットがトークン予算に適合するたびに、ポリシー管理可能なすべての障害を取り除く。
論文 参考訳(メタデータ) (2026-04-11T21:38:15Z) - UT-ACA: Uncertainty-Triggered Adaptive Context Allocation for Long-Context Inference [41.15520696680647]
長文推論は、注意の希釈とアウト・オブ・ディストリビューションの劣化により、大きな言語モデルでは困難である。
トークン単位の不確実性に基づいてコンテキストウィンドウを動的に調整する推論時フレームワークである Uncertainty-Triggered Adaptive Context Allocation (UT-ACA) を提案する。
UT-ACAは、長いコンテキスト設定で生成品質を保ちながら、平均的なコンテキスト使用量を大幅に削減することを示す実験である。
論文 参考訳(メタデータ) (2026-03-19T03:17:50Z) - V-CAGE: Context-Aware Generation and Verification for Scalable Long-Horizon Embodied Tasks [6.820118518027692]
V-CAGEは、大規模なセマンティックアライメントデータセットを生成するクローズドループフレームワークである。
本研究では,シーン合成における幾何学的整合性を実現する文脈認識型インスタンス化機構を提案する。
また、階層的な命令分解モジュールを用いて、抽象意図と低レベル制御のギャップを埋める。
論文 参考訳(メタデータ) (2026-01-21T16:41:51Z) - Deriving Character Logic from Storyline as Codified Decision Trees [67.01182739162142]
ロールプレイング(RP)エージェントは、さまざまな物語の文脈で一貫して行動するために行動プロファイルに依存する。
大規模物語データから実行可能かつ解釈可能な決定構造を誘導するデータ駆動型フレームワークであるCDT(Condified Decision Trees)を提案する。
論文 参考訳(メタデータ) (2026-01-15T05:12:43Z) - InfiAgent: An Infinite-Horizon Framework for General-Purpose Autonomous Agents [36.740230738304525]
InfiAgentは、タスクの持続時間に関係なく、エージェントの推論コンテキストを厳密に拘束する。
20Bのオープンソースモデルを持つInfiAgentは、より大きなプロプライエタリなシステムと競合する。
論文 参考訳(メタデータ) (2026-01-06T17:35:57Z) - AgentFold: Long-Horizon Web Agents with Proactive Context Management [98.54523771369018]
LLM ベースの Web エージェントは情報検索を大いに約束するが,その有効性はコンテキスト管理における基本的なトレードオフによって妨げられる。
本稿では,プロアクティブなコンテキスト管理を中心としたエージェントパラダイムであるAgentFoldを紹介する。
単純な微調整により,BrowseCompでは36.2%,BrowseComp-ZHでは47.3%を達成した。
論文 参考訳(メタデータ) (2025-10-28T17:51:50Z) - CLAUSE: Agentic Neuro-Symbolic Knowledge Graph Reasoning via Dynamic Learnable Context Engineering [47.77119771502664]
CLAUSEは,文脈構築を知識グラフ上の逐次決定プロセスとして扱うエージェント型3エージェントニューロシンボリックフレームワークである。
CLAUSEは提案したLagrangian-Constrained Multi-Agent Proximal Policy Optimization (LC-MAPPO)アルゴリズムを用いて、サブグラフアーキテクト、パスナビゲータ、コンテキストキュレーターの3つのエージェントを調整する。
HotpotQA、MetaQA、FactKG全体では、CLAUSEはより高いEM@1を得られると同時に、トークン予算が等しく低い場合のサブグラフの成長とエンドツーエンドのレイテンシを低減する。
論文 参考訳(メタデータ) (2025-09-25T11:43:08Z) - Enhancing Contrastive Learning with Noise-Guided Attack: Towards
Continual Relation Extraction in the Wild [57.468184469589744]
我々はtextbfContrative textbfLearning(NaCL) における textbfNoise-guided textbf attack という名前の耐雑音性コントラストフレームワークを開発する。
直接雑音除去や到達不能雑音回避と比較して,攻撃により与えられた雑音ラベルに一致するように特徴空間を変更する。
論文 参考訳(メタデータ) (2023-05-11T18:48:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。