論文の概要: AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents
- arxiv url: http://arxiv.org/abs/2603.27490v1
- Date: Sun, 29 Mar 2026 02:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.983015
- Title: AgentSwing: Adaptive Parallel Context Management Routing for Long-Horizon Web Agents
- Title(参考訳): AgentSwing: 長距離Webエージェントのための適応並列コンテキスト管理ルーティング
- Authors: Zhaopeng Feng, Liangcai Su, Zhen Zhang, Xinyu Wang, Xiaotian Zhang, Xiaobin Wang, Runnan Fang, Qi Zhang, Baixuan Li, Shihao Cai, Rui Ye, Hui Chen, Jiang Yong, Joey Tianyi Zhou, Chenxiong Qian, Pengjun Xie, Bryan Hooi, Zuozhu Liu, Jingren Zhou,
- Abstract要約: 大規模言語モデル(LLM)は、長距離情報探索のための自律エージェントへと進化する。
既存のコンテキスト管理手法は通常、軌道全体を通して単一の固定戦略にコミットする。
本稿では,探索効率と終端精度の2つの相補的な次元を通じて,長期的成功を特徴付ける確率的枠組みを提案する。
- 参考スコア(独自算出の注目度): 115.18197165538943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As large language models (LLMs) evolve into autonomous agents for long-horizon information-seeking, managing finite context capacity has become a critical bottleneck. Existing context management methods typically commit to a single fixed strategy throughout the entire trajectory. Such static designs may work well in some states, but they cannot adapt as the usefulness and reliability of the accumulated context evolve during long-horizon search. To formalize this challenge, we introduce a probabilistic framework that characterizes long-horizon success through two complementary dimensions: search efficiency and terminal precision. Building on this perspective, we propose AgentSwing, a state-aware adaptive parallel context management routing framework. At each trigger point, AgentSwing expands multiple context-managed branches in parallel and uses lookahead routing to select the most promising continuation. Experiments across diverse benchmarks and agent backbones show that AgentSwing consistently outperforms strong static context management methods, often matching or exceeding their performance with up to $3\times$ fewer interaction turns while also improving the ultimate performance ceiling of long-horizon web agents. Beyond the empirical gains, the proposed probabilistic framework provides a principled lens for analyzing and designing future context management strategies for long-horizon agents.
- Abstract(参考訳): 大規模言語モデル(LLM)が長期にわたる情報探索のために自律エージェントへと進化するにつれ、有限コンテキストキャパシティの管理が重要なボトルネックとなっている。
既存のコンテキスト管理手法は通常、軌道全体を通して単一の固定戦略にコミットする。
このような静的な設計は、いくつかの状態ではうまく機能するが、長い水平探索中に蓄積されたコンテキストの有用性と信頼性が進化するので適応できない。
この課題を定式化するために,探索効率と終端精度の2つの相補的な次元を通じて,長期的成功を特徴付ける確率的枠組みを導入する。
この観点から、状態対応型並列コンテキスト管理ルーティングフレームワークであるAgentSwingを提案する。
各トリガポイントにおいて、AgensSwingは複数のコンテキスト管理ブランチを並列に拡張し、ルックアヘッドルーティングを使用して最も有望な継続を選択する。
さまざまなベンチマークとエージェントバックボーンにわたる実験によると、AgentSwingは強い静的コンテキスト管理メソッドを一貫して上回り、多くの場合、パフォーマンスを最大3ドル以上の時間でマッチングまたは超える。
実証的な利得の他に、提案された確率的フレームワークは、長期エージェントの将来のコンテキスト管理戦略を分析し設計するための原則化されたレンズを提供する。
関連論文リスト
- AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts [78.33143446024485]
我々は、横方向思考パズルに基づく環境ロールアウトによるエージェントの評価を行うtextbfAgentLongBenchを紹介した。
このフレームワークは、知識集約的で知識のないシナリオにまたがる厳密な相互作用の軌跡を生成する。
論文 参考訳(メタデータ) (2026-01-28T16:05:44Z) - Self-Manager: Parallel Agent Loop for Long-form Deep Research [33.21617483821564]
本稿では,非同期および並列実行が可能な並列エージェントループであるSelf-Managerを紹介する。
メインスレッドは複数のサブスレッドを生成し、それぞれが独立したコンテキストを持ち、Thread Control Blocksを通じて反復的に管理することができる。
DeepResearch BenchでSelf-Managerをベンチマークしました。
論文 参考訳(メタデータ) (2026-01-25T15:18:53Z) - InfiAgent: An Infinite-Horizon Framework for General-Purpose Autonomous Agents [36.740230738304525]
InfiAgentは、タスクの持続時間に関係なく、エージェントの推論コンテキストを厳密に拘束する。
20Bのオープンソースモデルを持つInfiAgentは、より大きなプロプライエタリなシステムと競合する。
論文 参考訳(メタデータ) (2026-01-06T17:35:57Z) - Context as a Tool: Context Management for Long-Horizon SWE-Agents [38.950807465620365]
我々は,エージェントの意思決定プロセスに統合された呼び出し可能なツールにコンテキストメンテナンスを高める新しいコンテキスト管理パラダイムであるCATを提案する。
CATは、安定なタスクセマンティクス、凝縮した長期記憶、高忠実な短期相互作用からなる構造化されたコンテキストワークスペースを形式化する。
我々は,SWE圧縮機が57.6%の解率に達し,ReActベースのエージェントと静的圧縮ベースラインを著しく上回っていることを示す。
論文 参考訳(メタデータ) (2025-12-26T17:15:47Z) - SCOPE: Prompt Evolution for Enhancing Agent Effectiveness [53.75986399936395]
大規模言語モデル(LLM)エージェントは、大規模で動的なコンテキストを生成する環境にますますデプロイされている。
エージェントはこのコンテキストにアクセスできますが、静的なプロンプトには効果的に管理するメカニズムがありません。
textbfSCOPE (Self-evolving Context Optimization via Prompt Evolution) を導入する。
本稿では,戦術的特異性(即時誤りの解消)と戦略的汎用性(長期原則の進化)のバランスをとるデュアルストリーム機構を提案する。
論文 参考訳(メタデータ) (2025-12-17T12:25:05Z) - Scaling Long-Horizon LLM Agent via Context-Folding [46.685552398338295]
エージェントが作業コンテキストを積極的に管理することを可能にするフレームワークであるContext-Foldingを紹介します。
エージェントは、サブトラックに手続き的に分岐してサブタスクを処理し、完了時に折り畳み、結果の簡潔な要約を保持しながら中間ステップを崩壊させる。
論文 参考訳(メタデータ) (2025-10-13T22:00:58Z) - UltraHorizon: Benchmarking Agent Capabilities in Ultra Long-Horizon Scenarios [63.67884284105684]
textbfUltraHorizonは、複雑な現実世界の課題に不可欠な基礎的能力を測定する新しいベンチマークである。
エージェントは、隠されたルールを反復的に発見しなければならない、長期にわたる発見タスクで設計されている。
実験の結果, LLM-agents はこれらの設定において常に不利な成績を示し, ヒトは高いスコアを得ることができた。
論文 参考訳(メタデータ) (2025-09-26T02:04:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。