論文の概要: Skim: Speculative Execution for Fast and Efficient Web Agents
- arxiv url: http://arxiv.org/abs/2605.16565v2
- Date: Tue, 19 May 2026 13:45:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:08.459277
- Title: Skim: Speculative Execution for Fast and Efficient Web Agents
- Title(参考訳): Skim: 高速で効率的なWebエージェントのための投機的実行
- Authors: Mike Wong, Kevin Hsieh, Suman Nath, Ravi Netravali,
- Abstract要約: SkimはWebエージェントの投機的実行フレームワークである。
これは、目的を持ったウェブサイトの予測可能な構造を利用する。
Skimは、タスク毎の平均的なコストを1.9倍、レイテンシを33.4%削減する。
- 参考スコア(独自算出の注目度): 8.47432001892345
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Skim is a speculative execution framework for web agents that exploits the predictable structure of purpose-built websites. Today's web-agent expense is not intrinsic to the tasks but a property of how agents are composed: frontier-model inference, browser rendering, and ReAct-style planning are applied to every step of every task regardless of complexity. Skim's key observation is that websites enforce stable URL patterns, answer formats, and task-to-trajectory mappings across queries of the same type, so most queries can bypass these heavyweight components entirely. An offline profiler captures these patterns once per site. At runtime, Skim matches each query to a template, synthesizes the destination URL, and extracts the answer with a small model. A lightweight verifier gates each fast-path output against the query and schema; rare misspeculations cascade to the full agent, warm-started by the fast path's final URL to preserve upstream trajectory progress. Across standard web-agent benchmarks paired with three backboneagents (WebVoyager, AgentOccam, BrowserUse), Skim reduces median per-task cost by 1.9x and latency by 33.4% with no accuracy loss.
- Abstract(参考訳): SkimはWebエージェントのための投機的実行フレームワークで、目的のWebサイトの予測可能な構造を利用する。
今日のWebエージェントの費用はタスクに固有のものではなく、フロンティアモデル推論、ブラウザレンダリング、ReActスタイルのプランニングといったエージェントがどのように構成されるかの特性が、複雑さに関係なくすべてのタスクのステップに適用されます。
Skimのキーとなる観察は、Webサイトが安定したURLパターン、応答形式、同じタイプのクエリをまたいだタスク・ツー・トラジェクトリマッピングを強制していることである。
オフラインプロファイラはサイトごとにこれらのパターンをキャプチャする。
実行時に、Skimは各クエリをテンプレートにマッチさせ、宛先URLを合成し、小さなモデルで回答を抽出する。
軽量検証器は、クエリとスキーマに対して各ファストパス出力をゲートし、まれなミススペクションをフルエージェントにカスケードし、ファストパスの最終URLでウォームスタートして上流軌道の進行を保存する。
3つのバックボーンエージェント(WebVoyager, AgentOccam, BrowserUse)と組み合わせた標準的なWebエージェントベンチマーク全体で、Skimはタスク毎の中央値コストを1.9倍、レイテンシを33.4%削減し、精度を損なわない。
関連論文リスト
- Web Agents Should Adopt the Plan-Then-Execute Paradigm [9.920367562132336]
我々は、WebエージェントがデフォルトでReActではなく plan-then-executeにすべきであると主張している。
信頼できないデータは、事前に定義された実行グラフ内の値やブランチに影響を与える可能性がある。
我々は、Web上でプラン-then-executeを採用する上での主要な障壁を特定します。
論文 参考訳(メタデータ) (2026-05-14T02:48:57Z) - WebAgentGuard: A Reasoning-Driven Guard Model for Detecting Prompt Injection Attacks in Web Agents [117.65855863464863]
Webエージェントはインジェクション攻撃に対して非常に脆弱である。
システム・プロンプト・ディフェンス(英語版)やエージェントの直接微調整を含む既存の防御は、効果が限られている。
本稿では,WebAgentGuardを導入し,インジェクション検出のためのマルチモーダルガードモデルを提案する。
論文 参考訳(メタデータ) (2026-04-14T04:50:35Z) - Internal APIs Are All You Need: Shadow APIs, Shared Discovery, and the Case Against Browser-First Agent Architectures [0.0]
Unbrowseは共有ルートグラフで、ブラウザベースのルート発見を集合的に保持されたインデックスに変換する。
このシステムは、実際のブラウジングトラフィックからルートを受動的に学習し、直接API呼び出しを通じてキャッシュされたルートを提供する。
3パス実行モデル -- ローカルキャッシュ、共有グラフ、ブラウザフォールバック -- は、システムが自発的で自己修正可能であることを保証します。
論文 参考訳(メタデータ) (2026-04-01T09:51:46Z) - TimeWarp: Evaluating Web Agents by Revisiting the Past [7.017865728670461]
当社では,UIや設計,レイアウトなどさまざまなコンテナ環境を使用して,Webの進化をエミュレートするベンチマークであるTimeWarpを紹介した。
実験の結果,Webエージェントによる変更に対する脆弱性と,シングルバージョン軌道上での行動クローニング(BC)の限界が明らかになった。
提案するTimeTrajは,複数バージョンにわたるトラジェクトリの収集に計画蒸留を用いる,シンプルで効果的なアルゴリズムである。
論文 参考訳(メタデータ) (2026-03-05T08:43:06Z) - TabAgent: A Framework for Replacing Agentic Generative Components with Tabular-Textual Classifiers [5.792704492773729]
TabAgentは、クローズドセット選択タスクにおける生成決定コンポーネントを、実行トレースに基づいて訓練されたコンパクトテキストタブラリ分類器に置き換えるフレームワークである。
長期のAppWorldベンチマークでは、TabAgentがタスクレベルの成功を維持しながら、ショートリストタイムのLLMコールを排除し、遅延を約95%削減し、推論コストを85~91%削減した。
論文 参考訳(メタデータ) (2026-02-18T13:01:17Z) - BrowserArena: Evaluating LLM Agents on Real-World Web Navigation Tasks [51.803138848305814]
我々はBrowserArenaを紹介した。BrowserArenaは、ユーザから送信されたタスクを収集するオープンソースのエージェント評価プラットフォームである。
Captcha解決、ポップアップバナー削除、URLへのダイレクトナビゲーションの3つの一貫した障害モードを特定します。
本研究は,Webエージェントの多様性と脆性の両方を明らかにする。
論文 参考訳(メタデータ) (2025-10-02T15:22:21Z) - WALT: Web Agents that Learn Tools [66.73502484310121]
WALTは、Webサイト機能を再利用不能なツールにリバースエンジニアリングするフレームワークである。
WALTはアドホックなスキルを仮説化するのではなく、既にウェブサイトに設計されている自動化の堅牢な実装を公開している。
VisualWebArenaとWebArenaでは、WALTはより少ないステップとLLM依存の推論でより高い成功を達成している。
論文 参考訳(メタデータ) (2025-10-01T23:41:47Z) - WebLists: Extracting Structured Information From Complex Interactive Websites Using Executable LLM Agents [1.6673034682613495]
我々は、一般的な4つのビジネスおよびエンタープライズユースケースにわたる200のデータ抽出タスクのベンチマークであるWebListsを紹介します。
検索能力を有するLLMとSOTA Webエージェントの両方が、それぞれ3%と31%のリコールで、これらのタスクに苦労していることを示す。
提案するBardeenAgentは,Webエージェントが実行をリピータブルなプログラムに変換し,類似した構造を持つページ間で大規模に再生することを可能にする新しいフレームワークである。
WebListsベンチマークでは、BardeenAgentが総リコール総数の66%を達成し、SOTA Webエージェントのパフォーマンスを倍増し、出力行あたりのコストを3倍に削減した。
論文 参考訳(メタデータ) (2025-04-17T06:16:40Z) - AgentOccam: A Simple Yet Strong Baseline for LLM-Based Web Agents [52.13695464678006]
本研究は, 観察空間と行動空間を簡略化することで, LLMベースのWebエージェントを強化する。
AgentOccam は以前の最先端および同時処理を 9.8 (+29.4%) と 5.9 (+15.8%) で上回っている。
論文 参考訳(メタデータ) (2024-10-17T17:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。