論文の概要: WebRouter: Query-specific Router via Variational Information Bottleneck for Cost-sensitive Web Agent
- arxiv url: http://arxiv.org/abs/2510.11221v1
- Date: Mon, 13 Oct 2025 10:05:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.307719
- Title: WebRouter: Query-specific Router via Variational Information Bottleneck for Cost-sensitive Web Agent
- Title(参考訳): WebRouter: コストセンシティブなWebエージェントのための可変情報ボトルネックによるクエリ固有ルータ
- Authors: Tao Li, Jinlong Hu, Yang Wang, Junfeng Liu, Xuejun Liu,
- Abstract要約: LLMを組み込んだWebエージェントは、Web自動化に強力な機能を提供するが、コストパフォーマンスのトレードオフに直面している。
情報理論の観点から学習した,コスト対応のクエリ専用ルータであるWebを紹介する。
WebはGPT-4oベースラインに比べて、運用コストを87.8%削減し、精度は3.8%しか低下しない。
- 参考スコア(独自算出の注目度): 6.287436342796108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-brained web agents offer powerful capabilities for web automation but face a critical cost-performance trade-off. The challenge is amplified by web agents' inherently complex prompts that include goals, action histories, and environmental states, leading to degraded LLM ensemble performance. To address this, we introduce WebRouter, a novel query-specific router trained from an information-theoretic perspective. Our core contribution is a cost-aware Variational Information Bottleneck (ca-VIB) objective, which learns a compressed representation of the input prompt while explicitly penalizing the expected operational cost. Experiments on five real-world websites from the WebVoyager benchmark show that WebRouter reduces operational costs by a striking 87.8\% compared to a GPT-4o baseline, while incurring only a 3.8\% accuracy drop.
- Abstract(参考訳): LLMを組み込んだWebエージェントは、Web自動化に強力な機能を提供するが、重要なコストパフォーマンストレードオフに直面している。
この課題は、目標、行動履歴、環境状態を含むWebエージェントの本質的に複雑なプロンプトによって増幅され、LLMアンサンブルのパフォーマンスが劣化する。
これを解決するために,情報理論の観点から学習した新しいクエリ専用ルータであるWebRouterを紹介する。
当社のコアコントリビューションは,入力プロンプトの圧縮表現を学習し,期待される運用コストを明示的にペナルティ化する,コスト対応の変動情報ボトルネック(ca-VIB)の目標である。
WebVoyagerベンチマークによる5つの現実世界のウェブサイトの実験では、WebRouterはGPT-4oベースラインに比べて、運用コストを87.8 %削減し、精度は3.8 %しか低下していない。
関連論文リスト
- ProxRouter: Proximity-Weighted LLM Query Routing for Improved Robustness to Outliers [14.831117443453165]
大規模言語モデル(LLM)クエリルータは、現代のAIプラットフォームにとって極めて重要である。
非パラメトリックルータにおけるバイアスと分散のバランスをとるために指数関数的に傾いたアグリゲーション機構を応用したProxを提案する。
論文 参考訳(メタデータ) (2025-10-10T20:28:14Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - WebWalker: Benchmarking LLMs in Web Traversal [64.48425443951749]
WebWalkerQAは,LLMがWebトラバースを実現する能力を評価するためのベンチマークである。
本稿では,WebWalkerを提案する。WebWalkerは,探索的・批判的パラダイムを通じて,人間のようなWebナビゲーションを模倣するマルチエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-01-13T18:58:07Z) - WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models [65.18602126334716]
既存のWebエージェントは1つの入力モダリティしか処理せず、単純化されたWebシミュレータや静的なWebスナップショットでのみ評価される。
我々は,WebVoyagerを紹介した。LMM(Large Multimodal Model)を利用したWebエージェントで,現実世界のWebサイトと対話することで,エンド・ツー・エンドでのユーザ指示を完了することができる。
GPT-4(All Tools)とWebVoyager(text-only)の両方のパフォーマンスを大幅に上回る、59.1%のタスク成功率を実現していることを示す。
論文 参考訳(メタデータ) (2024-01-25T03:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。