論文の概要: WebRouter: Query-specific Router via Variational Information Bottleneck for Cost-sensitive Web Agent
- arxiv url: http://arxiv.org/abs/2510.11221v1
- Date: Mon, 13 Oct 2025 10:05:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.307719
- Title: WebRouter: Query-specific Router via Variational Information Bottleneck for Cost-sensitive Web Agent
- Title(参考訳): WebRouter: コストセンシティブなWebエージェントのための可変情報ボトルネックによるクエリ固有ルータ
- Authors: Tao Li, Jinlong Hu, Yang Wang, Junfeng Liu, Xuejun Liu,
- Abstract要約: LLMを組み込んだWebエージェントは、Web自動化に強力な機能を提供するが、コストパフォーマンスのトレードオフに直面している。
情報理論の観点から学習した,コスト対応のクエリ専用ルータであるWebを紹介する。
WebはGPT-4oベースラインに比べて、運用コストを87.8%削減し、精度は3.8%しか低下しない。
- 参考スコア(独自算出の注目度): 6.287436342796108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: LLM-brained web agents offer powerful capabilities for web automation but face a critical cost-performance trade-off. The challenge is amplified by web agents' inherently complex prompts that include goals, action histories, and environmental states, leading to degraded LLM ensemble performance. To address this, we introduce WebRouter, a novel query-specific router trained from an information-theoretic perspective. Our core contribution is a cost-aware Variational Information Bottleneck (ca-VIB) objective, which learns a compressed representation of the input prompt while explicitly penalizing the expected operational cost. Experiments on five real-world websites from the WebVoyager benchmark show that WebRouter reduces operational costs by a striking 87.8\% compared to a GPT-4o baseline, while incurring only a 3.8\% accuracy drop.
- Abstract(参考訳): LLMを組み込んだWebエージェントは、Web自動化に強力な機能を提供するが、重要なコストパフォーマンストレードオフに直面している。
この課題は、目標、行動履歴、環境状態を含むWebエージェントの本質的に複雑なプロンプトによって増幅され、LLMアンサンブルのパフォーマンスが劣化する。
これを解決するために,情報理論の観点から学習した新しいクエリ専用ルータであるWebRouterを紹介する。
当社のコアコントリビューションは,入力プロンプトの圧縮表現を学習し,期待される運用コストを明示的にペナルティ化する,コスト対応の変動情報ボトルネック(ca-VIB)の目標である。
WebVoyagerベンチマークによる5つの現実世界のウェブサイトの実験では、WebRouterはGPT-4oベースラインに比べて、運用コストを87.8 %削減し、精度は3.8 %しか低下していない。
関連論文リスト
- When Routing Collapses: On the Degenerate Convergence of LLM Routers [46.01380774114097]
ユーザのコスト予算が増加するにつれて、ルータは体系的に最も有能で最も高価なモデルにデフォルトとなる。
モデルランキングを直接学習する決定対応ルータであるEquiを提案する。
RouterBenchでは、最強の先行ルータと比較して、GPT-4レベルのパフォーマンスでコストを約17%削減する。
論文 参考訳(メタデータ) (2026-02-03T12:51:55Z) - RerouteGuard: Understanding and Mitigating Adversarial Risks for LLM Routing [20.559596977062146]
LLMルータはLLMリルーティングの形で敵攻撃に対して脆弱である。
LLMリルーチンのためのフレキシブルでスケーラブルなガードレールフレームワークであるRerouteGuardを紹介します。
RerouteGuardは、最先端のリルーチン攻撃に対する検出精度を99%以上達成している。
論文 参考訳(メタデータ) (2026-01-29T08:17:08Z) - CASTER: Breaking the Cost-Performance Barrier in Multi-Agent Orchestration via Context-Aware Strategy for Task Efficient Routing [25.48759875572515]
CASTER (Context-Aware Strategy for Task Efficient Routing) はグラフベースMASにおける動的モデル選択のための軽量ルータである。
CASTERは強力なモデルベースラインに比べて推論コストを最大72.4%削減する。
論文 参考訳(メタデータ) (2026-01-27T16:52:47Z) - EvoRoute: Experience-Driven Self-Routing LLM Agent Systems [100.64399490164959]
EvoRouteは、静的で事前定義されたモデルの割り当てを超越する、自己進化型のモデルルーティングパラダイムである。
挑戦的なエージェントベンチマークの実験によると、既製のエージェントシステムに統合されたEvoRouteは、システムのパフォーマンスを維持または向上するだけでなく、実行コストを最大80%削減し、レイテンシを70%以上削減する。
論文 参考訳(メタデータ) (2026-01-06T04:06:46Z) - It's a TRAP! Task-Redirecting Agent Persuasion Benchmark for Web Agents [52.81924177620322]
大規模な言語モデルを利用したWebベースのエージェントは、メール管理やプロフェッショナルネットワーキングといったタスクにますます利用されている。
動的Webコンテンツへの依存は、インジェクション攻撃の引き金に弱い: インターフェース要素に隠された敵対的命令は、エージェントが元のタスクから逸脱するように説得する。
本稿では,タスクリダイレクトエージェントの説得ベンチマーク(TRAP)について紹介する。
論文 参考訳(メタデータ) (2025-12-29T01:09:10Z) - ProxRouter: Proximity-Weighted LLM Query Routing for Improved Robustness to Outliers [14.831117443453165]
大規模言語モデル(LLM)クエリルータは、現代のAIプラットフォームにとって極めて重要である。
非パラメトリックルータにおけるバイアスと分散のバランスをとるために指数関数的に傾いたアグリゲーション機構を応用したProxを提案する。
論文 参考訳(メタデータ) (2025-10-10T20:28:14Z) - xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.63494870852894]
我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文 参考訳(メタデータ) (2025-10-09T16:52:01Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.55946306325914]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - WebWalker: Benchmarking LLMs in Web Traversal [64.48425443951749]
WebWalkerQAは,LLMがWebトラバースを実現する能力を評価するためのベンチマークである。
本稿では,WebWalkerを提案する。WebWalkerは,探索的・批判的パラダイムを通じて,人間のようなWebナビゲーションを模倣するマルチエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-01-13T18:58:07Z) - WebVoyager: Building an End-to-End Web Agent with Large Multimodal Models [65.18602126334716]
既存のWebエージェントは1つの入力モダリティしか処理せず、単純化されたWebシミュレータや静的なWebスナップショットでのみ評価される。
我々は,WebVoyagerを紹介した。LMM(Large Multimodal Model)を利用したWebエージェントで,現実世界のWebサイトと対話することで,エンド・ツー・エンドでのユーザ指示を完了することができる。
GPT-4(All Tools)とWebVoyager(text-only)の両方のパフォーマンスを大幅に上回る、59.1%のタスク成功率を実現していることを示す。
論文 参考訳(メタデータ) (2024-01-25T03:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。