論文の概要: Promoting Sustainable Web Agents: Benchmarking and Estimating Energy Consumption through Empirical and Theoretical Analysis
- arxiv url: http://arxiv.org/abs/2511.04481v1
- Date: Thu, 06 Nov 2025 15:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.489177
- Title: Promoting Sustainable Web Agents: Benchmarking and Estimating Energy Consumption through Empirical and Theoretical Analysis
- Title(参考訳): 持続可能なWebエージェントの推進:実証的・理論的分析によるエネルギー消費のベンチマークと推定
- Authors: Lars Krupp, Daniel Geißler, Vishal Banwari, Paul Lukowicz, Jakob Karolus,
- Abstract要約: 我々は、Webエージェント作成における異なる哲学が、関連する拡張エネルギーにどのように影響するかを示す。
エネルギー消費を推定する際の制限要因として,一部のWebエージェントで使用されるモデルパラメータやプロセスの開示に関する透明性の欠如を強調した。
- 参考スコア(独自算出の注目度): 9.631189259234931
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web agents, like OpenAI's Operator and Google's Project Mariner, are powerful agentic systems pushing the boundaries of Large Language Models (LLM). They can autonomously interact with the internet at the user's behest, such as navigating websites, filling search masks, and comparing price lists. Though web agent research is thriving, induced sustainability issues remain largely unexplored. To highlight the urgency of this issue, we provide an initial exploration of the energy and $CO_2$ cost associated with web agents from both a theoretical -via estimation- and an empirical perspective -by benchmarking. Our results show how different philosophies in web agent creation can severely impact the associated expended energy, and that more energy consumed does not necessarily equate to better results. We highlight a lack of transparency regarding disclosing model parameters and processes used for some web agents as a limiting factor when estimating energy consumption. Our work contributes towards a change in thinking of how we evaluate web agents, advocating for dedicated metrics measuring energy consumption in benchmarks.
- Abstract(参考訳): OpenAIのOperatorやGoogleのProject MarinerのようなWebエージェントは、大規模言語モデル(LLM)の境界を押し進める強力なエージェントシステムである。
Webサイトをナビゲートしたり、検索マスクを埋めたり、価格表を比較したり、インターネットと自律的に対話することができる。
ウェブエージェントの研究は盛んであるが、持続可能性の問題はほとんど未解決のままである。
この問題の緊急性を強調するため、我々は、理論的 -via Estimation と経験的視点 -- ベンチマークによる- から、Webエージェントに関連するエネルギーと$CO_2$コストを初期調査する。
以上の結果から,Webエージェント生成における異なる哲学が関連する拡張エネルギーにどのように影響するかが明らかとなり,より多くのエネルギー消費が必ずしもより良い結果をもたらすとは限らないことが示唆された。
エネルギー消費を推定する際の制限要因として,一部のWebエージェントで使用されるモデルパラメータやプロセスの開示に関する透明性の欠如を強調した。
我々の研究は、ベンチマークにおけるエネルギー消費を計測する専用の指標を提唱し、Webエージェントの評価方法の変化に寄与する。
関連論文リスト
- Evaluating End-User Device Energy Models in Sustainability Reporting of Browser-Based Web Services [0.0]
ウェブベースのサービスのサステナビリティレポートは、単純化されたエネルギーと炭素モデルに依存している。
本稿では,そのようなモデルが実際のエネルギー消費をいかに反映しているかを実証研究する。
その結果, 一般に適用されている定電力近似は, 測定エネルギーから大きく逸脱する可能性が示唆された。
論文 参考訳(メタデータ) (2025-10-14T14:25:26Z) - EconWebArena: Benchmarking Autonomous Agents on Economic Tasks in Realistic Web Environments [1.0026496861838445]
EconWebArenaは、現実的なWeb環境における複雑なマルチモーダル経済タスクにおいて、自律エージェントを評価するためのベンチマークである。
このベンチマークは、マクロ経済学、労働、金融、貿易、公共政策といった分野にまたがる82の権威あるウェブサイトから360のキュレートされたタスクで構成されている。
論文 参考訳(メタデータ) (2025-06-09T18:39:48Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.55946306325914]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - An Illusion of Progress? Assessing the Current State of Web Agents [61.742657650092845]
我々は,Webエージェントの現状を包括的かつ厳密に評価する。
結果は、現在のエージェントの能力の非常に異なる描写を描いており、以前報告された結果に過度に最適化されていることを示唆している。
オンライン評価ベンチマークであるOnline-Mind2Webを紹介した。
論文 参考訳(メタデータ) (2025-04-02T05:51:29Z) - Towards Sustainable Web Agents: A Plea for Transparency and Dedicated Metrics for Energy Consumption [4.614707355759162]
本研究では,Webエージェントに関連するエネルギーとCO2コストについて検討する。
結果は、Webエージェント作成における異なる哲学が、関連する拡張エネルギーにどのように影響するかを示している。
我々の研究は、Webエージェントの評価における思考の変化を提唱し、エネルギー消費と持続可能性のための専用の指標を保証します。
論文 参考訳(メタデータ) (2025-02-25T06:58:40Z) - Prospect Theory-inspired Automated P2P Energy Trading with
Q-learning-based Dynamic Pricing [2.2463154358632473]
本稿では,ユーザの認識を考慮に入れたP2P自動エネルギー市場を設計する。
本稿では,Q-bプライシングとリスクセンシティブ(PQR)という,リスクに敏感なQ-ラーニング機構を導入する。
エネルギー消費と生産の実際の痕跡と現実的な予測理論関数に基づく結果から,提案手法は購入者にとって26%高い評価値が得られることが示された。
論文 参考訳(メタデータ) (2022-08-26T16:45:40Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。