論文の概要: WebCQ: Cooperative Multi-Agent Deep Reinforcement Learning for Scalable Web GUI Testing
- arxiv url: http://arxiv.org/abs/2606.22502v1
- Date: Sun, 21 Jun 2026 13:50:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:53:13.364965
- Title: WebCQ: Cooperative Multi-Agent Deep Reinforcement Learning for Scalable Web GUI Testing
- Title(参考訳): WebCQ: スケーラブルなWeb GUIテストのための協調的マルチエージェント深層強化学習
- Authors: Yujia Fan, Sinan Wang, Zebang Fei, Yao Qin, Huaxuan Li, Yepang Liu,
- Abstract要約: マルチエージェント強化学習(MARL)ベースの技術はGUIテストに有望である。
既存のMARLベースのアプローチは、基盤となる強化学習アルゴリズムに固有の制限があるため、スケールアップに苦慮している。
我々は、スケーラブルなWeb GUIテストのための新しいMARLベースのアプローチであるWebCQを提案する。
- 参考スコア(独自算出の注目度): 8.683082611781144
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent reinforcement learning (MARL)-based techniques have shown promise for GUI testing. However, as the complexity of modern GUI software increases, existing MARL-based approaches (e.g., MARG and Fastbot) struggle to scale due to the inherent limitations of their underlying tabular reinforcement learning algorithms. This limits their applicability to large-scale commercial GUI software, especially web applications with vast state spaces and many interactive elements. To fill this gap, we propose WebCQ, a novel MARL-based approach for scalable web GUI testing. WebCQ incorporates QTRAN for multi-agent coordination and a lightweight synchronization mechanism, allowing it to work under asynchronous web testing scenarios. It extracts semantic and exploration features for each UI event to form an action vector. This vector is concatenated with the current state vector and fed into the policy network, enabling DQN-based decision making within a dynamic action space. We evaluated WebCQ on eight large-scale commercial websites. Under the same time budget and agent count, WebCQ explored 33.3% more states and executed 42.2% more unique actions than MARG, while triggering more failures on six of the eight websites under test. It also demonstrated strong scalability, maintaining higher action throughput during 20-hour experiments, and achieving greater performance improvements as the number of agents increased. These results show that WebCQovercomes key limitations of existing MARL-based approaches, providing a scalable and effective solution for enhancing modern web GUI testing.
- Abstract(参考訳): マルチエージェント強化学習(MARL)ベースの技術はGUIテストに有望である。
しかし、現代のGUIソフトウェアの複雑さが増大するにつれて、既存のMARLベースのアプローチ(例えば、MARGやFastbot)は、その基盤となる表強化学習アルゴリズムに固有の制限があるため、スケールに苦慮する。
これにより、大規模な商用GUIソフトウェア、特に巨大な状態空間と多くのインタラクティブな要素を持つWebアプリケーションへの適用性が制限される。
このギャップを埋めるために、スケーラブルなWeb GUIテストのための新しいMARLベースのアプローチであるWebCQを提案する。
WebCQはマルチエージェント調整と軽量同期機構にQTRANを組み込んでおり、非同期Webテストシナリオ下で動作することができる。
UIイベントごとにセマンティクスと探索機能を抽出してアクションベクタを形成する。
このベクトルは現在の状態ベクトルと結合し、ポリシーネットワークに入力され、動的アクション空間内でDQNベースの意思決定を可能にする。
8つの大規模商業ウェブサイトでWebCQを評価した。
同時に予算とエージェント数で、WebCQは33.3%の州を探索し、MARGよりも42.2%のユニークな行動を実行した。
また、強力なスケーラビリティを示し、20時間の実験で高い動作スループットを維持し、エージェントの数が増えるにつれてパフォーマンスの向上を実現した。
これらの結果は、WebCQoverが既存のMARLベースのアプローチの鍵となる制限を克服し、モダンなWeb GUIテストを強化するためのスケーラブルで効果的なソリューションを提供することを示している。
関連論文リスト
- WebTestBench: Evaluating Computer-Use Agents towards End-to-End Automated Web Testing [57.7131457251794]
エンドツーエンドの自動Webテストを評価するベンチマークであるWebTestBenchを紹介します。
テストプロセスを2つのカスケードサブタスク、チェックリストの生成と欠陥検出に分解し、WebTesterを提案する。
以上の結果から,現在のコンピュータ利用エージェント能力と産業レベルの展開要求との間に大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2026-03-26T09:27:29Z) - AUTO-Explorer: Automated Data Collection for GUI Agent [58.58097564914626]
本稿では,アノテーションコストを最小限に抑えた自動データ収集手法であるAuto-Explorerを提案する。
それは、GUI環境を自律的に解析し探索する、シンプルだが効果的な探索メカニズムを組み込んでいる。
収集したデータを用いて,マルチモーダル大規模言語モデル(MLLM)を微調整し,GUI要素基盤テストセットを確立する。
論文 参考訳(メタデータ) (2025-11-09T15:13:45Z) - MobileGUI-RL: Advancing Mobile GUI Agent through Reinforcement Learning in Online Environment [63.62778707277929]
MobileGUI-RLは、オンライン環境でGUIエージェントをトレーニングするスケーラブルなフレームワークである。
自己探索とフィルタリングを通じて学習可能なタスクのカリキュラムを合成する。
GRPOをGUIナビゲーションに適応させ、軌道認識の利点と複合報酬を付与する。
論文 参考訳(メタデータ) (2025-07-08T07:07:53Z) - Open CaptchaWorld: A Comprehensive Web-based Platform for Testing and Benchmarking Multimodal LLM Agents [23.715342148854006]
Open CaptchaWorldは、MLLMを使用したエージェントの視覚的推論とインタラクション能力を評価するために特別に設計された、Webベースのベンチマークとプラットフォームである。
その結果,Browser-Use Openai-o3 による成功率は 40.0% である。
これはOpen CaptchaWorldを、現在のマルチモーダルエージェントの限界を診断し、より堅牢なマルチモーダル推論システムの開発を導くための重要なベンチマークとして強調している。
論文 参考訳(メタデータ) (2025-05-30T17:59:55Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - Leveraging Large Vision Language Model For Better Automatic Web GUI Testing [7.480576630392405]
本稿では,最初のLVLM駆動のエンドツーエンドWebテスト技術であるVETLを提案する。
LVLMのシーン理解機能により、VETLはローカルコンテキストに焦点を当てた有効な意味のあるテキスト入力を生成することができる。
関連GUI要素の選択は視覚的質問応答問題として定式化され、LVLMは入力ボックスと関連する要素の間の論理的接続をキャプチャする。
論文 参考訳(メタデータ) (2024-10-16T01:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。