論文の概要: WebMAC: A Multi-Agent Collaborative Framework for Scenario Testing of Web Systems
- arxiv url: http://arxiv.org/abs/2604.13559v1
- Date: Wed, 15 Apr 2026 07:07:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.428269
- Title: WebMAC: A Multi-Agent Collaborative Framework for Scenario Testing of Web Systems
- Title(参考訳): WebMAC: Webシステムのシナリオテストのための多言語協調フレームワーク
- Authors: Zhenyu Wan, Gong Chen, Qing Huang, Xiaoyuan Xie,
- Abstract要約: 本稿では,Webシステムのシナリオテストのための協調的なフレームワークであるWebMACを提案する。
WebMACは3つのマルチエージェントモジュールで構成され、それぞれがテストシナリオの自然言語記述を完了し、テストシナリオを変換し、テストスクリプトを変換する。
SOTA法と比較して、WebMACは生成したテストスクリプトの実行成功率を30%から60%改善し、テスト効率を29%向上し、トークン消費量を47.6%削減した。
- 参考スコア(独自算出の注目度): 6.57151364871383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scenario testing is an important technique for detecting errors in web systems. Testers draft test scenarios and convert them into test scripts for execution. Early methods relied on testers to convert test scenarios into test scripts. Recent LLM-based scenario testing methods can generate test scripts from natural language descriptions of test scenarios. However, these methods are not only limited by the incompleteness of descriptions but also overlook test adequacy criteria, making it difficult to detect potential errors. To address these limitations, this paper proposes WebMAC, a multi-agent collaborative framework for scenario testing of web systems. WebMAC can complete natural language descriptions of test scenarios through interactive clarification and transform adequate instantiated test scenarios via equivalence class partitioning. WebMAC consists of three multi-agent modules, responsible respectively for completing natural language descriptions of test scenarios, transforming test scenarios, and converting test scripts. We evaluated WebMAC on four web systems. Compared with the SOTA method, WebMAC improves the execution success rate of generated test scripts by 30%-60%, increases testing efficiency by 29%, and reduces token consumption by 47.6%. Furthermore, WebMAC can effectively detect more errors in web systems.
- Abstract(参考訳): シナリオテストは、Webシステムのエラーを検出するための重要なテクニックである。
テスタはテストシナリオをドラフトして,実行用のテストスクリプトに変換する。
初期のメソッドはテストシナリオをテストスクリプトに変換するためにテスタに依存していた。
最近のLCMベースのシナリオテスト手法は、テストシナリオの自然言語記述からテストスクリプトを生成することができる。
しかし、これらの手法は記述の不完全性だけでなく、テスト精度基準も見落としているため、潜在的な誤りを検出することは困難である。
本稿では,Webシステムのシナリオテストのためのマルチエージェント協調フレームワークであるWebMACを提案する。
WebMACは、インタラクティブな明確化を通じてテストシナリオの自然言語記述を完了し、等価クラスパーティショニングを通じて適切なインスタンス化テストシナリオを変換することができる。
WebMACは3つのマルチエージェントモジュールで構成され、それぞれがテストシナリオの自然言語記述を完了し、テストシナリオを変換し、テストスクリプトを変換する。
WebMACを4つのWebシステムで評価した。
SOTA法と比較して、WebMACは生成したテストスクリプトの実行成功率を30%から60%改善し、テスト効率を29%向上し、トークン消費量を47.6%削減した。
さらに、WebMACはWebシステムのエラーを効果的に検出できる。
関連論文リスト
- WebTestBench: Evaluating Computer-Use Agents towards End-to-End Automated Web Testing [57.7131457251794]
エンドツーエンドの自動Webテストを評価するベンチマークであるWebTestBenchを紹介します。
テストプロセスを2つのカスケードサブタスク、チェックリストの生成と欠陥検出に分解し、WebTesterを提案する。
以上の結果から,現在のコンピュータ利用エージェント能力と産業レベルの展開要求との間に大きなギャップがあることが判明した。
論文 参考訳(メタデータ) (2026-03-26T09:27:29Z) - iScript: A Domain-Adapted Large Language Model and Benchmark for Physical Design Tcl Script Generation [48.502477318243386]
iScriptは、Innovus Tclスクリプト生成のためのドメイン適応Qwen3-8Bモデルである。
iScriptのパス@kスコアは、現在最先端のLLMよりも高い。
論文 参考訳(メタデータ) (2026-03-04T15:20:35Z) - MASTEST: A LLM-Based Multi-Agent System For RESTful API Tests [2.4690347153946237]
クラウドネイティブアプリケーションの品質保証において、APIのテストはますます重要になっている。
機械学習の最近の進歩は、様々なテスト活動が妥当な精度で大規模言語モデル(LLM)によって自動的に実行されることを示した。
本稿では, LLM とプログラムエージェントを組み合わせたマルチエージェントシステム MASTEST を開発した。
論文 参考訳(メタデータ) (2025-11-22T12:33:13Z) - Intention-Driven Generation of Project-Specific Test Cases [45.2380093475221]
検証意図の記述からプロジェクト固有のテストを生成するIntentionTestを提案する。
13のオープンソースプロジェクトから4,146件のテストケースで,最先端のベースライン(DA, ChatTester, EvoSuite)に対してIntentionTestを広範囲に評価した。
論文 参考訳(メタデータ) (2025-07-28T08:35:04Z) - Are Autonomous Web Agents Good Testers? [41.56233403862961]
大規模言語モデル(LLMs)は、自律Webエージェント(AWAs)を活用することで、潜在的な代替手段を提供する。
AWAは自律テストエージェント(ATA)として機能する。
本稿では,自然言語テストケース実行におけるAWAの適用可能性について検討する。
論文 参考訳(メタデータ) (2025-04-02T08:48:01Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Context-Aware Testing: A New Paradigm for Model Testing with Large Language Models [49.06068319380296]
我々は,コンテキストを帰納バイアスとして用いて意味のあるモデル障害を探索するコンテキスト認識テスト(CAT)を導入する。
最初のCATシステムSMART Testingをインスタンス化し、大きな言語モデルを用いて、関連性があり、起こりうる失敗を仮説化します。
論文 参考訳(メタデータ) (2024-10-31T15:06:16Z) - Practical, Automated Scenario-based Mobile App Testing [13.52057950260007]
ヒューマンテスタが開発したテストスクリプトは、テストシナリオに集中してビジネスロジックを検討する。
モバイルアプリのGUI集約的な機能のため、ヒューマンテスタは常にアプリケーションのGUIを理解して、シナリオのテストスクリプトを整理します。
ScenTestは、ヒューマンプラクティスを模倣し、ドメイン知識をシナリオベースのモバイルアプリテストに統合することで、自動テストを開始する。
論文 参考訳(メタデータ) (2024-06-12T15:48:39Z) - Large Language Models for Automated Web-Form-Test Generation: An Empirical Study [8.32635005234879]
大規模言語モデル(LLM)は文脈テキスト生成に大きな可能性を示している。
異なるLLMを比較した比較研究は、Web-form-test 生成についてはまだ報告されていない。
本稿では,鍵となる文脈情報を抽出する3つのHTML構造解析手法を提案する。
論文 参考訳(メタデータ) (2024-05-16T10:21:03Z) - Automated Performance Testing Based on Active Deep Learning [2.179313476241343]
ブラックボックス性能試験のためのACTAと呼ばれる自動テスト生成手法を提案する。
ACTAはアクティブな学習に基づいており、テスト中のシステムのパフォーマンス特性を知るために、大量の履歴テストデータを必要としないことを意味します。
我々は,ベンチマークWebアプリケーション上でACTAを評価し,本手法がランダムテストに匹敵することを示す実験結果を得た。
論文 参考訳(メタデータ) (2021-04-05T18:19:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。