論文の概要: GenIA-E2ETest: A Generative AI-Based Approach for End-to-End Test Automation
- arxiv url: http://arxiv.org/abs/2510.01024v1
- Date: Wed, 01 Oct 2025 15:30:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.642563
- Title: GenIA-E2ETest: A Generative AI-Based Approach for End-to-End Test Automation
- Title(参考訳): GenIA-E2ETest: エンドツーエンドテスト自動化のための生成AIベースのアプローチ
- Authors: Elvis Júnior, Alan Valejo, Jorge Valverde-Rebaza, Vânia de Oliveira Neves,
- Abstract要約: 本稿では、生成AIを利用して自然言語記述からE2Eテストスクリプトを自動生成するGenIA-E2ETestを紹介する。
提案手法は, 完全性, 正確性, 適応性, 堅牢性を評価した。
- 参考スコア(独自算出の注目度): 0.3499870393443268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software testing is essential to ensure system quality, but it remains time-consuming and error-prone when performed manually. Although recent advances in Large Language Models (LLMs) have enabled automated test generation, most existing solutions focus on unit testing and do not address the challenges of end-to-end (E2E) testing, which validates complete application workflows from user input to final system response. This paper introduces GenIA-E2ETest, which leverages generative AI to generate executable E2E test scripts from natural language descriptions automatically. We evaluated the approach on two web applications, assessing completeness, correctness, adaptation effort, and robustness. Results were encouraging: the scripts achieved an average of 77% for both element metrics, 82% for precision of execution, 85% for execution recall, required minimal manual adjustments (average manual modification rate of 10%), and showed consistent performance in typical web scenarios. Although some sensitivity to context-dependent navigation and dynamic content was observed, the findings suggest that GenIA-E2ETest is a practical and effective solution to accelerate E2E test automation from natural language, reducing manual effort and broadening access to automated testing.
- Abstract(参考訳): ソフトウェアテストはシステム品質を保証するのに不可欠だが、手動で実行すると時間がかかりエラーが発生しやすい。
近年のLLM(Large Language Models)の進歩により自動テスト生成が可能になったが、既存のソリューションのほとんどは単体テストに重点を置いており、エンド・ツー・エンド(E2E)テストの課題に対処していない。
本稿では、生成AIを利用して自然言語記述から実行可能なE2Eテストスクリプトを自動生成するGenIA-E2ETestを紹介する。
提案手法は, 完全性, 正確性, 適応性, 堅牢性を評価した。
その結果、両要素のメトリクスの平均は77%、実行精度は82%、実行リコールは85%、手動調整は最小限(手動修正率は10%)で、典型的なWebシナリオでは一貫したパフォーマンスを示した。
GenIA-E2ETestは、自然言語からE2Eテストの自動化を加速し、手作業の労力を減らし、自動テストへのアクセスを拡大するための実用的で効果的なソリューションである。
関連論文リスト
- Acceptance Test Generation with Large Language Models: An Industrial Case Study [0.7874708385247353]
大規模言語モデル(LLM)を利用したアシスタントは、プログラムコードや単体テストの生成にますます利用されている。
本稿では,2段階のプロセスでWebアプリケーションの実行可能受け入れテストを生成するLLMについて検討する。
この2段階のアプローチは、受け入れテスト駆動開発をサポートし、テスターコントロールを強化し、テスト品質を向上させる。
論文 参考訳(メタデータ) (2025-04-09T19:33:38Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - The Future of Software Testing: AI-Powered Test Case Generation and Validation [0.0]
本稿では、テストケースの生成と検証を改善する上で、AIが持つ変革の可能性について考察する。
テストプロセスの効率性、正確性、スケーラビリティを高める能力に重点を置いている。
また、高品質なトレーニングデータの必要性など、テストにAIを適用する際の重要な課題にも対処している。
論文 参考訳(メタデータ) (2024-09-09T17:12:40Z) - Feature-Driven End-To-End Test Generation [5.7340627516257525]
AutoE2Eは、セマンティックに意味のある機能駆動型E2EテストケースをWebアプリケーション向けに自動生成する新しいアプローチである。
E2EBenchは、E2Eテストスイートの機能カバレッジを自動的に評価する新しいベンチマークである。
論文 参考訳(メタデータ) (2024-08-04T01:16:04Z) - Neural Embeddings for Web Testing [49.66745368789056]
既存のクローラは、状態等価性を評価するために、アプリ固有のしきい値ベースのアルゴリズムに依存している。
ニューラルネットワークの埋め込みとしきい値のない分類器に基づく新しい抽象関数WEBEMBEDを提案する。
WEBEMBEDは,9つのWebアプリケーションに対する評価の結果,近距離検出により最先端技術よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2023-06-12T19:59:36Z) - Listen, Adapt, Better WER: Source-free Single-utterance Test-time
Adaptation for Automatic Speech Recognition [65.84978547406753]
Test-time Adaptationは、ソースドメインでトレーニングされたモデルに適応して、テストサンプルの予測を改善することを目的としている。
単一発話テスト時間適応 (SUTA) は音声領域における最初のTTA研究である。
論文 参考訳(メタデータ) (2022-03-27T06:38:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。