論文の概要: WEFix: Intelligent Automatic Generation of Explicit Waits for Efficient
Web End-to-End Flaky Tests
- arxiv url: http://arxiv.org/abs/2402.09745v1
- Date: Thu, 15 Feb 2024 06:51:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 16:39:29.665735
- Title: WEFix: Intelligent Automatic Generation of Explicit Waits for Efficient
Web End-to-End Flaky Tests
- Title(参考訳): WEFix: 効率的なWebエンドツーエンドフレークテストのための明示的ウェイトの自動生成
- Authors: Xinyue Liu, Zihe Song, Weike Fang, Wei Yang, Weihang Wang
- Abstract要約: Web e2e テストにおいて UI ベースのフレキネスの修正コードを自動生成する技術である WEFix を提案する。
We evaluate the effective and efficiency of WEFix against 122 web e2e flaky tests from 7 popular real-world projects。
- 参考スコア(独自算出の注目度): 13.280540531582945
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web end-to-end (e2e) testing evaluates the workflow of a web application. It
simulates real-world user scenarios to ensure the application flows behave as
expected. However, web e2e tests are notorious for being flaky, i.e., the tests
can produce inconsistent results despite no changes to the code. One common
type of flakiness is caused by nondeterministic execution orders between the
test code and the client-side code under test. In particular, UI-based
flakiness emerges as a notably prevalent and challenging issue to fix because
the test code has limited knowledge about the client-side code execution. In
this paper, we propose WEFix, a technique that can automatically generate fix
code for UI-based flakiness in web e2e testing. The core of our approach is to
leverage browser UI changes to predict the client-side code execution and
generate proper wait oracles. We evaluate the effectiveness and efficiency of
WEFix against 122 web e2e flaky tests from seven popular real-world projects.
Our results show that WEFix dramatically reduces the overhead (from 3.7$\times$
to 1.25$\times$) while achieving a high correctness (98%).
- Abstract(参考訳): Webのエンドツーエンド(e2e)テストは、Webアプリケーションのワークフローを評価する。
実際のユーザシナリオをシミュレートし、アプリケーションのフローが期待通りに振る舞うことを保証します。
しかし、web e2eテストは不安定なことで悪名高く、コードを変更することなく一貫性のない結果を生み出すことができる。
共通するフラキネスの1つは、テストコードとテスト中のクライアント側のコードとの間の非決定論的実行順序によって引き起こされる。
特に、uiベースのフレキネスは、クライアント側のコード実行に関する知識が限られているため、修正する上で特に一般的で困難な問題として現れます。
本稿では,Web e2e テストにおいて UI ベースのフレキネスの修正コードを自動生成する WEFix を提案する。
私たちのアプローチの核心は、ブラウザのui変更を利用してクライアント側のコード実行を予測し、適切なwait oracleを生成することです。
我々は、wefixの有効性と効率を評価し、人気のある7つの実世界のプロジェクトによる122のweb e2eflakyテストと比較する。
その結果、WEFixはオーバーヘッドを劇的に減らし(3.7$\times$から1.25$\times$へ)、高い正しさ(98%)を達成した。
関連論文リスト
- AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - TestGenEval: A Real World Unit Test Generation and Test Completion Benchmark [24.14654309612826]
TestGenEvalは、1,210のコードから68,647のテストと、11の保守されたPythonリポジトリにまたがるテストファイルペアで構成されている。
初期テストのオーサリング、テストスイートの補完、コードカバレッジの改善をカバーしている。
パラメータは7Bから405Bまで様々である。
論文 参考訳(メタデータ) (2024-10-01T14:47:05Z) - Taming Timeout Flakiness: An Empirical Study of SAP HANA [47.29324864511411]
不安定なテストは回帰テストに悪影響を及ぼします。
テストタイムアウトは、このような不安定なテストの失敗に寄与する要因のひとつです。
テストのフレキネス率は、繰り返しテストの実行回数によって49%から70%の範囲である。
論文 参考訳(メタデータ) (2024-02-07T20:01:41Z) - Do Automatic Test Generation Tools Generate Flaky Tests? [12.813573907094074]
テスト生成ツールが生成するフレキなテストの頻度と性質はほとんど不明である。
EvoSuite(Java)とPynguin(Python)を使ってテストを生成し、各テストは200回実行します。
この結果から, フレキネスは開発者の手書きテストと同様, 生成テストでも一般的であることが判明した。
論文 参考訳(メタデータ) (2023-10-08T16:44:27Z) - Towards Automatic Generation of Amplified Regression Test Oracles [44.45138073080198]
回帰テストオラクルを増幅するためのテストオラクル導出手法を提案する。
このアプローチはテスト実行中にオブジェクトの状態を監視し、以前のバージョンと比較して、SUTの意図した振る舞いに関連する変更を検出する。
論文 参考訳(メタデータ) (2023-07-28T12:38:44Z) - Neural Embeddings for Web Testing [49.66745368789056]
既存のクローラは、状態等価性を評価するために、アプリ固有のしきい値ベースのアルゴリズムに依存している。
ニューラルネットワークの埋め込みとしきい値のない分類器に基づく新しい抽象関数WEBEMBEDを提案する。
WEBEMBEDは,9つのWebアプリケーションに対する評価の結果,近距離検出により最先端技術よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2023-06-12T19:59:36Z) - Time-based Repair for Asynchronous Wait Flaky Tests in Web Testing [0.0]
非同期待ち行列は、Webアプリケーションで最も多い原因の一つだ。
本稿では,非同期待ちフレキテストのための時間ベースの自動修復手法TRafを提案する。
我々の分析では、TRafは開発者による修正よりも、テストのフレキネスを解決するのに待ち時間が短いことを示唆している。
論文 参考訳(メタデータ) (2023-05-15T12:17:30Z) - MT3: Meta Test-Time Training for Self-Supervised Test-Time Adaption [69.76837484008033]
ディープラーニングの未解決の問題は、ニューラルネットワークがテスト時間中のドメインシフトに対処する能力である。
メタラーニング、自己監督、テストタイムトレーニングを組み合わせて、目に見えないテスト分布に適応する方法を学びます。
この手法はcifar-10による画像分類ベンチマークの最先端結果を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-30T09:33:38Z) - Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement
Learning Framework [68.96770035057716]
A/Bテスト(A/B Testing)は、新しい製品を製薬、技術、伝統産業の古い製品と比較するビジネス戦略である。
本稿では,オンライン実験においてA/Bテストを実施するための強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-05T10:25:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。