論文の概要: A Systematic Evaluation of Environmental Flakiness in JavaScript Tests
- arxiv url: http://arxiv.org/abs/2602.19098v1
- Date: Sun, 22 Feb 2026 08:59:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.480268
- Title: A Systematic Evaluation of Environmental Flakiness in JavaScript Tests
- Title(参考訳): JavaScriptテストにおける環境特性の体系的評価
- Authors: Negar Hashemi, Amjed Tahir, August Shi, Shawn Rasheed, Rachel Blagojevic,
- Abstract要約: テストのフレキネスは業界において重要な問題であり、テスト効率と製品品質に影響を与えます。
環境要因がJavaScriptにおけるテストのフレキネスに与える影響を系統的に評価する。
環境関連フレーク試験を浄化する軽量化手法であるjs-env-sanitizerを開発した。
- 参考スコア(独自算出の注目度): 5.178246622041267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Test flakiness is a significant issue in industry, affecting test efficiency and product quality. While extensive research has examined the impact of flaky tests, many root causes remain unexplored, particularly in the context of dynamic languages such as JavaScript. In this paper, we conduct a systematic evaluation of the impact of environmental factors on test flakiness in JavaScript. We first executed test suites across multiple environmental configurations to determine whether changes in the environment could lead to flaky behavior. We selected three environmental factors to manipulate: the operating system, the Node.js version, and the browser. We identified a total of 65 environmental flaky projects, with 28 related to operating system issues, five to Node.js version compatibility, 16 to a combination of operating system and Node.js issues, and 17 related to browser compatibility. To address environmental flakiness, we developed a lightweight mitigation approach, js-env-sanitizer, that can sanitize environmental-related flaky tests by skipping and reporting them (rather than failing), allowing CI builds to continue/succeed without rerunning entire test suites. The tool achieves high accuracy with minimal performance or configuration overhead, and currently supports three popular JavaScript testing frameworks (Jest, Mocha, and Vitest)
- Abstract(参考訳): テストのフレキネスは業界において重要な問題であり、テスト効率と製品品質に影響を与えます。
フレキなテストの影響について広範な研究が行われてきたが、特にJavaScriptのような動的言語の文脈では、多くの根本原因が未解明のままである。
本稿では,JavaScriptにおける環境要因がテストフレキネスに与える影響を系統的に評価する。
環境の変化がフレキシブルな振る舞いを引き起こすかどうかを判断するため、まず複数の環境構成でテストスイートを実行しました。
私たちは、オペレーティングシステム、Node.jsバージョン、ブラウザの3つの環境要因を選択しました。
合計65の環境問題プロジェクトを特定しました。28はオペレーティングシステムの問題,5はNode.jsのバージョン互換性,16はオペレーティングシステムとNode.jsの問題,17はブラウザの互換性に関するものです。
環境フレキネスに対処するため,我々は,テストスイート全体を再実行することなくCIビルドを継続し,(失敗ではなく)スキップして報告することで,環境関連フレキテストの衛生化を可能にする軽量緩和手法であるjs-env-sanitizerを開発した。
このツールはパフォーマンスや設定のオーバーヘッドを最小限に抑えて高い精度を実現しており、現在3つの人気のあるJavaScriptテスティングフレームワーク(Jest、Mocha、Vitest)をサポートしている。
関連論文リスト
- EnvBench: A Benchmark for Automated Environment Setup [76.02998475135824]
大規模言語モデルにより、研究者はソフトウェア工学領域における実用的なリポジトリレベルのタスクに集中できるようになった。
環境設定に関する既存の研究は革新的なエージェント戦略を導入しているが、その評価は小さなデータセットに基づいていることが多い。
このギャップに対処するため、包括的環境設定ベンチマークEnvBenchを紹介します。
論文 参考訳(メタデータ) (2025-03-18T17:19:12Z) - CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。
ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文 参考訳(メタデータ) (2025-02-12T21:42:56Z) - A Preliminary Study of Fixed Flaky Tests in Rust Projects on GitHub [5.806051501952938]
GitHub上のRustプロジェクトでは、不安定なテストの研究が進行中です。
修正は根本原因、マニフェストの特徴、修正戦略に関する貴重な情報を提供することができるので、報告されただけでなく、修正される不安定なテストに重点を置いています。
論文 参考訳(メタデータ) (2025-02-04T22:55:54Z) - Detecting and Evaluating Order-Dependent Flaky Tests in JavaScript [3.6513675781808357]
不安定なテストは、ソフトウェアテストに重大な問題を引き起こす。
これまでの研究では、テストオーダー依存性がフレキネスの最も一般的な原因の1つとして特定されている。
本稿では,JavaScriptテストにおけるテスト順序依存性について検討する。
論文 参考訳(メタデータ) (2025-01-22T06:52:11Z) - The BrowserGym Ecosystem for Web Agent Research [151.90034093362343]
BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文 参考訳(メタデータ) (2024-12-06T23:43:59Z) - Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文 参考訳(メタデータ) (2024-12-02T18:11:30Z) - GHunter: Universal Prototype Pollution Gadgets in JavaScript Runtimes [5.852467142337343]
プロトタイプ汚染は、JavaScriptコードに影響を与える最近の脆弱性である。
これはJavaScriptのプロトタイプベースの継承をルーツとしており、攻撃者は実行時にオブジェクトのプロトタイプに任意のプロパティを注入することができる。
V8ベースのJavaScriptランタイムにおけるガジェットの研究は、Node.jsとDenoに重点を置いている。
論文 参考訳(メタデータ) (2024-07-15T15:30:00Z) - FV8: A Forced Execution JavaScript Engine for Detecting Evasive Techniques [53.288368877654705]
FV8はJavaScriptコードの回避テクニックを特定するために設計された修正V8 JavaScriptエンジンである。
動的コードを条件付きで注入するAPI上でのコード実行を選択的に実施する。
1,443のnpmパッケージと、少なくとも1つのタイプのエスケープを含む164の(82%)拡張を識別する。
論文 参考訳(メタデータ) (2024-05-21T19:54:19Z) - WEFix: Intelligent Automatic Generation of Explicit Waits for Efficient
Web End-to-End Flaky Tests [13.280540531582945]
Web e2e テストにおいて UI ベースのフレキネスの修正コードを自動生成する技術である WEFix を提案する。
We evaluate the effective and efficiency of WEFix against 122 web e2e flaky tests from 7 popular real-world projects。
論文 参考訳(メタデータ) (2024-02-15T06:51:53Z) - Taming Timeout Flakiness: An Empirical Study of SAP HANA [47.29324864511411]
不安定なテストは回帰テストに悪影響を及ぼします。
テストタイムアウトは、このような不安定なテストの失敗に寄与する要因のひとつです。
テストのフレキネス率は、繰り返しテストの実行回数によって49%から70%の範囲である。
論文 参考訳(メタデータ) (2024-02-07T20:01:41Z) - Do Automatic Test Generation Tools Generate Flaky Tests? [12.813573907094074]
テスト生成ツールが生成するフレキなテストの頻度と性質はほとんど不明である。
EvoSuite(Java)とPynguin(Python)を使ってテストを生成し、各テストは200回実行します。
この結果から, フレキネスは開発者の手書きテストと同様, 生成テストでも一般的であることが判明した。
論文 参考訳(メタデータ) (2023-10-08T16:44:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。