論文の概要: Empirical Derivations from an Evolving Test Suite
- arxiv url: http://arxiv.org/abs/2511.00915v1
- Date: Sun, 02 Nov 2025 12:29:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.992033
- Title: Empirical Derivations from an Evolving Test Suite
- Title(参考訳): 進化するテストスイートからの経験的導出
- Authors: Jukka Ruohonen, Abhishek Tiwari,
- Abstract要約: 本稿では,NetBSDオペレーティングシステムの自動化,継続的,仮想化ベースのソフトウェアテストスイートについて,縦断的解析を行った。
結果によると、テストスイートは継続的に成長し、現在1万以上の個別のテストケースをカバーしている。
- 参考スコア(独自算出の注目度): 0.40706213109831196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper presents a longitudinal empirical analysis of the automated, continuous, and virtualization-based software test suite of the NetBSD operating system. The longitudinal period observed spans from the initial roll out of the test suite in the early 2010s to late 2025. According to the results, the test suite has grown continuously, currently covering over ten thousand individual test cases. Failed test cases exhibit overall stability, although there have been shorter periods marked with more frequent failures. A similar observation applies to build failures, failures of the test suite to complete, and installation failures, all of which are also captured by the NetBSD's testing framework. Finally, code churn and kernel modifications do not provide longitudinally consistent statistical explanations for the failures. Although some periods exhibit larger effects, including particularly with respect to the kernel modifications, the effects are small on average. Even though only in an exploratory manner, these empirical observations contribute to efforts to draw conclusions from large-scale and evolving software test suites.
- Abstract(参考訳): 本稿では,NetBSDオペレーティングシステムの自動化,継続的,仮想化ベースのソフトウェアテストスイートについて,縦断的解析を行った。
観察期間は、2010年代初めから2025年代後半にかけての試験スイートの最初のロールアウトまでである。
結果によると、テストスイートは継続的に成長し、現在1万以上の個別のテストケースをカバーしている。
失敗したテストケースは全体の安定性を示すが、より頻繁な失敗を特徴とする短い期間がある。
同様の観察は、ビルドの失敗、テストスイートの完了の失敗、インストールの失敗にも適用される。
最後に、コードチャーンとカーネルの変更は、障害に対して縦に一貫した統計的説明を提供しない。
いくつかの期間では、特にカーネルの変更に関して、より大きな効果を示すが、平均的には、その効果は小さい。
探索的な方法に留まらず、これらの経験的な観察は、大規模で進化中のソフトウェアテストスイートから結論を引き出す努力に寄与する。
関連論文リスト
- E-Test: E'er-Improving Test Suites [8.585182075116336]
E-Testは、大規模なシナリオからまだテストされていない実行を特定します。
テストスイートを強化する新しいテストケースを生成する。
E-Testは、テストされていない実行シナリオを最先端のアプローチよりも大幅に改善する。
論文 参考訳(メタデータ) (2025-10-21T21:23:33Z) - Systemic Flakiness: An Empirical Analysis of Co-Occurring Flaky Test Failures [6.824747267214373]
不安定なテストは、コードの変更なしに一貫性のない結果をもたらす。
開発者は、毎月2250ドル(約2万5000円)の費用で、不気味なテストの修理に1.28%を費やしている。
フラキーテストは、しばしばクラスタ内に存在し、同じ根本原因を共有する共起失敗は、系統的なフレキネス(systemic flakiness)と呼ばれる。
論文 参考訳(メタデータ) (2025-04-23T14:51:23Z) - Ever-Improving Test Suite by Leveraging Large Language Models [0.0]
ソフトウェアシステムの実際の使用を反映したテストケースによるテストスイートの拡大は、長く続くソフトウェアシステムの品質を維持する上で非常に重要である。
E-Testは、本番環境で発生しまだテストされていない動作を実行するテストケースでテストスイートを漸進的に拡張するアプローチである。
論文 参考訳(メタデータ) (2025-04-15T13:38:25Z) - Do Test and Environmental Complexity Increase Flakiness? An Empirical Study of SAP HANA [47.29324864511411]
不安定なテストはコードの変更なしにランダムに失敗する。
テストの特徴と,テストのフレキネスに影響を与える可能性のあるテスト環境について検討する。
論文 参考訳(メタデータ) (2024-09-16T07:52:09Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z) - Sequential Kernelized Independence Testing [77.237958592189]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。