論文の概要: Generalizing Test Cases for Comprehensive Test Scenario Coverage
- arxiv url: http://arxiv.org/abs/2604.21771v2
- Date: Mon, 27 Apr 2026 13:12:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:06.936982
- Title: Generalizing Test Cases for Comprehensive Test Scenario Coverage
- Title(参考訳): 包括的テストシナリオカバレッジのためのテストケースの一般化
- Authors: Binhang Qi, Yun Lin, Xinyi Weng, Chenyan Liu, Hailong Sun, Gordon Fraser, Jin Song Dong,
- Abstract要約: TestGeneralizerは、テストシナリオを包括的にカバーするテストケースを一般化するためのフレームワークである。
12のオープンソースJavaプロジェクトで、最先端の3つのベースラインに対して評価します。
- 参考スコア(独自算出の注目度): 24.924445847931597
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Test cases are essential for software development and maintenance. In practice, developers derive multiple test cases from an implicit pattern based on their understanding of requirements and inference of diverse test scenarios, each validating a specific behavior of the focal method. However, producing comprehensive tests is time-consuming and error-prone: many important tests that should have accompanied the initial test are added only after a significant delay, sometimes only after bugs are triggered. Existing automated test generation techniques largely focus on code coverage. Yet in real projects, practical tests are seldom driven by code coverage alone, since test scenarios do not necessarily align with control-flow branches. Instead, test scenarios originate from requirements, which are often undocumented and implicitly embedded in a project's design and implementation. However, developer-written tests are frequently treated as executable specifications; thus, even a single initial test that reflects the developer's intent can reveal the underlying requirement and the diverse scenarios that should be validated. In this work, we propose TestGeneralizer, a framework for generalizing test cases to comprehensively cover test scenarios. TestGeneralizer orchestrates three stages: (1) enhancing the understanding of the requirement and scenario behind the focal method and initial test; (2) generating a test scenario template and crystallizing it into various test scenario instances; and (3) generating and refining executable test cases from these instances. We evaluate TestGeneralizer against three state-of-the-art baselines on 12 open-source Java projects. TestGeneralizer achieves significant improvements: +31.66% and +23.08% over ChatTester, in mutation-based and LLM-assessed scenario coverage, respectively.
- Abstract(参考訳): テストケースはソフトウェア開発とメンテナンスに不可欠です。
実際には、開発者は要件の理解とさまざまなテストシナリオの推論に基づいて、暗黙のパターンから複数のテストケースを導き、それぞれが焦点メソッドの特定の振る舞いを検証する。
しかしながら、包括的なテストの作成には時間がかかり、エラーが発生します。最初のテストに付随すべき重要なテストの多くは、重大な遅延の後、時にはバグがトリガーされた後にのみ追加されます。
既存の自動テスト生成技術は主にコードカバレッジに焦点を当てている。
しかし、実際のプロジェクトでは、テストシナリオは制御フローのブランチと必ずしも一致しないため、コードカバレッジだけで実践的なテストはめったに行われません。
テストシナリオは要件から始まり、しばしば文書化されず、暗黙的にプロジェクトの設計と実装に埋め込まれます。
しかしながら、開発者が記述したテストは実行可能な仕様として扱われることが多いため、開発者の意図を反映した1つの初期テストでさえ、基礎となる要件と検証すべきさまざまなシナリオを明らかにすることができる。
本研究では,テストシナリオを包括的にカバーするテストケースを一般化するフレームワークであるTestGeneralizerを提案する。
TestGeneralizerは、(1)フォーカスメソッドと初期テストの背後にある要件とシナリオの理解を強化すること、(2)テストシナリオテンプレートを生成し、それを様々なテストシナリオインスタンスに結晶化すること、(3)実行可能なテストケースの生成と修正の3つのステージを編成する。
われわれはTestGeneralizerを12のオープンソースプロジェクトの最先端のベースラインに対して評価する。
TestGeneralizerは、ChatTesterよりも+31.66%と+23.08%の大幅な改善を実現している。
関連論文リスト
- E-Test: E'er-Improving Test Suites [8.585182075116336]
E-Testは、大規模なシナリオからまだテストされていない実行を特定します。
テストスイートを強化する新しいテストケースを生成する。
E-Testは、テストされていない実行シナリオを最先端のアプローチよりも大幅に改善する。
論文 参考訳(メタデータ) (2025-10-21T21:23:33Z) - Intention-Driven Generation of Project-Specific Test Cases [45.2380093475221]
検証意図の記述からプロジェクト固有のテストを生成するIntentionTestを提案する。
13のオープンソースプロジェクトから4,146件のテストケースで,最先端のベースライン(DA, ChatTester, EvoSuite)に対してIntentionTestを広範囲に評価した。
論文 参考訳(メタデータ) (2025-07-28T08:35:04Z) - Studying the Impact of Early Test Termination Due to Assertion Failure on Code Coverage and Spectrum-based Fault Localization [48.22524837906857]
本研究は,アサーション障害による早期検査終了に関する最初の実証的研究である。
6つのオープンソースプロジェクトの207バージョンを調査した。
以上の結果から,早期検査終了は,コードカバレッジとスペクトルに基づく障害局所化の有効性の両方を損なうことが示唆された。
論文 参考訳(メタデータ) (2025-04-06T17:14:09Z) - CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。
ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文 参考訳(メタデータ) (2025-02-12T21:42:56Z) - Observation-based unit test generation at Meta [52.4716552057909]
TestGenは、アプリケーション実行中に観察された複雑なオブジェクトのシリアライズされた観察から作られたユニットテストを自動的に生成する。
TestGenは518のテストを本番環境に投入し、継続的統合で9,617,349回実行され、5,702の障害が見つかった。
評価の結果,信頼性の高い4,361のエンドツーエンドテストから,少なくとも86%のクラスでテストを生成することができた。
論文 参考訳(メタデータ) (2024-02-09T00:34:39Z) - Automatic Generation of Test Cases based on Bug Reports: a Feasibility
Study with Large Language Models [4.318319522015101]
既存のアプローチは、単純なテスト(例えば単体テスト)や正確な仕様を必要とするテストケースを生成する。
ほとんどのテスト手順は、テストスイートを形成するために人間が書いたテストケースに依存しています。
大規模言語モデル(LLM)を活用し,バグレポートを入力として利用することにより,この生成の実現可能性を検討する。
論文 参考訳(メタデータ) (2023-10-10T05:30:12Z) - CodeT: Code Generation with Generated Tests [49.622590050797236]
テストケースを自動的に生成するための事前学習言語モデルについて検討する。
CodeTは生成されたテストケースを使ってコードソリューションを実行し、次に最良のソリューションを選択します。
我々は,HumanEvalとMBPPのベンチマークを用いて,5種類の事前学習モデル上でCodeTを評価する。
論文 参考訳(メタデータ) (2022-07-21T10:18:37Z) - Unit Test Case Generation with Transformers and Focal Context [10.220204860586582]
AthenaTestは、現実世界の焦点メソッドと開発者が記述したテストケースから学習することで、単体テストケースを生成することを目的としている。
我々は,Javaにおける単体テストケースメソッドとそれに対応する焦点メソッドの並列コーパスとして最大規模で公開されているMethods2Testを紹介する。
AthenaTestを5つの欠陥4jプロジェクトで評価し、30回の試行で焦点メソッドの43.7%をカバーする25Kパステストケースを生成した。
論文 参考訳(メタデータ) (2020-09-11T18:57:36Z) - Beyond Accuracy: Behavioral Testing of NLP models with CheckList [66.42971817954806]
CheckList は NLP モデルをテストするためのタスクに依存しない方法論である。
CheckListには、包括的なテストのアイデアを促進する一般的な言語機能とテストタイプのマトリックスが含まれている。
ユーザスタディでは、CheckListのNLP実践者が2倍の数のテストを作成し、それのないユーザの約3倍のバグを発見しました。
論文 参考訳(メタデータ) (2020-05-08T15:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。