論文の概要: On the Effectiveness of Modular Testing with EvoSuite
- arxiv url: http://arxiv.org/abs/2604.27112v1
- Date: Wed, 29 Apr 2026 19:05:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.764526
- Title: On the Effectiveness of Modular Testing with EvoSuite
- Title(参考訳): EvoSuiteを用いたモジュールテストの有効性について
- Authors: Elizabeth Dinella,
- Abstract要約: EvoSuiteテストジェネレータによるモジュールテストの評価と改善を行った。
非ターゲット設定メソッドへの呼び出しを許可する厳格な制限のため、EvoSuiteのモジュラーテストモードは効果がないことが分かりました。
textscemoteはSF100ベンチマークのサブセットで評価され、対象メソッドのカバレッジが15.15%改善された。
- 参考スコア(独自算出の注目度): 0.7022379705335199
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the effectiveness of modular randomized testing for object oriented programs in Java. Modular testing involves testing individual components of a program in isolation. Often times, for effective test generation, a series of non-target setup calls must be included to obtain high coverage of the target component. In this work, we evaluate and improve modular testing with the EvoSuite test generator. We find that due to strict restrictions that disallow calls to non-target setup methods, EvoSuite's modular testing mode is ineffective and often results in low branch coverage. We propose \textsc{emote} (Effective Modular Testing with EvoSuite): an enhancement to EvoSuite that relaxes this restriction, allowing non-target methods to be included in the test prefixes. This modification draws inspiration from developer-written fuzz drivers, which often invoke setup methods to properly initialize the state before testing the target method. To ensure meaningful test generation, we modify EvoSuite's fitness function to focus branch coverage contributions on the call chain originating from the target method. \textsc{emote} is evaluated on a subset of the SF100 benchmark, showing a 15.15\% improvement in coverage of the target methods.
- Abstract(参考訳): 本稿では,オブジェクト指向プログラムにおけるモジュール型ランダム化テストの有効性について検討する。
モジュールテストでは、プログラムの個々のコンポーネントを独立した形でテストする。
多くの場合、効果的なテスト生成には、ターゲットコンポーネントの高カバレッジを得るために、一連の非ターゲット設定呼び出しを含めなければならない。
本研究では,EvoSuiteテストジェネレータを用いたモジュールテストの評価と改善を行う。
非ターゲット設定メソッドへの呼び出しを許可する厳格な制限のため、EvoSuiteのモジュラーテストモードは効果がなく、しばしばブランチカバレッジが低くなる。
本稿では,EvoSuiteによるEffective Modular Testing(Effective Modular Testing with EvoSuite)を提案する。
この修正は、しばしば設定メソッドを呼び出して、ターゲットメソッドをテストする前に状態を適切に初期化する、開発者記述のファズドライバからインスピレーションを得ている。
有意義なテスト生成を保証するため,EvoSuiteの適合度関数を修正して,対象手法から派生したコールチェーンに分岐カバレッジのコントリビューションを集中させる。
\textsc{emote} は SF100 ベンチマークのサブセットで評価され、対象メソッドのカバレッジが 15.15 % 改善されている。
関連論文リスト
- Code-A1: Adversarial Evolving of Code LLM and Test LLM via Reinforcement Learning [54.95476453942411]
コード生成のための強化学習は、単体テストのパスレートから検証可能な報酬に依存する。
最近のセルフプレイ手法は、1つのモデルでコードとテスト生成を統合する。
Code-A1は、人間のアノテーションによるテストでトレーニングされたコード生成のパフォーマンスマッチングまたはモデルを超えることを実現する。
論文 参考訳(メタデータ) (2026-03-16T17:58:13Z) - EvoTest: Evolutionary Test-Time Learning for Self-Improving Agentic Systems [59.66823584073748]
現在のAIエージェントの基本的な制限は、テスト時に複雑なスキルをその場で学べないことだ。
EvoTestは,エージェントの微調整や勾配を伴わずにエージェントを改良する,進化的テストタイム学習フレームワークである。
論文 参考訳(メタデータ) (2025-10-15T07:16:28Z) - Alignment with Fill-In-the-Middle for Enhancing Code Generation [56.791415642365415]
コードスニペットを小さな粒度のブロックに分割し,同じテストケースからより多様なDPOペアを生成する手法を提案する。
提案手法は,HumanEval (+), MBPP (+), APPS, LiveCodeBench, BigCodeBenchといったベンチマークデータセットの実験によって検証された,コード生成タスクの大幅な改善を示す。
論文 参考訳(メタデータ) (2025-08-27T03:15:53Z) - Studying the Impact of Early Test Termination Due to Assertion Failure on Code Coverage and Spectrum-based Fault Localization [48.22524837906857]
本研究は,アサーション障害による早期検査終了に関する最初の実証的研究である。
6つのオープンソースプロジェクトの207バージョンを調査した。
以上の結果から,早期検査終了は,コードカバレッジとスペクトルに基づく障害局所化の有効性の両方を損なうことが示唆された。
論文 参考訳(メタデータ) (2025-04-06T17:14:09Z) - TestForge: Feedback-Driven, Agentic Test Suite Generation [7.288137795439405]
TestForgeは、現実世界のコードのための高品質なテストスイートをコスト効率よく生成するように設計されたエージェントユニットテスティングフレームワークである。
TestForgeは、最先端の検索ベースの技術と比較して、より自然で理解しやすいテストを生成する。
論文 参考訳(メタデータ) (2025-03-18T20:21:44Z) - Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文 参考訳(メタデータ) (2024-12-02T18:11:30Z) - TestGenEval: A Real World Unit Test Generation and Test Completion Benchmark [24.14654309612826]
TestGenEvalは、1,210のコードから68,647のテストと、11の保守されたPythonリポジトリにまたがるテストファイルペアで構成されている。
初期テストのオーサリング、テストスイートの補完、コードカバレッジの改善をカバーしている。
パラメータは7Bから405Bまで様々である。
論文 参考訳(メタデータ) (2024-10-01T14:47:05Z) - Pseudo-IoU: Improving Label Assignment in Anchor-Free Object Detection [60.522877583407904]
現在のアンカーフリー物体検出器は非常に単純で有効であるが、正確なラベル割り当て方法がない。
Pseudo-Intersection-over-Union(Pseudo-IoU): アンカーフリーなオブジェクト検出フレームワークに、より標準化され、正確な割り当てルールをもたらす単純なメトリックである。
本手法はベルやホイッスルを使わずに最新のアンカーフリー手法と同等の性能を実現する。
論文 参考訳(メタデータ) (2021-04-29T02:48:47Z) - Learning How to Search: Generating Effective Test Cases Through Adaptive
Fitness Function Selection [11.025982207220277]
本稿では,適合度関数の識別を二次最適化ステップとして扱うことを提案する。
適合度関数の選択を変更できる適応アルゴリズムは、生成プロセス全体を通して選択を調整し、目標達成を最大化することができる。
私たちはEvoSuiteFITというフレームワークを、実際のJavaケースのセットで評価しました。
論文 参考訳(メタデータ) (2021-02-09T13:44:37Z) - Unit Test Case Generation with Transformers and Focal Context [10.220204860586582]
AthenaTestは、現実世界の焦点メソッドと開発者が記述したテストケースから学習することで、単体テストケースを生成することを目的としている。
我々は,Javaにおける単体テストケースメソッドとそれに対応する焦点メソッドの並列コーパスとして最大規模で公開されているMethods2Testを紹介する。
AthenaTestを5つの欠陥4jプロジェクトで評価し、30回の試行で焦点メソッドの43.7%をカバーする25Kパステストケースを生成した。
論文 参考訳(メタデータ) (2020-09-11T18:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。