論文の概要: MuRS: Mutant Ranking and Suppression using Identifier Templates
- arxiv url: http://arxiv.org/abs/2306.09130v1
- Date: Thu, 15 Jun 2023 13:43:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 19:36:36.996744
- Title: MuRS: Mutant Ranking and Suppression using Identifier Templates
- Title(参考訳): MuRS: Identifierテンプレートを用いた変異ランク付けと抑制
- Authors: Zimin Chen, Malgorzata Salawa, Manushree Vijayvergiya, Goran Petrovic,
Marko Ivankovic and Rene Just
- Abstract要約: Googleの突然変異テストサービスは、差分ベースの突然変異テストをコードレビュープロセスに統合する。
Googleの突然変異テストサービスは、役に立たないミュータントをターゲットにした、いくつかの抑制ルールを実装している。
テスト中のソースコードのパターンによってミュータントをグループ化する自動手法である MuRS を提案し,評価する。
- 参考スコア(独自算出の注目度): 4.9205581820379765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diff-based mutation testing is a mutation testing approach that only mutates
lines affected by a code change under review. Google's mutation testing service
integrates diff-based mutation testing into the code review process and
continuously gathers developer feedback on mutants surfaced during code review.
To enhance the developer experience, the mutation testing service implements a
number of suppression rules, which target not-useful mutants-that is, mutants
that have consistently received negative developer feedback. However, while
effective, manually implementing suppression rules require significant
engineering time. An automatic system to rank and suppress mutants would
facilitate the maintenance of the mutation testing service. This paper proposes
and evaluates MuRS, an automated approach that groups mutants by patterns in
the source code under test and uses these patterns to rank and suppress future
mutants based on historical developer feedback on mutants in the same group. To
evaluate MuRS, we conducted an A/B testing study, comparing MuRS to the
existing mutation testing service. Despite the strong baseline, which uses
manually developed suppression rules, the results show a statistically
significantly lower negative feedback ratio of 11.45% for MuRS versus 12.41%
for the baseline. The results also show that MuRS is able to recover existing
suppression rules implemented in the baseline. Finally, the results show that
statement-deletion mutant groups received both the most positive and negative
developer feedback, suggesting a need for additional context that can
distinguish between useful and not-useful mutants in these groups. Overall,
MuRS has the potential to substantially reduce the development and maintenance
cost for an effective mutation testing service by automatically learning
suppression rules.
- Abstract(参考訳): ディフベースの突然変異テスト(Diff-based mutation testing)は、レビュー中のコード変更によって影響を受ける行だけを突然変異させる突然変異テスト手法である。
Googleの突然変異テストサービスは、差分ベースの変異テストをコードレビュープロセスに統合し、コードレビュー中に浮上したミュータントに対する開発者のフィードバックを継続的に収集する。
開発者エクスペリエンスを向上させるために、この突然変異テストサービスは、役に立たないミュータントをターゲットにした、多くの抑制ルールを実装している。
しかし、効果的な一方で、手動による抑制ルールの実装にはかなりのエンジニアリング時間が必要である。
ミュータントをランク付けし抑制する自動システムにより、突然変異試験サービスのメンテナンスが容易になる。
本稿では、ミュータントをテスト中のソースコードのパターンごとにグループ化し、同じグループ内のミュータントに対する歴史的開発者フィードバックに基づいて将来のミュータントをランク付けし、抑制する自動アプローチであるmursを提案し、評価する。
mursを評価するために,既存の変異試験サービスと比較し,a/b試験を行った。
手動で開発された抑圧規則を用いた強いベースラインにもかかわらず、結果は統計学的にMRSが11.45%、ベースラインが12.41%であった。
また, MuRS はベースラインに実装された既存の抑制ルールを復元できることを示した。
最後に、ステートメント欠失変異群は最も肯定的かつ否定的な開発者フィードバックを受けており、これらのグループで有用かつ役に立たないミュータントを区別できる追加のコンテキストの必要性が示唆された。
全体として、mourは抑制ルールを自動的に学習することによって、効果的な突然変異テストサービスの開発とメンテナンスコストを大幅に削減する可能性がある。
関連論文リスト
- Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - An Empirical Evaluation of Manually Created Equivalent Mutants [54.02049952279685]
手動で作成した突然変異体の10%未満は等価である。
驚くべきことに、我々の発見は、開発者の大部分が同等のミュータントを正確に識別するのに苦労していることを示している。
論文 参考訳(メタデータ) (2024-04-14T13:04:10Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Contextual Predictive Mutation Testing [17.832774161583036]
MutationBERTは、ソースメソッドの突然変異とテストメソッドを同時にエンコードする予測突然変異テストのアプローチである。
精度が高いため、MutationBERTは、ライブミュータントをチェック・検証する以前のアプローチで費やされた時間の33%を節約する。
我々は、入力表現と、テストマトリックスレベルからテストスイートレベルまで予測を引き上げるためのアグリゲーションアプローチを検証し、同様の性能改善を見出した。
論文 参考訳(メタデータ) (2023-09-05T17:00:15Z) - Mutation Testing of Deep Reinforcement Learning Based on Real Faults [11.584571002297217]
本稿では,MT(Reinforcement Learning, 強化学習)システムに拡張するために,既存のMT(Mutation Testing)アプローチに基づいて構築する。
本研究は, 突然変異致死定義の設計選択が, 生成したテストケースだけでなく, 変異が致死するか否かにも影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2023-01-13T16:45:56Z) - Systematic Assessment of Fuzzers using Mutation Analysis [20.91546707828316]
ソフトウェアテストでは、テスト品質を評価するためのゴールドスタンダードは突然変異解析である。
突然変異解析は、様々なカバレッジ対策を仮定し、大規模で多様な障害セットを提供する。
複数の突然変異をプールし、初めて(初めて)ファジィを突然変異解析と比較する現代の突然変異解析技術を適用します。
論文 参考訳(メタデータ) (2022-12-06T15:47:47Z) - Effective Mutation Rate Adaptation through Group Elite Selection [50.88204196504888]
本稿では,GESMR(Group Elite Selection of Mutation Rates)アルゴリズムを提案する。
GESMRは解の集団とMRの集団を共進化させ、各MRは解群に割り当てられる。
同じ数の関数評価とオーバーヘッドのほとんどないGESMRは、以前のアプローチよりも早く、より良いソリューションに収束する。
論文 参考訳(メタデータ) (2022-04-11T01:08:26Z) - MutFormer: A context-dependent transformer-based model to predict
pathogenic missense mutations [5.153619184788929]
ミスセンス突然変異は、ヒトの遺伝疾患の原因となる既知の変異の約半分を占める。
ディープラーニングの最近の進歩は、トランスフォーマーモデルが特にシーケンスのモデリングに強力であることを示している。
病原性ミスセンス変異の予測のためのトランスフォーマーモデルであるMutFormerを紹介する。
論文 参考訳(メタデータ) (2021-10-27T20:17:35Z) - Detecting Rewards Deterioration in Episodic Reinforcement Learning [63.49923393311052]
多くのRLアプリケーションでは、トレーニングが終了すると、エージェント性能の劣化をできるだけ早く検出することが不可欠である。
我々は,各エピソードにおける報酬が独立でもなく,同一に分散した,マルコフでもない,エピソード的枠組みを考察する。
平均シフトは、時間信号の劣化(報酬など)に対応する方法で定義し、最適な統計的パワーでこの問題の試行を導出する。
論文 参考訳(メタデータ) (2020-10-22T12:45:55Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。