論文の概要: New Formulation of DNN Statistical Mutation Killing for Ensuring Monotonicity: A Technical Report
- arxiv url: http://arxiv.org/abs/2507.11199v1
- Date: Tue, 15 Jul 2025 11:12:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.087333
- Title: New Formulation of DNN Statistical Mutation Killing for Ensuring Monotonicity: A Technical Report
- Title(参考訳): 単調性確保のためのDNN統計的変異キリングの新しい定式化:技術報告
- Authors: Jinhan Kim, Nargiz Humbatova, Gunel Jahangirova, Shin Yoo, Paolo Tonella,
- Abstract要約: ミューテーションテストは、ディープニューラルネットワークのテストスイートの有効性を評価するための強力なテクニックとして登場した。
DeepCrimeの統計変異による殺傷基準は、その変異が元のモデルと大きく異なるかどうかを統計的に検証するために活用されている。
単調性の性質に反する、つまり、テストセットを拡張することで、以前殺されたミュータントが殺されていると分類されなくなる可能性がある。
本稿では,一律性を確保しつつ,その統計的厳密性を保ったフィッシャー検定に基づく統計的変異殺傷の新しい定式化を提案する。
- 参考スコア(独自算出の注目度): 17.586333091528594
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mutation testing has emerged as a powerful technique for evaluating the effectiveness of test suites for Deep Neural Networks. Among existing approaches, the statistical mutant killing criterion of DeepCrime has leveraged statistical testing to determine whether a mutant significantly differs from the original model. However, it suffers from a critical limitation: it violates the monotonicity property, meaning that expanding a test set may result in previously killed mutants no longer being classified as killed. In this technical report, we propose a new formulation of statistical mutant killing based on Fisher exact test that preserves the statistical rigour of it while ensuring monotonicity.
- Abstract(参考訳): ミューテーションテストは、ディープニューラルネットワークのテストスイートの有効性を評価するための強力なテクニックとして登場した。
既存のアプローチの中で、DeepCrimeの統計的変異殺定基準は、その変異が元のモデルと大きく異なるかどうかを統計的に検証するために活用されている。
しかし、これは致命的な制限に悩まされる:それは単調性の性質に反し、つまり、テストセットを拡張することによって、以前殺されたミュータントが殺されていると分類されなくなる可能性がある。
本稿では,一律性を確保しつつ,その統計的厳密性を保ったフィッシャー検定に基づく統計的変異体殺傷の新しい定式化を提案する。
関連論文リスト
- Statistically Significant $k$NNAD by Selective Inference [12.703556860454565]
kNNADを含む異常検出における重要な課題は、検出された異常の信頼性を適切に定量化することである。
統計的仮説テストとしてkNNADを定式化し、$p$-valuesを用いて偽検出の確率を定量化する。
SIを利用することで、Stat-kNNAD法は検出された異常が理論的保証とともに統計的に有意であることを保証する。
論文 参考訳(メタデータ) (2025-02-18T15:58:58Z) - An Empirical Evaluation of Manually Created Equivalent Mutants [54.02049952279685]
手動で作成した突然変異体の10%未満は等価である。
驚くべきことに、我々の発見は、開発者の大部分が同等のミュータントを正確に識別するのに苦労していることを示している。
論文 参考訳(メタデータ) (2024-04-14T13:04:10Z) - Entropy is not Enough for Test-Time Adaptation: From the Perspective of
Disentangled Factors [36.54076844195179]
テストタイム適応(TTA) 未確認のテストデータのための訓練済みのディープニューラルネットワーク。
本稿では,Destroy Your Object (DeYO) という新しいTTA手法を紹介する。
論文 参考訳(メタデータ) (2024-03-12T07:01:57Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - A Probabilistic Framework for Mutation Testing in Deep Neural Networks [12.033944769247958]
不整合を緩和する確率変異テスト(PMT)手法を提案する。
PMTは、評価を通じてより一貫性のある、より情報のある突然変異の決定を可能にする。
論文 参考訳(メタデータ) (2022-08-11T19:45:14Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Learn then Test: Calibrating Predictive Algorithms to Achieve Risk
Control [67.52000805944924]
Learn then Test (LTT)は、機械学習モデルを校正するフレームワークである。
私たちの主な洞察は、リスクコントロール問題を複数の仮説テストとして再設計することです。
我々は、コンピュータビジョンの詳細な実例を用いて、コア機械学習タスクの新しいキャリブレーション手法を提供するために、我々のフレームワークを使用します。
論文 参考訳(メタデータ) (2021-10-03T17:42:03Z) - Increasing the efficiency of randomized trial estimates via linear
adjustment for a prognostic score [59.75318183140857]
ランダム化実験による因果効果の推定は臨床研究の中心である。
歴史的借用法のほとんどは、厳格なタイプiエラー率制御を犠牲にして分散の削減を達成する。
論文 参考訳(メタデータ) (2020-12-17T21:10:10Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - On the power of conditional independence testing under model-X [36.9351790405311]
最近導入された Model-X (MX) フレームワークは、活発な方法論研究の対象となっている。
MX CIテストのパワーについて検討し、実際は確率に基づく統計を用いた方がよいことを示す。
論文 参考訳(メタデータ) (2020-05-12T01:24:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。