論文の概要: Coverage-Guided Testing for Deep Learning Models: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2507.00496v1
- Date: Tue, 01 Jul 2025 07:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.45397
- Title: Coverage-Guided Testing for Deep Learning Models: A Comprehensive Survey
- Title(参考訳): ディープラーニングモデルのためのカバレッジガイドテスト:総合的な調査
- Authors: Hongjing Guo, Chuanqi Tao, Zhiqiu Huang, Weiqin Zou,
- Abstract要約: ディープラーニング(DL)モデルは、安全クリティカルな領域にますます適用されています。
Coverage-Guided Testing (CGT) は、誤ったモデル行動や予期せぬモデル行動を特定するためのフレームワークとして有名である。
既存のCGT研究は方法論的に断片化され、現在の進歩と新たなトレンドの理解が制限されている。
- 参考スコア(独自算出の注目度): 4.797322346441166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As Deep Learning (DL) models are increasingly applied in safety-critical domains, ensuring their quality has emerged as a pressing challenge in modern software engineering. Among emerging validation paradigms, coverage-guided testing (CGT) has gained prominence as a systematic framework for identifying erroneous or unexpected model behaviors. Despite growing research attention, existing CGT studies remain methodologically fragmented, limiting the understanding of current advances and emerging trends. This work addresses that gap through a comprehensive review of state-of-the-art CGT methods for DL models, including test coverage analysis, coverage-guided test input generation, and coverage-guided test input optimization. This work provides detailed taxonomies to organize these methods based on methodological characteristics and application scenarios. We also investigate evaluation practices adopted in existing studies, including the use of benchmark datasets, model architectures, and evaluation aspects. Finally, open challenges and future directions are highlighted in terms of the correlation between structural coverage and testing objectives, method generalizability across tasks and models, practical deployment concerns, and the need for standardized evaluation and tool support. This work aims to provide a roadmap for future academic research and engineering practice in DL model quality assurance.
- Abstract(参考訳): ディープラーニング(DL)モデルは、安全クリティカルな領域にますます適用されつつあるため、現代のソフトウェアエンジニアリングにおいて、その品質が急進的な課題として現れている。
新たな検証パラダイムの中で、カバレッジ誘導テスト(CGT)は、誤ったモデル行動や予期せぬモデル行動を特定するための体系的なフレームワークとして注目されている。
研究の注目は高まっているが、既存のCGT研究は方法論的に断片化され、現在の進歩と新たなトレンドの理解が制限されている。
この研究は、テストカバレッジ分析、カバレッジ誘導テストインプット生成、カバレッジ誘導テストインプット最適化を含む、DLモデルの最新のCGT手法の包括的なレビューを通じて、ギャップを解消する。
本研究は,これらの手法を方法論的特徴と応用シナリオに基づいて整理するための詳細な分類法を提供する。
また,ベンチマークデータセット,モデルアーキテクチャ,評価面など,既存の研究で採用されている評価プラクティスについても検討する。
最後に、構造的カバレッジとテスト目標の相関、タスクとモデル間のメソッドの一般化可能性、実践的なデプロイメント上の懸念、標準化された評価とツールサポートの必要性の観点から、オープンな課題と今後の方向性が強調される。
本研究は,DLモデル品質保証における今後の学術研究・工学実践のロードマップを提供することを目的とする。
関連論文リスト
- AI-Driven Tools in Modern Software Quality Assurance: An Assessment of Benefits, Challenges, and Future Directions [0.0]
この研究は、現代のAI指向ツールを品質保証プロセスに統合するメリット、課題、および展望を評価することを目的としている。
この研究は、AIがQAに変革をもたらす可能性を実証しているが、これらの技術を実装するための戦略的アプローチの重要性を強調している。
論文 参考訳(メタデータ) (2025-06-19T20:22:47Z) - Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - A Survey of Models for Cognitive Diagnosis: New Developments and Future Directions [66.40362209055023]
本研究の目的は,認知診断の現在のモデルについて,機械学習を用いた新たな展開に注目した調査を行うことである。
モデル構造,パラメータ推定アルゴリズム,モデル評価方法,適用例を比較して,認知診断モデルの最近の傾向を概観する。
論文 参考訳(メタデータ) (2024-07-07T18:02:00Z) - Position: Quo Vadis, Unsupervised Time Series Anomaly Detection? [11.269007806012931]
Timeseries Anomaly Detection (TAD)における機械学習奨学金の現状は、欠陥のある評価指標の持続的使用に悩まされている。
本稿は,TADにおける現状を批判的に分析し,現在の研究の誤解を招きかねない軌跡を明らかにした。
論文 参考訳(メタデータ) (2024-05-04T14:43:31Z) - Towards a Framework for Deep Learning Certification in Safety-Critical Applications Using Inherently Safe Design and Run-Time Error Detection [0.0]
航空や他の安全上重要な分野における現実世界の問題について検討し,認定モデルの要件について検討する。
我々は、(i)本質的に安全な設計と(ii)実行時のエラー検出に基づいて、ディープラーニング認定に向けた新しいフレームワークを構築した。
論文 参考訳(メタデータ) (2024-03-12T11:38:45Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Position: AI Evaluation Should Learn from How We Test Humans [65.36614996495983]
人間の評価のための20世紀起源の理論である心理測定は、今日のAI評価における課題に対する強力な解決策になり得る、と我々は主張する。
論文 参考訳(メタデータ) (2023-06-18T09:54:33Z) - A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [117.72709110877939]
テスト時間適応(TTA)は、事前訓練されたモデルをテスト中に、予測する前にラベルのないデータに適応する可能性がある。
TTAはテスト時間領域適応、テスト時間バッチ適応、オンラインテスト時間適応といったテストデータの形態に基づいて、いくつかの異なるグループに分類される。
論文 参考訳(メタデータ) (2023-03-27T16:32:21Z) - GLUECons: A Generic Benchmark for Learning Under Constraints [102.78051169725455]
本研究では,自然言語処理とコンピュータビジョンの分野における9つのタスクの集合であるベンチマークを作成する。
外部知識を制約としてモデル化し、各タスクの制約のソースを特定し、これらの制約を使用するさまざまなモデルを実装します。
論文 参考訳(メタデータ) (2023-02-16T16:45:36Z) - Self-Supervised Anomaly Detection in Computer Vision and Beyond: A
Survey and Outlook [9.85256783464329]
異常検出は、サイバーセキュリティ、金融、医療など、さまざまな領域において重要な役割を担っている。
近年,深層学習モデルの顕著な成長により,この分野において大きな進歩を遂げている。
自己教師型学習の出現は、既存の最先端のアプローチよりも優れた新しいADアルゴリズムの開発を引き起こした。
論文 参考訳(メタデータ) (2022-05-10T21:16:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。