論文の概要: Latent Anchor-Driven Test Generation for Deep Neural Networks
- arxiv url: http://arxiv.org/abs/2606.04310v1
- Date: Wed, 03 Jun 2026 00:33:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.441442
- Title: Latent Anchor-Driven Test Generation for Deep Neural Networks
- Title(参考訳): 深部ニューラルネットワークのための潜時アンカー駆動テスト生成
- Authors: Bin Duan, Matthew B. Dwyer, Guowei Yang,
- Abstract要約: LatteはDeep Neural Networks(DNN)のためのブラックボックステスティングフレームワーク
潜在空間を活用することで、セマンティックに近づき、多種多様で、そしてフォールトリベリングなテストケースを生成する。
単モデルおよび多モデルテストシナリオにおいて,5つのデータセットと10のDNNモデル上でLatteを評価する。
- 参考スコア(独自算出の注目度): 21.287972204772515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep Neural Networks (DNNs) are increasingly being deployed in security-critical and safety-sensitive applications, which makes rigorous testing essential to identify and mitigate model weaknesses. Existing DNN testing approaches explore either the input space or a learned latent space. While latent-space generation can better maintain plausibility than direct input-space mutation, current methods still face a trade-off among exploration controllability, failure diversity, and seed-relative semantic drift. To overcome these limitations, we propose Latte, a black-box testing framework that generates semantically proximate, diverse, and fault-revealing test cases by leveraging the latent space. Specifically, Latte encodes each input seed with a pre-trained VQ-VAE and performs a seed-centered, one-step latent mutation along directions defined by anchors sampled from alternative classes, followed by quantization and decoding back to the input space. This explores local neighborhoods around each seed within the learned latent manifold, resulting in a larger number and broader diversity of oracle-triggering prediction discrepancies under the same budget. We evaluated Latte on 5 datasets and 10 DNN models in single-model and multi-model testing scenarios. Across the evaluated datasets and models, Latte improves fault exposure and behavioral diversity under matched testing budgets. Under the single-model setting, it also maintains low seed-relative semantic drift with respect to the source seeds.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)は、セキュリティクリティカルで安全に敏感なアプリケーションにますますデプロイされているため、モデルの弱点を特定して軽減するためには厳格なテストが不可欠である。
既存のDNNテストアプローチでは、入力空間か学習された潜在空間を探索する。
潜時空間生成は直接的な入力空間突然変異よりも妥当性を維持することができるが、現在の手法は探索の制御可能性、失敗の多様性、シード相対的なセマンティックドリフトのトレードオフに直面している。
これらの制限を克服するために、潜伏空間を活用することで、意味論的に近づき、多様で、障害を回避できるテストケースを生成するブラックボックステストフレームワークであるLatteを提案する。
具体的には、各入力シードを事前訓練されたVQ-VAEでエンコードし、代替クラスからサンプリングされたアンカーによって定義された方向に沿って、シード中心の1ステップの潜伏突然変異を実行し、次いで量子化と入力空間への復号を行う。
このことは、学習された潜在多様体内の各種子の周囲の局所的な近傍を探索し、その結果、同じ予算の下で、オラクルが引き起こす予測の相違がより多く、より広範な多様性をもたらす。
単モデルおよび多モデルテストシナリオにおいて,5つのデータセットと10のDNNモデル上でLatteを評価した。
評価されたデータセットとモデル全体で、Latteは一致したテスト予算の下でのフォールトエクスポージャーと振る舞いの多様性を改善している。
単一モデル設定の下では、ソースシードに対する低シード相対的セマンティックドリフトも維持される。
関連論文リスト
- Generating Realistic, Diverse, and Fault-Revealing Inputs with Latent Space Interpolation for Testing Deep Neural Networks [23.018072013940245]
ARGUSは、現実的で多種多様でフォールトレベリングなテスト入力を生成するブラックボックス方式である。
ARGUSは、ターゲットデータセットに対する現実的で多様な敵のサンプルを生成するのに優れています。
モデル再トレーニングに対向サンプルを使用することで、モデルの分類精度が向上する。
論文 参考訳(メタデータ) (2025-03-22T03:19:55Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - DOTA: Distributional Test-Time Adaptation of Vision-Language Models [69.41389326333771]
トレーニングデータとテストデータの間に大きな分散ギャップが存在する場合、視覚言語の基礎モデルは信頼できない。
本稿では,DOTA(DistributiOnal Test-time Adaptation)を提案する。
この分散中心のアプローチは、モデルが継続的に学習し、デプロイメント環境に適応することを可能にする。
論文 参考訳(メタデータ) (2024-09-28T15:03:28Z) - Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.7704032792820767]
ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T09:47:29Z) - MUAD: Multiple Uncertainties for Autonomous Driving benchmark for
multiple uncertainty types and tasks [10.624564056837835]
MUADデータセットは8,500個のリアルな合成画像で構成され、様々な悪天候条件がある。
このデータセットは、モデルパフォーマンスに対するさまざまな不確実性ソースの影響をより正確に評価することを可能にする。
論文 参考訳(メタデータ) (2022-03-02T22:14:12Z) - GAN Based Boundary Aware Classifier for Detecting Out-of-distribution
Samples [24.572516991009323]
本稿では,ほとんどのIDデータのみを含む閉じたハイパースペースを生成するためのGANベースの境界認識分類器(GBAC)を提案する。
本手法は, 従来のニューラルネットが, 未閉鎖領域として特徴空間を分離し, オード検出に適さない。
GBACを補助モジュールとして、閉じたハイパースペースの外に分散されたoodデータは、より低いスコアで割り当てられ、より効果的なood検出が可能になる。
論文 参考訳(メタデータ) (2021-12-22T03:35:54Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - Attribute-Guided Adversarial Training for Robustness to Natural
Perturbations [64.35805267250682]
本稿では,属性空間への分類器の露出を最大化するために,新しいサンプルを生成することを学習する逆学習手法を提案する。
我々のアプローチは、ディープニューラルネットワークが自然に発生する摂動に対して堅牢であることを可能にする。
論文 参考訳(メタデータ) (2020-12-03T10:17:30Z) - Evidential Sparsification of Multimodal Latent Spaces in Conditional
Variational Autoencoders [63.46738617561255]
訓練された条件付き変分オートエンコーダの離散潜時空間をスパース化する問題を考察する。
顕在的理論を用いて、特定の入力条件から直接証拠を受け取る潜在クラスを特定し、そうでないクラスをフィルタリングする。
画像生成や人間の行動予測などの多様なタスクの実験により,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2020-10-19T01:27:21Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。