論文の概要: Provably Valid and Diverse Mutations of Real-World Media Data for DNN
Testing
- arxiv url: http://arxiv.org/abs/2112.01956v2
- Date: Tue, 24 Oct 2023 17:28:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 04:00:49.891008
- Title: Provably Valid and Diverse Mutations of Real-World Media Data for DNN
Testing
- Title(参考訳): DNNテストのための実世界のメディアデータの多変量解析
- Authors: Yuanyuan Yuan, Qi Pang, Shuai Wang
- Abstract要約: ディープニューラルネットワーク(DNN)は、しばしば高次元メディアデータ(写真、テキスト、音声など)を受け入れ、その知覚内容(例えば猫)を理解する。
本研究では,メディア入力突然変異における2つの重要な目的である認知多様性(DIV)と妥当性(VAL)を,多様体に基づく厳密な方法で再検討する。
対照的に,実世界のメディアデータを,多様体に基づく高いDIVとVALで変更できる可能性について論じる。
- 参考スコア(独自算出の注目度): 21.53131764596573
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep neural networks (DNNs) often accept high-dimensional media data (e.g.,
photos, text, and audio) and understand their perceptual content (e.g., a cat).
To test DNNs, diverse inputs are needed to trigger mis-predictions. Some
preliminary works use byte-level mutations or domain-specific filters (e.g.,
foggy), whose enabled mutations may be limited and likely error-prone. SOTA
works employ deep generative models to generate (infinite) inputs. Also, to
keep the mutated inputs perceptually valid (e.g., a cat remains a "cat" after
mutation), existing efforts rely on imprecise and less generalizable
heuristics.
This study revisits two key objectives in media input mutation - perception
diversity (DIV) and validity (VAL) - in a rigorous manner based on manifold, a
well-developed theory capturing perceptions of high-dimensional media data in a
low-dimensional space. We show important results that DIV and VAL inextricably
bound each other, and prove that SOTA generative model-based methods
fundamentally fail to mutate real-world media data (either sacrificing DIV or
VAL). In contrast, we discuss the feasibility of mutating real-world media data
with provably high DIV and VAL based on manifold.
We concretize the technical solution of mutating media data of various
formats (images, audios, text) via a unified manner based on manifold.
Specifically, when media data are projected into a low-dimensional manifold,
the data can be mutated by walking on the manifold with certain directions and
step sizes. When contrasted with the input data, the mutated data exhibit
encouraging DIV in the perceptual traits (e.g., lying vs. standing dog) while
retaining reasonably high VAL (i.e., a dog remains a dog). We implement our
techniques in DEEPWALK for testing DNNs. DEEPWALK outperforms prior methods in
testing comprehensiveness and can find more error-triggering inputs with higher
quality.
- Abstract(参考訳): ディープニューラルネットワーク(dnn)は、しばしば高次元メディアデータ(例えば写真、テキスト、音声)を受け取り、その知覚内容(例えば猫)を理解する。
DNNをテストするには、誤予測を引き起こすために多様な入力が必要である。
いくつかの予備的な研究では、バイトレベルの突然変異やドメイン固有のフィルター(霧など)を使用し、有効変異は制限され、エラーを起こしやすい。
sota worksは(無限の)入力を生成するために深い生成モデルを採用している。
また、変異した入力を知覚的に有効に保つために(例えば、猫は突然変異後に「猫」のままである)、既存の努力は不正確で一般化不可能なヒューリスティックに頼っている。
本研究は,低次元空間における高次元メディアデータの知覚を捉える理論である,多様体に基づく厳密な手法により,メディア入力変異(DIV)と妥当性(VAL)の2つの重要な目的を再考する。
DIV と VAL が互いに密接な関係にある重要な結果を示し、SOTA 生成モデルに基づく手法が実世界のメディアデータ(DIV と VAL の犠牲)を根本的に変更できないことを証明した。
対照的に,実世界のメディアデータを,多様体に基づく高いDIVとVALで変更できる可能性について論じる。
我々は,様々なフォーマット(画像,音声,テキスト)のメディアデータを,多様体に基づく統一的な方法で変更する技術ソリューションを考案する。
特に、メディアデータが低次元多様体に投影されると、そのデータは特定の方向とステップサイズで多様体の上を歩くことで変更することができる。
入力データと対比すると、変異されたデータは、適度に高いval(犬はまだ残っている)を保持しながら、知覚特性(例えば、横たわる犬対立犬)にdivを奨励する。
DNNをテストするためにDEEPWALKで実装する。
DEEPWALKは包括性テストにおいて従来の手法よりも優れており、より高い品質のエラートリガー入力を見つけることができる。
関連論文リスト
- Tilt your Head: Activating the Hidden Spatial-Invariance of Classifiers [0.7704032792820767]
ディープニューラルネットワークは、日々の生活の多くの領域に適用されている。
これらは、空間的に変換された入力信号に頑健に対処するなど、依然として必須の能力が欠如している。
本稿では,ニューラルネットの推論過程をエミュレートする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-05-06T09:47:29Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - Meta Input: How to Leverage Off-the-Shelf Deep Neural Networks [29.975937981538664]
我々は、エンドユーザーがモデルを変更することなく、独自のテスト環境で事前訓練されたDNNモデルを活用できる新しいアプローチを導入する。
テストデータの分布をトレーニングデータと整合させる追加入力であるtextitmeta 入力を提案する。
その結果、エンドユーザは、トレーニング環境と異なるテスト環境で、よく訓練されたモデルを利用することができる。
論文 参考訳(メタデータ) (2022-10-21T02:11:38Z) - Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。
代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文 参考訳(メタデータ) (2022-07-07T17:14:10Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - Leveraging Multi-domain, Heterogeneous Data using Deep Multitask
Learning for Hate Speech Detection [21.410160004193916]
畳み込みニューラルネットワークに基づくマルチタスク学習モデル(MTL)フットノートコードを提案し,複数のソースからの情報を活用する。
3つのベンチマークデータセットで実施した実証分析は,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2021-03-23T09:31:01Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Generalized ODIN: Detecting Out-of-distribution Image without Learning
from Out-of-distribution Data [87.61504710345528]
我々は,OoD検出性能を改善しつつ,ニューラルネットワークをOoDデータのチューニングから解放する2つの方法を提案する。
具体的には、信頼性スコアリングと修正された入力前処理法を分離することを提案する。
大規模画像データセットのさらなる解析により、セマンティックシフトと非セマンティックシフトの2種類の分布シフトが有意な差を示すことが示された。
論文 参考訳(メタデータ) (2020-02-26T04:18:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。