論文の概要: Assessing Visually-Continuous Corruption Robustness of Neural Networks
Relative to Human Performance
- arxiv url: http://arxiv.org/abs/2402.19401v1
- Date: Thu, 29 Feb 2024 18:00:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-01 13:36:06.604134
- Title: Assessing Visually-Continuous Corruption Robustness of Neural Networks
Relative to Human Performance
- Title(参考訳): ニューラルネットワークの視覚的連続的破壊ロバスト性の評価
- Authors: Huakun Shen and Boyue Caroline Hu and Krzysztof Czarnecki and Lina
Marsso and Marsha Chechik
- Abstract要約: ニューラルネットワーク(NN)は、ImageNet上の画像分類において、人間の精度を上回っている。
NNは画像の破損に対する堅牢性、すなわち腐敗の堅牢性に欠けることが多い。
本稿では,人間の知覚的品質に応じた広範囲かつ連続的な変化を評価するために,視覚的に連続的な汚職堅牢性(VCR)を提案する。
- 参考スコア(独自算出の注目度): 6.254768374567899
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Neural Networks (NNs) have surpassed human accuracy in image
classification on ImageNet, they often lack robustness against image
corruption, i.e., corruption robustness. Yet such robustness is seemingly
effortless for human perception. In this paper, we propose visually-continuous
corruption robustness (VCR) -- an extension of corruption robustness to allow
assessing it over the wide and continuous range of changes that correspond to
the human perceptive quality (i.e., from the original image to the full
distortion of all perceived visual information), along with two novel
human-aware metrics for NN evaluation. To compare VCR of NNs with human
perception, we conducted extensive experiments on 14 commonly used image
corruptions with 7,718 human participants and state-of-the-art robust NN models
with different training objectives (e.g., standard, adversarial, corruption
robustness), different architectures (e.g., convolution NNs, vision
transformers), and different amounts of training data augmentation. Our study
showed that: 1) assessing robustness against continuous corruption can reveal
insufficient robustness undetected by existing benchmarks; as a result, 2) the
gap between NN and human robustness is larger than previously known; and
finally, 3) some image corruptions have a similar impact on human perception,
offering opportunities for more cost-effective robustness assessments. Our
validation set with 14 image corruptions, human robustness data, and the
evaluation code is provided as a toolbox and a benchmark.
- Abstract(参考訳): ニューラルネットワーク(NN)はイメージネット上の画像分類において人間の精度を上回っているが、画像の破損に対する堅牢性、すなわち腐敗の堅牢性に欠けることが多い。
しかし、そのような頑丈さは人間の知覚に不利に見える。
本稿では,人間の知覚的品質(原画像から認識されるすべての視覚情報の完全な歪みまで)に対応する広範囲かつ連続的な変化を評価できるように,視覚的に連続的な汚職堅牢性(VCR)を拡張し,NN評価のための新たな2つの評価指標とともに提案する。
NNのVCRと人間の知覚を比較するために,7,718人の被験者と,異なるトレーニング目標(標準,敵対的,汚職の堅牢性など),異なるアーキテクチャ(畳み込みNN,視覚変換器など),さまざまなトレーニングデータ拡張を備えた最先端の頑健なNNモデルを用いた14種類の画像破壊実験を行った。
私たちの研究はそれを示しました
1) 継続的腐敗に対する堅牢性の評価は、既存のベンチマークで検出されていない不十分な堅牢性を明らかにすることができる。
2) NNと人間の頑健さのギャップは, 従来よりも大きく, そして最後に
3) 画像の腐敗は人間の知覚に同様の影響を与え, 費用対効果の高い堅牢性評価の機会を与えている。
私たちの検証セットには14の画像破損、人間のロバスト性データ、評価コードはツールボックスとベンチマークとして提供されます。
関連論文リスト
- Frequency-Based Vulnerability Analysis of Deep Learning Models against
Image Corruptions [48.34142457385199]
MUFIAは、モデルが失敗する可能性のある特定の種類の汚職を特定するために設計されたアルゴリズムである。
最先端のモデルでさえ、既知の一般的な汚職に対して堅牢であるように訓練されたモデルでさえ、MUFIAによって作られた低視認性ベースの汚職と戦っている。
論文 参考訳(メタデータ) (2023-06-12T15:19:13Z) - Investigating the Corruption Robustness of Image Classifiers with Random
Lp-norm Corruptions [3.1337872355726084]
本研究では,画像分類器のトレーニングデータとテストデータを強化するために,ランダムなp-ノルム汚職を用いることを検討した。
p-ノルムの汚職の組み合わせによるトレーニングデータの増大は、最先端のデータ増補スキームにおいても、汚職の堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-09T12:45:43Z) - A Comprehensive Study on Robustness of Image Classification Models:
Benchmarking and Rethinking [54.89987482509155]
ディープニューラルネットワークのロバスト性は、通常、敵の例、共通の腐敗、分散シフトに欠けている。
画像分類タスクにおいてtextbfARES-Bench と呼ばれる総合的なベンチマークロバスト性を確立する。
それに応じてトレーニング設定を設計することにより、新しい最先端の対人ロバスト性を実現する。
論文 参考訳(メタデータ) (2023-02-28T04:26:20Z) - Benchmarking the Robustness of Deep Neural Networks to Common
Corruptions in Digital Pathology [11.398235052118608]
このベンチマークは、腐敗した病理画像に対して、ディープニューラルネットワークがどのように機能するかを評価するために確立されている。
2つの分類と1つのランキングのメトリクスは、汚職下での予測と信頼性のパフォーマンスを評価するために設計されている。
論文 参考訳(メタデータ) (2022-06-30T01:53:46Z) - On the Robustness of Quality Measures for GANs [136.18799984346248]
本研究は、インセプションスコア(IS)やFr'echet Inception Distance(FID)のような生成モデルの品質測定の堅牢性を評価する。
このような測度は、加算画素摂動によっても操作可能であることを示す。
論文 参考訳(メタデータ) (2022-01-31T06:43:09Z) - Neural Architecture Dilation for Adversarial Robustness [56.18555072877193]
畳み込みニューラルネットワークの欠点は、敵の攻撃に弱いことである。
本稿では, 良好な精度を有する背骨CNNの対角的堅牢性を向上させることを目的とする。
最小限の計算オーバーヘッドの下では、拡張アーキテクチャはバックボーンCNNの標準的な性能と親和性が期待できる。
論文 参考訳(メタデータ) (2021-08-16T03:58:00Z) - Using the Overlapping Score to Improve Corruption Benchmarks [6.445605125467574]
本稿では、汚職ベンチマークの欠陥を明らかにするために、汚職重複スコアと呼ばれる指標を提案する。
汚職間の重複を考慮に入れれば、既存のベンチマークを改善したり、より良いベンチマークを構築するのに役立ちます。
論文 参考訳(メタデータ) (2021-05-26T06:42:54Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z) - On Interaction Between Augmentations and Corruptions in Natural
Corruption Robustness [78.6626755563546]
ImageNet-Cのパフォーマンスを大幅に改善するいくつかの新しいデータ拡張が提案されている。
我々は,類似度と性能の間に強い相関があることを示すために,最小サンプル距離(minimal sample distance)と呼ばれる拡張と腐敗の間の新たな尺度を開発した。
テストタイムの破損がImageNet-Cと知覚的に異なる場合, 破損の顕著な劣化を観察する。
以上の結果から,テストエラーは知覚的に類似した拡張をトレーニングすることで改善できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-02-22T18:58:39Z) - A simple way to make neural networks robust against diverse image
corruptions [29.225922892332342]
加法ガウスノイズとスペククルノイズを用いた簡易だが適切に調整されたトレーニングが、予期せぬ汚職に対して驚くほどうまく一般化することを示す。
非相関な最悪の雑音に対する認識モデルの逆トレーニングは、さらなる性能向上につながる。
論文 参考訳(メタデータ) (2020-01-16T20:10:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。