論文の概要: Improving robustness against common corruptions with frequency biased
models
- arxiv url: http://arxiv.org/abs/2103.16241v1
- Date: Tue, 30 Mar 2021 10:44:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 14:55:09.896811
- Title: Improving robustness against common corruptions with frequency biased
models
- Title(参考訳): 周波数バイアスモデルによる共通汚損に対するロバスト性向上
- Authors: Tonmoy Saikia, Cordelia Schmid, Thomas Brox
- Abstract要約: 目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
- 参考スコア(独自算出の注目度): 112.65717928060195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: CNNs perform remarkably well when the training and test distributions are
i.i.d, but unseen image corruptions can cause a surprisingly large drop in
performance. In various real scenarios, unexpected distortions, such as random
noise, compression artefacts, or weather distortions are common phenomena.
Improving performance on corrupted images must not result in degraded i.i.d
performance - a challenge faced by many state-of-the-art robust approaches.
Image corruption types have different characteristics in the frequency spectrum
and would benefit from a targeted type of data augmentation, which, however, is
often unknown during training. In this paper, we introduce a mixture of two
expert models specializing in high and low-frequency robustness, respectively.
Moreover, we propose a new regularization scheme that minimizes the total
variation (TV) of convolution feature-maps to increase high-frequency
robustness. The approach improves on corrupted images without degrading
in-distribution performance. We demonstrate this on ImageNet-C and also for
real-world corruptions on an automotive dataset, both for object classification
and object detection.
- Abstract(参考訳): CNNは、トレーニングとテストの分布がi.d.である場合、非常によく機能するが、目に見えない画像の破損は驚くほど大きなパフォーマンス低下を引き起こす。
様々な現実シナリオにおいて、ランダムノイズ、圧縮アーチファクト、気象歪みなどの予期せぬ歪みが一般的な現象である。
腐敗した画像のパフォーマンス向上は、劣化したi.i.dパフォーマンスをもたらすものではない。
画像腐敗型は周波数スペクトルに異なる特性を持ち、対象とするデータ拡張型の恩恵を受けるが、トレーニング中は未知であることが多い。
本稿では,高域と低域のロバスト性に特化した2種類のエキスパートモデルについて紹介する。
さらに,畳み込み特徴マップの総変動(tv)を最小化し,高周波ロバスト性を高める新しい正規化手法を提案する。
このアプローチは、分散性能を低下させることなく、腐敗した画像を改善する。
我々は、imagenet-cと、オブジェクト分類とオブジェクト検出の両方のために、自動車データセット上の実世界の腐敗に対しても、これを実証する。
関連論文リスト
- Indoor scene recognition from images under visual corruptions [3.4861209026118836]
本稿では,マルチモーダルデータ融合を利用した屋内シーン認識への革新的アプローチを提案する。
グラフ畳み込みネットワーク(GCN)を用いて,CNNモデルから意味字幕を合成する2つのマルチモーダルネットワークについて検討した。
本研究では,Places365データセットの破損したサブセットに対して評価した場合,Top-1の精度が顕著に向上し,モデル性能が著しく向上することを示す。
論文 参考訳(メタデータ) (2024-08-23T12:35:45Z) - FFT-based Selection and Optimization of Statistics for Robust Recognition of Severely Corrupted Images [19.07004663565609]
本稿では, 分類モデルのロバスト性向上のための新しい手法を提案する。
提案手法は,入力画像の劣化型を検出するために高周波特徴を用いて,層単位での特徴正規化統計を抽出する。
FROSTは、異なるモデルやデータセットに対する最先端の結果を提供し、ImageNet-Cの競合製品よりも37.1%も向上している。
論文 参考訳(メタデータ) (2024-03-21T12:01:54Z) - Frequency-Based Vulnerability Analysis of Deep Learning Models against
Image Corruptions [48.34142457385199]
MUFIAは、モデルが失敗する可能性のある特定の種類の汚職を特定するために設計されたアルゴリズムである。
最先端のモデルでさえ、既知の一般的な汚職に対して堅牢であるように訓練されたモデルでさえ、MUFIAによって作られた低視認性ベースの汚職と戦っている。
論文 参考訳(メタデータ) (2023-06-12T15:19:13Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z) - Diverse Gaussian Noise Consistency Regularization for Robustness and
Uncertainty Calibration [7.310043452300738]
深層ニューラルネットワークは、列車と試験分布が一致したときに高い予測精度を達成する。
この設定から逸脱し、深刻なパフォーマンス劣化を引き起こす、さまざまな種類の汚職が発生する。
本稿では,画像分類器の多種多様な汚損下での堅牢性向上のための多種多様なガウス雑音整合正則化法を提案する。
論文 参考訳(メタデータ) (2021-04-02T20:25:53Z) - On Interaction Between Augmentations and Corruptions in Natural
Corruption Robustness [78.6626755563546]
ImageNet-Cのパフォーマンスを大幅に改善するいくつかの新しいデータ拡張が提案されている。
我々は,類似度と性能の間に強い相関があることを示すために,最小サンプル距離(minimal sample distance)と呼ばれる拡張と腐敗の間の新たな尺度を開発した。
テストタイムの破損がImageNet-Cと知覚的に異なる場合, 破損の顕著な劣化を観察する。
以上の結果から,テストエラーは知覚的に類似した拡張をトレーニングすることで改善できる可能性が示唆された。
論文 参考訳(メタデータ) (2021-02-22T18:58:39Z) - Stereopagnosia: Fooling Stereo Networks with Adversarial Perturbations [71.00754846434744]
知覚不能な加法的摂動は,差分マップを著しく変更できることを示す。
敵データ拡張に使用すると、我々の摂動はより堅牢なトレーニングされたモデルをもたらすことを示す。
論文 参考訳(メタデータ) (2020-09-21T19:20:09Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - A simple way to make neural networks robust against diverse image
corruptions [29.225922892332342]
加法ガウスノイズとスペククルノイズを用いた簡易だが適切に調整されたトレーニングが、予期せぬ汚職に対して驚くほどうまく一般化することを示す。
非相関な最悪の雑音に対する認識モデルの逆トレーニングは、さらなる性能向上につながる。
論文 参考訳(メタデータ) (2020-01-16T20:10:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。