論文の概要: From Sound Representation to Model Robustness
- arxiv url: http://arxiv.org/abs/2007.13703v3
- Date: Mon, 18 Jan 2021 03:24:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 11:54:54.254399
- Title: From Sound Representation to Model Robustness
- Title(参考訳): 音響表現からモデルロバスト性へ
- Authors: Mohammad Esmaeilpour, Patrick Cardinal, Alessandro Lameiras Koerich
- Abstract要約: 本研究では, 環境音の標準的な表現(スペクトログラム)が, 被害者の残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
3つの環境音響データセットの様々な実験から、ResNet-18モデルは、他のディープラーニングアーキテクチャよりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 82.21746840893658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we investigate the impact of different standard environmental
sound representations (spectrograms) on the recognition performance and
adversarial attack robustness of a victim residual convolutional neural
network. Averaged over various experiments on three benchmarking environmental
sound datasets, we found the ResNet-18 model outperforms other deep learning
architectures such as GoogLeNet and AlexNet both in terms of classification
accuracy and the number of training parameters. Therefore we set this model as
our front-end classifier for subsequent investigations. Herein, we measure the
impact of different settings required for generating more informative
mel-frequency cepstral coefficient (MFCC), short-time Fourier transform (STFT),
and discrete wavelet transform (DWT) representations on our front-end model.
This measurement involves comparing the classification performance over the
adversarial robustness. On the balance of average budgets allocated by
adversary and the cost of attack, we demonstrate an inverse relationship
between recognition accuracy and model robustness against six attack
algorithms. Moreover, our experimental results show that while the ResNet-18
model trained on DWT spectrograms achieves the highest recognition accuracy,
attacking this model is relatively more costly for the adversary compared to
other 2D representations.
- Abstract(参考訳): 本稿では, 各種標準環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
ResNet-18モデルは,3つの環境音響データセットのベンチマーク実験により,分類精度とトレーニングパラメータ数の両方において,GoogLeNetやAlexNetといった他のディープラーニングアーキテクチャよりも優れていることがわかった。
そこで我々はこのモデルを,その後の調査のためのフロントエンド分類器として設定した。
ここでは,より情報的なメル周波数ケプストラム係数(mfcc),短時間フーリエ変換(stft),離散ウェーブレット変換(dwt)の生成に必要な様々な設定の影響を測定する。
この測定は、対向ロバスト性に対する分類性能の比較を含む。
敵が割り当てる平均予算と攻撃コストのバランスについて,6つの攻撃アルゴリズムに対する認識精度とモデルロバスト性の逆関係を示す。
さらに,DWTスペクトルを用いたResNet-18モデルでは高い認識精度が得られたが,他の2次元表現と比較して,このモデルに対する攻撃は比較的コストがかかることを示した。
関連論文リスト
- Exploring the Physical World Adversarial Robustness of Vehicle Detection [13.588120545886229]
アドリアックは現実世界の検知モデルの堅牢性を損なう可能性がある。
CARLAシミュレータを用いた革新的なインスタントレベルデータ生成パイプラインを提案する。
本研究は, 逆境条件下での多種多様なモデル性能について考察した。
論文 参考訳(メタデータ) (2023-08-07T11:09:12Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Stereopagnosia: Fooling Stereo Networks with Adversarial Perturbations [71.00754846434744]
知覚不能な加法的摂動は,差分マップを著しく変更できることを示す。
敵データ拡張に使用すると、我々の摂動はより堅牢なトレーニングされたモデルをもたらすことを示す。
論文 参考訳(メタデータ) (2020-09-21T19:20:09Z) - Adversarially Training for Audio Classifiers [9.868221447090853]
本研究では、離散ウェーブレット変換の2次元表現をトレーニングしたResNet-56モデルにおいて、トネッツクロマグラムが認識精度で他のモデルより優れていることを示す。
2つの環境音響データセットを用いて実験を行い、敵の予算配分に制限が課されない場合、敵の訓練を受けたモデルの愚かさ率が90%を超えることを示した。
論文 参考訳(メタデータ) (2020-08-26T15:15:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。