論文の概要: Surgical Mask Detection with Convolutional Neural Networks and Data
Augmentations on Spectrograms
- arxiv url: http://arxiv.org/abs/2008.04590v1
- Date: Tue, 11 Aug 2020 09:02:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 11:13:49.641346
- Title: Surgical Mask Detection with Convolutional Neural Networks and Data
Augmentations on Spectrograms
- Title(参考訳): 畳み込みニューラルネットワークを用いた手術用マスク検出とスペクトログラムデータ拡張
- Authors: Steffen Illium, Robert M\"uller, Andreas Sedlmeier and Claudia
Linnhoff-Popien
- Abstract要約: 人間の声のサンプルにおける手術用マスク検出の2値分類タスクに対するデータ拡張の効果を示す。
結果、ComParEのベースラインのほとんどがパフォーマンスに優れていたことが判明した。
- 参考スコア(独自算出の注目度): 8.747840760772268
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many fields of research, labeled datasets are hard to acquire. This is
where data augmentation promises to overcome the lack of training data in the
context of neural network engineering and classification tasks. The idea here
is to reduce model over-fitting to the feature distribution of a small
under-descriptive training dataset. We try to evaluate such data augmentation
techniques to gather insights in the performance boost they provide for several
convolutional neural networks on mel-spectrogram representations of audio data.
We show the impact of data augmentation on the binary classification task of
surgical mask detection in samples of human voice (ComParE Challenge 2020).
Also we consider four varying architectures to account for augmentation
robustness. Results show that most of the baselines given by ComParE are
outperformed.
- Abstract(参考訳): 多くの研究分野において、ラベル付きデータセットは取得が難しい。
ここでデータ拡張は、ニューラルネットワークエンジニアリングと分類タスクのコンテキストにおけるトレーニングデータの欠如を克服することを約束する。
ここでのアイデアは、小さな記述不足のトレーニングデータセットの機能分布に過剰に適合するモデルを減らすことである。
音声データのメル・スペクトログラム表現における畳み込みニューラルネットワークの性能向上に関する洞察を収集するために,このようなデータ拡張手法を評価した。
人間の声のサンプルにおける手術用マスク検出の2次分類タスクにおけるデータ拡張の影響を示す(compare challenge 2020)。
また,拡張ロバスト性を考慮した4種類のアーキテクチャも検討した。
結果、ComParEのベースラインのほとんどがパフォーマンスに優れていた。
関連論文リスト
- Data Augmentations in Deep Weight Spaces [89.45272760013928]
そこで本研究では,Mixup法に基づく新しい拡張手法を提案する。
既存のベンチマークと新しいベンチマークでこれらのテクニックのパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-11-15T10:43:13Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - MAGDiff: Covariate Data Set Shift Detection via Activation Graphs of Deep Neural Networks [8.887179103071388]
我々は、任意のニューラルネットワーク分類器から抽出するMAGDiffと呼ばれる新しい表現群を提案する。
これらの表現は、トレーニング分布に属するサンプルと目標分布とのニューラルネットワークのアクティベーショングラフを比較して計算される。
本稿では,ネットワーク出力に依存した最先端のベースラインに対して,新しい表現が大幅な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2023-05-22T17:34:47Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Image Classification on Small Datasets via Masked Feature Mixing [22.105356244579745]
ChimeraMixと呼ばれるアーキテクチャは、インスタンスの合成を生成することによってデータ拡張を学習する。
生成モデルは、画像をペアにエンコードし、マスクでガイドされた特徴を組み合わせて、新しいサンプルを作成する。
評価のために、すべてのメソッドは追加データなしでスクラッチからトレーニングされる。
論文 参考訳(メタデータ) (2022-02-23T16:51:22Z) - Ensemble Augmentation for Deep Neural Networks Using 1-D Time Series
Vibration Data [0.0]
時系列データは、データ駆動技術で使用される生データ表現の基本的なタイプの1つである。
Deep Neural Networks(DNN)は、最適なパフォーマンスを得るために、巨大なラベル付きトレーニングサンプルを必要とする。
本研究では,この制限を克服するために,アンサンブル拡張と呼ばれるデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2021-08-06T20:04:29Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - Reducing Labelled Data Requirement for Pneumonia Segmentation using
Image Augmentations [0.0]
画像拡張が肺炎検出のための胸部x線意味セグメンテーションにおけるラベル付きデータの必要性を減らす効果について検討した。
我々は、トレーニングデータから異なるサイズのサブセットで完全な畳み込みネットワークモデルを訓練する。
回転と混合は、回転、混合、翻訳、ガンマ、水平フリップの中で最高の増強であり、ラベル付きデータの要件を70%削減します。
論文 参考訳(メタデータ) (2021-02-25T10:11:30Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z) - Data augmentation using generative networks to identify dementia [20.137419355252362]
生成モデルはデータ拡張の効果的なアプローチとして利用できることを示す。
本稿では,認知症自動検出システムから抽出した音声と音声の異なる特徴に対する類似したアプローチの適用について検討する。
論文 参考訳(メタデータ) (2020-04-13T15:05:24Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。