論文の概要: AudRandAug: Random Image Augmentations for Audio Classification
- arxiv url: http://arxiv.org/abs/2309.04762v1
- Date: Sat, 9 Sep 2023 11:25:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 16:27:29.254104
- Title: AudRandAug: Random Image Augmentations for Audio Classification
- Title(参考訳): AudRandAug: オーディオ分類のためのランダム画像拡張
- Authors: Teerath Kumar, Muhammad Turab, Alessandra Mileo, Malika Bendechache
and Takfarinas Saber
- Abstract要約: 本稿では、RandAugのオーディオデータへの適応であるAudRandAugを紹介する。
AudRandAugは専用の音声検索空間からデータ拡張ポリシーを選択する。
以上の結果から,AudRandAugは既存のデータ拡張手法よりも精度が高いことが示唆された。
- 参考スコア(独自算出の注目度): 43.56824843205882
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation has proven to be effective in training neural networks.
Recently, a method called RandAug was proposed, randomly selecting data
augmentation techniques from a predefined search space. RandAug has
demonstrated significant performance improvements for image-related tasks while
imposing minimal computational overhead. However, no prior research has
explored the application of RandAug specifically for audio data augmentation,
which converts audio into an image-like pattern. To address this gap, we
introduce AudRandAug, an adaptation of RandAug for audio data. AudRandAug
selects data augmentation policies from a dedicated audio search space. To
evaluate the effectiveness of AudRandAug, we conducted experiments using
various models and datasets. Our findings indicate that AudRandAug outperforms
other existing data augmentation methods regarding accuracy performance.
- Abstract(参考訳): データ拡張はニューラルネットワークのトレーニングに有効であることが証明されている。
近年,前述した検索空間からランダムにデータ拡張手法を選択するrandaug法が提案されている。
RandAugは、最小の計算オーバーヘッドを伴いながら、画像関連タスクのパフォーマンスを大幅に改善した。
しかし、オーディオをイメージライクなパターンに変換するオーディオデータ拡張に特化したrandaugの応用について、これまでの研究は行われていない。
このギャップに対処するために、オーディオデータに対するRandAugの適応であるAudRandAugを紹介する。
AudRandAugは専用の音声検索空間からデータ拡張ポリシーを選択する。
AudRandAugの有効性を評価するために,様々なモデルとデータセットを用いて実験を行った。
以上の結果から,AudRandAugは既存のデータ拡張手法よりも精度が高いことがわかった。
関連論文リスト
- DualAug: Exploiting Additional Heavy Augmentation with OOD Data
Rejection [77.6648187359111]
そこで本稿では,textbfDualAug という新しいデータ拡張手法を提案する。
教師付き画像分類ベンチマークの実験では、DualAugは様々な自動データ拡張法を改善している。
論文 参考訳(メタデータ) (2023-10-12T08:55:10Z) - AdVerb: Visually Guided Audio Dereverberation [49.958724234969445]
本稿では,新しいオーディオ・ビジュアル・デバーベレーション・フレームワークであるAdVerbを紹介する。
残響音に加えて視覚的手がかりを用いてクリーンオーディオを推定する。
論文 参考訳(メタデータ) (2023-08-23T18:20:59Z) - Do You Remember? Overcoming Catastrophic Forgetting for Fake Audio
Detection [54.20974251478516]
本稿では,破滅的な忘れを克服するために,偽音声検出のための連続学習アルゴリズムを提案する。
検出ネットワークを微調整する場合,本手法では,真の発話と偽発話の比率に応じて,重み付けの方向を適応的に計算する。
本手法は,音声の感情認識などの関連分野に容易に一般化できる。
論文 参考訳(メタデータ) (2023-08-07T05:05:49Z) - SeqAug: Sequential Feature Resampling as a modality agnostic
augmentation method [87.96772134481203]
SeqAugは、抽出された特徴の列に合わせて調整されたモダリティに依存しない拡張法である。
再サンプリングは、特徴次元をランダムに選択し、時間軸に沿って順応することで行われる。
論文 参考訳(メタデータ) (2023-05-03T08:11:25Z) - RangeAugment: Efficient Online Augmentation with Range Learning [54.61514286212455]
RangeAugmentは、個々の大きさと複合オーグメンテーション操作を効率よく学習する。
本研究では,RangeAugmentの4~5倍の精度で,最先端自動拡張手法の競争性能が向上することを示す。
論文 参考訳(メタデータ) (2022-12-20T18:55:54Z) - TASK3 DCASE2021 Challenge: Sound event localization and detection using
squeeze-excitation residual CNNs [4.4973334555746]
この調査は、昨年同じチームが実施した調査に基づいています。
この手法がそれぞれのデータセットをどのように改善するかを研究することが決定された。
この修正は,MICデータセットを用いたベースラインと比較して,システム性能の向上を示す。
論文 参考訳(メタデータ) (2021-07-30T11:34:15Z) - UniformAugment: A Search-free Probabilistic Data Augmentation Approach [0.019573380763700708]
トレーニングデータセットの増強は、コンピュータビジョンタスクの学習効率を向上させることが示されている。
AutoAugmentやFast AutoAugmentといったいくつかのテクニックは、適切な拡張ポリシーのセットを見つけるための検索フェーズを導入している。
検索フェーズを完全に回避する自動データ拡張手法であるUniformAugmentを提案する。
論文 参考訳(メタデータ) (2020-03-31T16:32:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。