論文の概要: Enhancing Audio Augmentation Methods with Consistency Learning
- arxiv url: http://arxiv.org/abs/2102.05151v1
- Date: Tue, 9 Feb 2021 22:01:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 14:24:15.767288
- Title: Enhancing Audio Augmentation Methods with Consistency Learning
- Title(参考訳): 一貫性学習による音声強調手法の強化
- Authors: Turab Iqbal, Karim Helwani, Arvindh Krishnaswamy, Wenwu Wang
- Abstract要約: 本稿では,一貫性制約を明示的に課す訓練目標の使用について検討する。
ある種の一貫性の尺度は、クロスエントロピー損失によって暗黙的に捉えられていないことを示す。
このような対策を損失関数に組み込むことで,音声タグ付けなどのタスクの性能を向上させることができることを示す。
- 参考スコア(独自算出の注目度): 41.308185993375766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data augmentation is an inexpensive way to increase training data diversity,
and is commonly achieved via transformations of existing data. For tasks such
as classification, there is a good case for learning representations of the
data that are invariant to such transformations, yet this is not explicitly
enforced by classification losses such as the cross-entropy loss. This paper
investigates the use of training objectives that explicitly impose this
consistency constraint, and how it can impact downstream audio classification
tasks. In the context of deep convolutional neural networks in the supervised
setting, we show empirically that certain measures of consistency are not
implicitly captured by the cross-entropy loss, and that incorporating such
measures into the loss function can improve the performance of tasks such as
audio tagging. Put another way, we demonstrate how existing augmentation
methods can further improve learning by enforcing consistency.
- Abstract(参考訳): データ拡張はトレーニングデータの多様性を高めるための安価な方法であり、一般的には既存のデータの変換によって実現される。
分類などのタスクでは、そのような変換に不変なデータの表現を学習する良いケースがありますが、これはクロスエントロピー損失などの分類損失によって明示的に強制されません。
本稿では,この制約を明示的に規定する学習目標の利用と,下流の音声分類タスクに与える影響について検討する。
教師付き設定における深い畳み込みニューラルネットワークの文脈では、ある種の一貫性の尺度がクロスエントロピー損失によって暗黙的に捉えられず、そのような尺度を損失関数に組み込むことでオーディオタグなどのタスクのパフォーマンスが向上することを示す。
別の言い方をすれば、既存の拡張メソッドが一貫性を強化することで学習をさらに改善できることを実証する。
関連論文リスト
- Augmenting Radio Signals with Wavelet Transform for Deep Learning-Based
Modulation Recognition [6.793444383222236]
近年,無線変調認識のための深層学習が普及している。
現実のシナリオでは、事前に十分なトレーニングデータを収集することは不可能かもしれない。
データ拡張は、トレーニングデータセットの多様性と量を増やすために使用される方法である。
論文 参考訳(メタデータ) (2023-11-07T06:55:39Z) - Implicit Counterfactual Data Augmentation for Robust Learning [24.795542869249154]
本研究では, 突発的相関を除去し, 安定した予測を行うために, インプリシト・カウンセショナル・データ拡張法を提案する。
画像とテキストのデータセットをカバーする様々なバイアス付き学習シナリオで実験が行われてきた。
論文 参考訳(メタデータ) (2023-04-26T10:36:40Z) - Unsupervised Noise adaptation using Data Simulation [21.866522173387715]
本稿では,逆クリーン・ノイズ変換を効率よく学習するための生成逆ネットワークに基づく手法を提案する。
実験結果から,本手法はトレーニングセットとテストセット間のドメインミスマッチを効果的に軽減することが示された。
論文 参考訳(メタデータ) (2023-02-23T12:57:20Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Adaptive Hierarchical Similarity Metric Learning with Noisy Labels [138.41576366096137]
適応的階層的類似度メトリック学習法を提案する。
ノイズに敏感な2つの情報、すなわち、クラスワイドのばらつきとサンプルワイドの一貫性を考える。
提案手法は,現在の深層学習手法と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-10-29T02:12:18Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - CADDA: Class-wise Automatic Differentiable Data Augmentation for EEG
Signals [92.60744099084157]
本研究では、勾配に基づく学習に適した微分可能データ拡張を提案する。
本研究は,臨床関連睡眠ステージ分類課題におけるアプローチの意義を示す。
論文 参考訳(メタデータ) (2021-06-25T15:28:48Z) - Robust Representation Learning via Perceptual Similarity Metrics [18.842322467828502]
Contrastive Input Morphing (CIM) はデータの入力空間変換を学習する表現学習フレームワークである。
CIMは他の相互情報に基づく表現学習技術と相補的であることを示す。
論文 参考訳(メタデータ) (2021-06-11T21:45:44Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。