論文の概要: Deep Active Audio Feature Learning in Resource-Constrained Environments
- arxiv url: http://arxiv.org/abs/2308.13201v1
- Date: Fri, 25 Aug 2023 06:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-28 15:03:35.287753
- Title: Deep Active Audio Feature Learning in Resource-Constrained Environments
- Title(参考訳): 資源制約環境における深部アクティブ音声特徴学習
- Authors: Md Mohaimenuzzaman, Christoph Bergmeir and Bernd Meyer
- Abstract要約: ラベル付きデータの不足により、バイオ音響アプリケーションにおけるDeep Neural Network(DNN)モデルのトレーニングが困難になる。
アクティブラーニング(AL)は、ラベル付けの労力をほとんど必要とせず、この学習を支援するアプローチである。
本稿では,ALループに特徴抽出を組み込んだALフレームワークについて述べる。
- 参考スコア(独自算出の注目度): 4.258703386469646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The scarcity of labelled data makes training Deep Neural Network (DNN) models
in bioacoustic applications challenging. In typical bioacoustics applications,
manually labelling the required amount of data can be prohibitively expensive.
To effectively identify both new and current classes, DNN models must continue
to learn new features from a modest amount of fresh data. Active Learning (AL)
is an approach that can help with this learning while requiring little
labelling effort. Nevertheless, the use of fixed feature extraction approaches
limits feature quality, resulting in underutilization of the benefits of AL. We
describe an AL framework that addresses this issue by incorporating feature
extraction into the AL loop and refining the feature extractor after each round
of manual annotation. In addition, we use raw audio processing rather than
spectrograms, which is a novel approach. Experiments reveal that the proposed
AL framework requires 14.3%, 66.7%, and 47.4% less labelling effort on
benchmark audio datasets ESC-50, UrbanSound8k, and InsectWingBeat,
respectively, for a large DNN model and similar savings on a
microcontroller-based counterpart. Furthermore, we showcase the practical
relevance of our study by incorporating data from conservation biology
projects.
- Abstract(参考訳): ラベル付きデータの不足により、バイオ音響アプリケーションにおけるDeep Neural Network(DNN)モデルのトレーニングが困難になる。
一般的なバイオ音響アプリケーションでは、必要な量のデータを手動でラベル付けすることは、非常に高価である。
新しいクラスと現在のクラスの両方を効果的に識別するには、DNNモデルは控えめな量の新しいデータから新しい機能を学習し続けなければならない。
アクティブラーニング(AL)は、ラベリングをほとんど必要とせず、この学習を支援するアプローチである。
それでも、固定的な特徴抽出アプローチは特徴品質を制限し、ALの利点を未利用にする。
本稿では,alループに特徴抽出機能を組み込んで,手動アノテーションのラウンド毎に特徴抽出器を精錬することにより,この問題に対処したalフレームワークについて述べる。
さらに,新しいアプローチであるスペクトログラムではなく,生のオーディオ処理を用いる。
実験により、提案されたalフレームワークは、ベンチマークオーディオデータセットesc-50、urbansound8k、petitwingbeatに対して14.3%、66.7%、47.4%のラベリング労力をそれぞれ削減し、大きなdnnモデルとマイクロコントローラベースのモデルで同様の節約を必要とすることが明らかになった。
さらに,保全生物学プロジェクトからのデータを活用することで,本研究の実践的妥当性を示す。
関連論文リスト
- Fine tuning Pre trained Models for Robustness Under Noisy Labels [34.68018860186995]
トレーニングデータセットにノイズの多いラベルが存在することは、機械学習モデルのパフォーマンスに大きな影響を及ぼす可能性がある。
我々は、事前学習されたモデルの事前知識を頑健かつ効率的に伝達するTURNと呼ばれる新しいアルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-10-24T20:28:59Z) - Combating Label Noise With A General Surrogate Model For Sample
Selection [84.61367781175984]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Latent Class-Conditional Noise Model [54.56899309997246]
本稿では,ベイズ的枠組みの下での雑音遷移をパラメータ化するためのLatent Class-Conditional Noise Model (LCCN)を提案する。
次に、Gibs sampler を用いて遅延真のラベルを効率的に推測できる LCCN の動的ラベル回帰法を導出する。
提案手法は,サンプルのミニバッチから事前の任意チューニングを回避するため,ノイズ遷移の安定な更新を保護している。
論文 参考訳(メタデータ) (2023-02-19T15:24:37Z) - Active Learning Guided by Efficient Surrogate Learners [25.52920030051264]
1つのデータポイントが新しいラベルを受け取るたびに、ディープラーニングモデルを再トレーニングするのは現実的ではない。
本稿では,ニューラルネットワークの主学習者とともに,ガウス過程の力を利用する新しい能動学習アルゴリズムを提案する。
提案モデルでは,新しいデータインスタンス毎のサロゲート学習者を積極的に更新し,ニューラルネットワークの連続学習ダイナミクスをエミュレートし,活用する。
論文 参考訳(メタデータ) (2023-01-07T01:35:25Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Efficient acoustic feature transformation in mismatched environments
using a Guided-GAN [1.495380389108477]
本稿では,資源共有環境における音声認識システムを改善するための新しいフレームワークを提案する。
音響入力機能を利用したGAN(Generative Adversarial Network)を用いて、ミスマッチしたデータの特徴を高める。
1時間未満のデータで、高品質なデータに基づいて訓練され、一致しないオーディオで評価されたASRシステムは、11.5%から19.7%の相対的な単語誤り率(WER)によって改善される。
論文 参考訳(メタデータ) (2022-10-03T05:33:28Z) - Towards Harnessing Feature Embedding for Robust Learning with Noisy
Labels [44.133307197696446]
ディープニューラルネットワーク(DNN)の記憶効果は,近年のラベルノイズ学習法において重要な役割を担っている。
ラベルノイズを用いたディープラーニングのための新しい特徴埋め込み方式, LabEl Noise Dilution (LEND) を提案する。
論文 参考訳(メタデータ) (2022-06-27T02:45:09Z) - Robust Meta-learning with Sampling Noise and Label Noise via
Eigen-Reptile [78.1212767880785]
Meta-learnerは、利用可能なサンプルがわずかしかないため、過度に適合する傾向がある。
ノイズの多いラベルでデータを扱う場合、メタラーナーはラベルノイズに対して非常に敏感になる可能性がある。
本稿では,タスク固有のパラメータの主要な方向でメタパラメータを更新するEigen-Reptile(ER)を提案する。
論文 参考訳(メタデータ) (2022-06-04T08:48:02Z) - Active Learning at the ImageNet Scale [43.595076693347835]
本研究では,画像ネット上でのアクティブラーニング(AL)と事前学習(SSP)の組み合わせについて検討する。
学習者が選択したクラス不均衡なサンプルから,小型の玩具データセットのパフォーマンスがImageNetのパフォーマンスを表すものではないことが判明した。
本稿では、ランダムサンプリングを一貫して上回る、単純でスケーラブルなALアルゴリズムであるBa balanced Selection (BASE)を提案する。
論文 参考訳(メタデータ) (2021-11-25T02:48:51Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。