論文の概要: Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching
- arxiv url: http://arxiv.org/abs/2005.00145v1
- Date: Thu, 30 Apr 2020 23:56:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 05:50:08.696306
- Title: Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching
- Title(参考訳): 帯域統計マッチングを用いた音響シーン分類のための教師なし領域適応
- Authors: Alessandro Ilic Mezza, Emanu\"el A. P. Habets, Meinard M\"uller and
Augusto Sarti
- Abstract要約: 機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
- 参考スコア(独自算出の注目度): 69.24460241328521
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of machine learning algorithms is known to be negatively
affected by possible mismatches between training (source) and test (target)
data distributions. In fact, this problem emerges whenever an acoustic scene
classification system which has been trained on data recorded by a given device
is applied to samples acquired under different acoustic conditions or captured
by mismatched recording devices. To address this issue, we propose an
unsupervised domain adaptation method that consists of aligning the first- and
second-order sample statistics of each frequency band of target-domain acoustic
scenes to the ones of the source-domain training dataset. This model-agnostic
approach is devised to adapt audio samples from unseen devices before they are
fed to a pre-trained classifier, thus avoiding any further learning phase.
Using the DCASE 2018 Task 1-B development dataset, we show that the proposed
method outperforms the state-of-the-art unsupervised methods found in the
literature in terms of both source- and target-domain classification accuracy.
- Abstract(参考訳): 機械学習アルゴリズムの性能は、トレーニング(ソース)とテスト(ターゲット)データ分布のミスマッチによって悪影響を受けることが知られている。
実際、与えられた装置で記録されたデータに基づいて訓練された音響シーン分類システムは、異なる音響条件下で取得されたサンプルや、不一致記録装置でキャプチャされたサンプルに適用される。
そこで本研究では,対象領域の音響シーンの周波数帯域毎に,第1および第2次サンプル統計値とソース領域のトレーニングデータセットとを整合させた教師なし領域適応手法を提案する。
このモデルに依存しないアプローチは、未確認デバイスからのオーディオサンプルを事前訓練された分類器に入力する前に適応させることにより、さらなる学習フェーズを回避する。
提案手法は,dcase 2018タスク1-b開発データセットを用いて,文献中の非教師なし手法よりも,ソース領域とターゲット領域の分類精度において優れていることを示す。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Learning with Noisy Foundation Models [95.50968225050012]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - GaitSADA: Self-Aligned Domain Adaptation for mmWave Gait Recognition [14.750765172614836]
mmWaveレーダを用いた歩行認識は,mmWaveレーダの帰還信号から人間の歩行バイオメトリックスを捕捉する新しいユーザ識別法である。
この問題を軽減するために、GaitSADAと呼ばれる新しい自己整合ドメイン適応法を提案する。
実験により、GaitSADAは、低データ状態における平均精度で15.41%から26.32%の改善により、代表的ドメイン適応法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-31T03:21:08Z) - Learning to Adapt to Domain Shifts with Few-shot Samples in Anomalous
Sound Detection [7.631596468553607]
異常検出は、産業機器の監視など、多くの重要な応用がある。
サンプルの少ない新しい条件に適応するフレームワークを提案する。
提案手法は,最近リリースされた各種機械の音響測定データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-04-05T00:22:25Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Spectrum Correction: Acoustic Scene Classification with Mismatched
Recording Devices [9.404066316241051]
機械学習アルゴリズムは、限られたデバイスからのオーディオ録音で訓練された場合、周波数応答の異なる他のデバイスを使用して記録されたサンプルにうまく一般化できない可能性がある。
本研究では,この問題に対処するための比較的簡単な手法を提案する。
このアプローチの2つのバリエーションが提示される。まず、複数のデバイスからの整列した例を必要とし、次に、この要件を緩和する。
論文 参考訳(メタデータ) (2021-05-25T11:53:17Z) - Active Learning for Sound Event Detection [18.750572243562576]
本稿では,音事象検出(SED)のための能動的学習システムを提案する。
本研究の目的は,学習したSEDモデルの精度を限定的なアノテーションで最大化することである。
注目すべきは、ターゲット音イベントが稀なデータセットにおいて、必要なアノテーションの労力を大幅に削減できることだ。
論文 参考訳(メタデータ) (2020-02-12T14:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。