論文の概要: Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization
- arxiv url: http://arxiv.org/abs/2012.05908v2
- Date: Tue, 16 Mar 2021 08:42:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:04:48.111062
- Title: Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization
- Title(参考訳): 複数音源2次元定位における領域適応のための判別器のアンサンブル
- Authors: Guillaume Le Moing, Don Joven Agravante, Tadanobu Inoue, Jayakorn
Vongkulbhisal, Asim Munawar, Ryuki Tachibana, Phongtharin Vinayavekhin
- Abstract要約: 本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
- 参考スコア(独自算出の注目度): 7.564344795030588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces an ensemble of discriminators that improves the
accuracy of a domain adaptation technique for the localization of multiple
sound sources. Recently, deep neural networks have led to promising results for
this task, yet they require a large amount of labeled data for training.
Recording and labeling such datasets is very costly, especially because data
needs to be diverse enough to cover different acoustic conditions. In this
paper, we leverage acoustic simulators to inexpensively generate labeled
training samples. However, models trained on synthetic data tend to perform
poorly with real-world recordings due to the domain mismatch. For this, we
explore two domain adaptation methods using adversarial learning for sound
source localization which use labeled synthetic data and unlabeled real data.
We propose a novel ensemble approach that combines discriminators applied at
different feature levels of the localization model. Experiments show that our
ensemble discrimination method significantly improves the localization
performance without requiring any label from the real data.
- Abstract(参考訳): 本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
近年、ディープニューラルネットワークがこのタスクに有望な結果をもたらしたが、トレーニングには大量のラベル付きデータが必要である。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
本稿では,音響シミュレータを利用してラベル付きトレーニングサンプルを安価に生成する。
しかし、合成データに基づいて訓練されたモデルは、ドメインミスマッチのため、現実世界の録音では性能が良くない傾向にある。
そこで本研究では,ラベル付き合成データとラベルなし実データを用いた音源定位のための逆学習を用いた2つの領域適応手法について検討する。
局所化モデルの異なる特徴レベルに適用された識別器を組み合わせた新しいアンサンブル手法を提案する。
実験により,本手法は実データからのラベルを必要とせず,ローカライズ性能を大幅に向上させることがわかった。
関連論文リスト
- A Novel Score-CAM based Denoiser for Spectrographic Signature Extraction without Ground Truth [0.0]
本稿では,Score-CAMをベースとした新しいデノイザを開発し,ノイズスペクトルデータからオブジェクトのシグネチャを抽出する。
特に,本論文では,スペクトルトレーニングデータの学習と生成のための,新たな生成逆ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-10-28T21:40:46Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Multi-source Domain Adaptation for Text-independent Forensic Speaker
Recognition [36.83842373791537]
話者認識システムを新しい環境に適応させることは、良好な性能モデルを改善するために広く使われている手法である。
従来の研究では、複数の音響領域からトレーニングデータを収集するより実践的なシナリオを無視した単一ドメイン適応に焦点が当てられていた。
複数の音響領域にまたがる適応性能を高めるために,3つの新しい適応手法を提案する。
論文 参考訳(メタデータ) (2022-11-17T22:11:25Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - MLReal: Bridging the gap between training on synthetic data and real
data applications in machine learning [1.9852463786440129]
本稿では,実際のデータ特徴を持つ合成データの教師付きトレーニングを強化するための新しいアプローチについて述べる。
トレーニング段階では、入力データは合成ドメインから、自動相関データは実ドメインからである。
推論/アプリケーション段階では、入力データは実サブセットドメインからであり、自己相関区間の平均は合成データサブセットドメインからである。
論文 参考訳(メタデータ) (2021-09-11T14:43:34Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Data-Efficient Framework for Real-world Multiple Sound Source 2D
Localization [7.564344795030588]
実データからのラベルを必要とせずにローカリゼーション性能を向上させるための新しいアンサンブル判別法を提案する。
これにより、特定のマイクロフォンアレイレイアウトのデータでモデルをトレーニングし、推論中に見つからないレイアウトに最適化することができる。
論文 参考訳(メタデータ) (2020-12-10T09:22:52Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。