論文の概要: Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization
- arxiv url: http://arxiv.org/abs/2012.05908v2
- Date: Tue, 16 Mar 2021 08:42:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:04:48.111062
- Title: Ensemble of Discriminators for Domain Adaptation in Multiple Sound
Source 2D Localization
- Title(参考訳): 複数音源2次元定位における領域適応のための判別器のアンサンブル
- Authors: Guillaume Le Moing, Don Joven Agravante, Tadanobu Inoue, Jayakorn
Vongkulbhisal, Asim Munawar, Ryuki Tachibana, Phongtharin Vinayavekhin
- Abstract要約: 本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
- 参考スコア(独自算出の注目度): 7.564344795030588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces an ensemble of discriminators that improves the
accuracy of a domain adaptation technique for the localization of multiple
sound sources. Recently, deep neural networks have led to promising results for
this task, yet they require a large amount of labeled data for training.
Recording and labeling such datasets is very costly, especially because data
needs to be diverse enough to cover different acoustic conditions. In this
paper, we leverage acoustic simulators to inexpensively generate labeled
training samples. However, models trained on synthetic data tend to perform
poorly with real-world recordings due to the domain mismatch. For this, we
explore two domain adaptation methods using adversarial learning for sound
source localization which use labeled synthetic data and unlabeled real data.
We propose a novel ensemble approach that combines discriminators applied at
different feature levels of the localization model. Experiments show that our
ensemble discrimination method significantly improves the localization
performance without requiring any label from the real data.
- Abstract(参考訳): 本稿では,複数音源の局所化のための領域適応手法の精度を向上させる識別器のアンサンブルを提案する。
近年、ディープニューラルネットワークがこのタスクに有望な結果をもたらしたが、トレーニングには大量のラベル付きデータが必要である。
このようなデータセットの記録とラベリングは、特にさまざまな音響条件をカバーするために十分な多様性を必要とするため、非常にコストがかかる。
本稿では,音響シミュレータを利用してラベル付きトレーニングサンプルを安価に生成する。
しかし、合成データに基づいて訓練されたモデルは、ドメインミスマッチのため、現実世界の録音では性能が良くない傾向にある。
そこで本研究では,ラベル付き合成データとラベルなし実データを用いた音源定位のための逆学習を用いた2つの領域適応手法について検討する。
局所化モデルの異なる特徴レベルに適用された識別器を組み合わせた新しいアンサンブル手法を提案する。
実験により,本手法は実データからのラベルを必要とせず,ローカライズ性能を大幅に向上させることがわかった。
関連論文リスト
- Unsupervised Domain Adaptation for Semantic Segmentation with Pseudo
Label Self-Refinement [9.69089112870202]
擬似ラベルのオンライン精錬のための補助的擬似ラベル精錬ネットワーク(PRN)を提案する。
3つの異なるドメインシフトを持つベンチマークデータセットに対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2023-10-25T20:31:07Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Multi-source Domain Adaptation for Text-independent Forensic Speaker
Recognition [36.83842373791537]
話者認識システムを新しい環境に適応させることは、良好な性能モデルを改善するために広く使われている手法である。
従来の研究では、複数の音響領域からトレーニングデータを収集するより実践的なシナリオを無視した単一ドメイン適応に焦点が当てられていた。
複数の音響領域にまたがる適応性能を高めるために,3つの新しい適応手法を提案する。
論文 参考訳(メタデータ) (2022-11-17T22:11:25Z) - Learning with Neighbor Consistency for Noisy Labels [69.83857578836769]
特徴空間におけるトレーニング例間の類似性を利用した雑音ラベルから学習する手法を提案する。
合成(CIFAR-10, CIFAR-100)とリアル(mini-WebVision, Clothing1M, mini-ImageNet-Red)の両方のノイズを評価するデータセットの評価を行った。
論文 参考訳(メタデータ) (2022-02-04T15:46:27Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - MLReal: Bridging the gap between training on synthetic data and real
data applications in machine learning [1.9852463786440129]
本稿では,実際のデータ特徴を持つ合成データの教師付きトレーニングを強化するための新しいアプローチについて述べる。
トレーニング段階では、入力データは合成ドメインから、自動相関データは実ドメインからである。
推論/アプリケーション段階では、入力データは実サブセットドメインからであり、自己相関区間の平均は合成データサブセットドメインからである。
論文 参考訳(メタデータ) (2021-09-11T14:43:34Z) - Semi-supervised Long-tailed Recognition using Alternate Sampling [95.93760490301395]
ロングテール認識の主な課題は、データ分布の不均衡とテールクラスにおけるサンプル不足である。
半教師付き長尾認識という新しい認識設定を提案する。
2つのデータセットで、他の競合方法よりも大幅な精度向上を実証します。
論文 参考訳(メタデータ) (2021-05-01T00:43:38Z) - Data-Efficient Framework for Real-world Multiple Sound Source 2D
Localization [7.564344795030588]
実データからのラベルを必要とせずにローカリゼーション性能を向上させるための新しいアンサンブル判別法を提案する。
これにより、特定のマイクロフォンアレイレイアウトのデータでモデルをトレーニングし、推論中に見つからないレイアウトに最適化することができる。
論文 参考訳(メタデータ) (2020-12-10T09:22:52Z) - DomainMix: Learning Generalizable Person Re-Identification Without Human
Annotations [89.78473564527688]
本稿では,ラベル付き合成データセットとラベル付き実世界のデータセットを用いてユニバーサルモデルをトレーニングする方法を示す。
このように、人間のアノテーションはもはや不要であり、大規模で多様な現実世界のデータセットにスケーラブルである。
実験結果から,提案手法は完全な人間のアノテーションで訓練されたアノテーションとほぼ同等であることがわかった。
論文 参考訳(メタデータ) (2020-11-24T08:15:53Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。