論文の概要: Description on IEEE ICME 2024 Grand Challenge: Semi-supervised Acoustic
Scene Classification under Domain Shift
- arxiv url: http://arxiv.org/abs/2402.02694v1
- Date: Mon, 5 Feb 2024 03:12:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 17:57:42.218379
- Title: Description on IEEE ICME 2024 Grand Challenge: Semi-supervised Acoustic
Scene Classification under Domain Shift
- Title(参考訳): IEEE ICME 2024グランドチャレンジの解説:ドメインシフトに基づく半教師付き音響シーン分類
- Authors: Jisheng Bai, Mou Wang, Haohe Liu, Han Yin, Yafei Jia, Siwei Huang,
Yutong Du, Dongzhe Zhang, Mark D. Plumbley, Dongyuan Shi, Woon-Seng Gan,
Susanto Rahardja, Bin Xiang, Jianfeng Chen
- Abstract要約: 音響シーン分類(ASC)は,音響シーン解析において重要な研究課題である。
ASCタスクの課題の1つは、トレーニングとテストデータの分散ギャップに起因するドメインシフトである。
ICME 2024 Grand Challengeにおいて,ドメインシフトに基づく半教師付き音響シーン分類の課題を紹介した。
- 参考スコア(独自算出の注目度): 28.483681147793295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Acoustic scene classification (ASC) is a crucial research problem in
computational auditory scene analysis, and it aims to recognize the unique
acoustic characteristics of an environment. One of the challenges of the ASC
task is domain shift caused by a distribution gap between training and testing
data. Since 2018, ASC challenges have focused on the generalization of ASC
models across different recording devices. Although this task in recent years
has achieved substantial progress in device generalization, the challenge of
domain shift between different regions, involving characteristics such as time,
space, culture, and language, remains insufficiently explored at present. In
addition, considering the abundance of unlabeled acoustic scene data in the
real world, it is important to study the possible ways to utilize these
unlabelled data. Therefore, we introduce the task Semi-supervised Acoustic
Scene Classification under Domain Shift in the ICME 2024 Grand Challenge. We
encourage participants to innovate with semi-supervised learning techniques,
aiming to develop more robust ASC models under domain shift.
- Abstract(参考訳): 音響シーン分類 (ASC) は, 音場解析において重要な研究課題であり, 環境の独特の音響特性を認識することを目的としている。
ASCタスクの課題の1つは、トレーニングとテストデータの分散ギャップに起因するドメインシフトである。
2018年以降、ASCの課題は、さまざまな記録デバイスにまたがるASCモデルの一般化に焦点を当てている。
近年のこの課題はデバイス一般化において大きな進歩を遂げているが、時間、空間、文化、言語など、異なる領域間のドメインシフトの課題はいまだに不十分である。
また、実世界におけるラベルなし音響シーンデータの存在量を考慮すると、これらのラベルなしデータを利用する方法を検討することが重要である。
そこで,ICME 2024 Grand Challengeにおいて,ドメインシフトに基づく半教師付き音響シーン分類を提案する。
我々は、ドメインシフトの下でより堅牢なASCモデルを開発することを目的として、半教師付き学習技術で革新を奨励する。
関連論文リスト
- Frequency-based Matcher for Long-tailed Semantic Segmentation [22.199174076366003]
我々は、比較的未探索なタスク設定、長い尾のセマンティックセマンティックセグメンテーション(LTSS)に焦点を当てる。
本稿では,セマンティックセグメンテーション手法と長鎖解の性能を示すために,二値評価システムを提案し,LTSSベンチマークを構築した。
また,1対1のマッチングによって過剰な圧縮問題を解決する周波数ベースのマーカであるLTSSを改善するトランスフォーマーベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-06T09:57:56Z) - Multi-Label Continual Learning for the Medical Domain: A Novel Benchmark [47.52603262576663]
一つのフレームワークにおける新しいクラス到着とドメインシフトの課題を組み合わせた新しいベンチマークを提案する。
本ベンチマークは,医療画像における多ラベル分類問題に対する現実的なCL設定をモデル化することを目的とする。
論文 参考訳(メタデータ) (2024-04-10T09:35:36Z) - FRCSyn Challenge at WACV 2024:Face Recognition Challenge in the Era of
Synthetic Data [82.5767720132393]
本稿では,WACV 2024 で組織された FRCSyn における顔認識チャレンジの概要について述べる。
これは、顔認識における合成データの利用を探求し、テクノロジーの既存の限界に対処する最初の国際的課題である。
論文 参考訳(メタデータ) (2023-11-17T12:15:40Z) - The Robust Semantic Segmentation UNCV2023 Challenge Results [99.97867942388486]
本稿では,ICCV 2023で実施されたMUAD不確実性定量化問題に対処するために用いられる勝利解について概説する。
この課題は、都市環境におけるセマンティックセグメンテーションを中心に、特に自然の敵対的なシナリオに焦点を当てた。
本報告では, 最先端の不確実性定量化手法からインスピレーションを得た19件の論文を提示する。
論文 参考訳(メタデータ) (2023-09-27T08:20:03Z) - Robust, General, and Low Complexity Acoustic Scene Classification
Systems and An Effective Visualization for Presenting a Sound Scene Context [53.80051967863102]
音響シーン分類(ASC)の包括的解析について述べる。
ASCベースラインと呼ばれる,創発的かつ低フットプリントのASCモデルを提案する。
次に、新しいディープニューラルネットワークアーキテクチャを提案することにより、ASCベースラインを改善する。
論文 参考訳(メタデータ) (2022-10-16T19:07:21Z) - Few-shot bioacoustic event detection at the DCASE 2022 challenge [0.0]
わずかにラベル付き例があるにも関わらず、音声イベント検出は音イベントを検出するタスクである。
本稿では,DCASE 2022チャレンジに含まれるバイオアコースティック音響イベント検出タスクの第2版の概要について述べる。
最も高いFスコアは、評価セットの60%であり、昨年の版よりも大幅に改善された。
論文 参考訳(メタデータ) (2022-07-14T09:33:47Z) - Wider or Deeper Neural Network Architecture for Acoustic Scene
Classification with Mismatched Recording Devices [59.86658316440461]
音響シーン分類(ASC)のためのロバストで低複雑性なシステムを提案する。
本稿では,まず,新しい入出力型ネットワークアーキテクチャを設計し,不一致な記録装置問題に対処する,ASCベースラインシステムを構築する。
さらなる性能向上を図りながら、低複雑性モデルを満たすために、多重スペクトルのアンサンブルとチャネル縮小の2つの手法を適用した。
論文 参考訳(メタデータ) (2022-03-23T10:27:41Z) - Description and Discussion on DCASE 2021 Challenge Task 2: Unsupervised
Anomalous Sound Detection for Machine Condition Monitoring under Domain
Shifted Conditions [37.68195595947483]
本課題は, ASD システムの実用化における避けられない問題に焦点をあてる。
この課題の主な課題は、トレーニングと試験サンプルの音響特性が異なる未知の異常音を検出することである。
論文 参考訳(メタデータ) (2021-06-08T16:26:10Z) - Cross-domain Adaptation with Discrepancy Minimization for
Text-independent Forensic Speaker Verification [61.54074498090374]
本研究では,複数の音響環境下で収集したCRSS-Forensicsオーディオデータセットを紹介する。
我々は、VoxCelebデータを用いてCNNベースのネットワークを事前訓練し、次に、CRSS-Forensicsのクリーンな音声で高レベルのネットワーク層の一部を微調整するアプローチを示す。
論文 参考訳(メタデータ) (2020-09-05T02:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。