論文の概要: Interspeech 2021 Deep Noise Suppression Challenge
- arxiv url: http://arxiv.org/abs/2101.01902v3
- Date: Mon, 5 Apr 2021 01:19:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 06:48:28.429034
- Title: Interspeech 2021 Deep Noise Suppression Challenge
- Title(参考訳): インタースパイチ2021深部騒音抑制チャレンジ
- Authors: Chandan K A Reddy, Harishchandra Dubey, Kazuhito Koishida, Arun Nair,
Vishak Gopal, Ross Cutler, Sebastian Braun, Hannes Gamper, Robert Aichner,
Sriram Srinivasan
- Abstract要約: DNSチャレンジは、ノイズ抑圧の領域におけるイノベーションを奨励し、知覚音声の品質を向上するように設計されている。
広帯域シナリオのためのトレーニングとテストデータセットをオープンソース化した。
InterSPEECH 2021で組織された課題のこのバージョンでは、トレーニングとテストの両方のデータセットを拡張して、完全なバンドシナリオに対応しています。
- 参考スコア(独自算出の注目度): 41.68545171728067
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Deep Noise Suppression (DNS) challenge is designed to foster innovation
in the area of noise suppression to achieve superior perceptual speech quality.
We recently organized a DNS challenge special session at INTERSPEECH and ICASSP
2020. We open-sourced training and test datasets for the wideband scenario. We
also open-sourced a subjective evaluation framework based on ITU-T standard
P.808, which was also used to evaluate participants of the challenge. Many
researchers from academia and industry made significant contributions to push
the field forward, yet even the best noise suppressor was far from achieving
superior speech quality in challenging scenarios. In this version of the
challenge organized at INTERSPEECH 2021, we are expanding both our training and
test datasets to accommodate full band scenarios. The two tracks in this
challenge will focus on real-time denoising for (i) wide band, and(ii) full
band scenarios. We are also making available a reliable non-intrusive objective
speech quality metric called DNSMOS for the participants to use during their
development phase.
- Abstract(参考訳): ディープノイズ抑圧(DNS)課題は、ノイズ抑圧の領域におけるイノベーションを促進し、より優れた知覚音声品質を実現するために設計されている。
我々は最近、InterSPEECHとICASSP 2020でDNSチャレンジ特別セッションを開催した。
広帯域シナリオのためのトレーニングとテストデータセットをオープンソースとして公開しました。
また、ITU-T標準P.808に基づく主観評価フレームワークをオープンソース化し、課題の参加者の評価にも使用された。
学界や業界からの多くの研究者がこの分野を前進させるために多大な貢献をしたが、最高のノイズ抑制装置でさえ、挑戦的なシナリオにおいて優れた音声品質を達成するには程遠いものだった。
InterSPEECH 2021で組織された課題のこのバージョンでは、トレーニングとテストの両方のデータセットを拡張して、完全なバンドシナリオに対応しています。
この課題における2つのトラックは、(i)ワイドバンドと(ii)フルバンドシナリオのリアルタイムなデノージングに焦点を当てる。
また,開発段階で使用するために,dnsmosと呼ばれる信頼性の高い非インタラクティブな客観的音声品質指標を利用可能にする。
関連論文リスト
- The VoxCeleb Speaker Recognition Challenge: A Retrospective [75.40776645175585]
VoxCeleb Speaker Recognition Challenges (VoxSRC)は、2019年から2023年にかけて毎年開催される一連の課題とワークショップである。
課題は主に、様々な環境下で話者認識とダイアリゼーションのタスクを評価した。
私たちは、これらの課題について、彼らが何を探求したのか、課題参加者によって開発された方法、そしてそれらがどのように進化したのかをレビューします。
論文 参考訳(メタデータ) (2024-08-27T08:57:31Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - The RoboDepth Challenge: Methods and Advancements Towards Robust Depth Estimation [97.63185634482552]
我々は,RoboDepth Challengeの優勝ソリューションを要約する。
この課題は、堅牢なOoD深度推定を容易にし、前進させるように設計された。
この課題が、堅牢で信頼性の高い深度推定に関する将来の研究の基盤となることを願っている。
論文 参考訳(メタデータ) (2023-07-27T17:59:56Z) - DeepVQE: Real Time Deep Voice Quality Enhancement for Joint Acoustic
Echo Cancellation, Noise Suppression and Dereverberation [12.734839065028547]
本稿では、残差畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)に基づく、DeepVQEと呼ばれるリアルタイムのクロスアテンションディープモデルを提案する。
モデルの各コンポーネントのコントリビューションを分析して、全体的なパフォーマンスを実現する。
ICASSP 2023 Acoustic Echo Challenge とICASSP 2023 Deep Noise Suppression Challenge テストセットの非個人化トラックにおけるDeepVQEの最先端性能は、単一のモデルが優れたパフォーマンスで複数のタスクを処理可能であることを示している。
論文 参考訳(メタデータ) (2023-06-05T18:37:05Z) - ASVspoof 2021: accelerating progress in spoofed and deepfake speech
detection [70.45884214674057]
ASVspoof 2021は、スプーフの研究を促進するための2年制の課題の第4版である。
本稿では,3つのタスク,それぞれのデータベース,評価基準,4つの課題ベースライン,評価プラットフォーム,課題結果の要約について述べる。
論文 参考訳(メタデータ) (2021-09-01T16:17:31Z) - Description and Discussion on DCASE 2021 Challenge Task 2: Unsupervised
Anomalous Sound Detection for Machine Condition Monitoring under Domain
Shifted Conditions [37.68195595947483]
本課題は, ASD システムの実用化における避けられない問題に焦点をあてる。
この課題の主な課題は、トレーニングと試験サンプルの音響特性が異なる未知の異常音を検出することである。
論文 参考訳(メタデータ) (2021-06-08T16:26:10Z) - Deep Dense and Convolutional Autoencoders for Unsupervised Anomaly
Detection in Machine Condition Sounds [55.18259748448095]
本報告では,DCASE 2020 チャレンジの第2タスクのために開発された2つの手法について述べる。
この課題には、異常音を検出する教師なしの学習が含まれており、トレーニングプロセス中に通常の機械作業条件サンプルのみが利用可能である。
この2つの手法は、メルスペクトグラム処理された音響特徴を用いた密集的および畳み込み的アーキテクチャに基づくディープオートエンコーダを含む。
論文 参考訳(メタデータ) (2020-06-18T10:49:49Z) - The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets,
Subjective Testing Framework, and Challenge Results [27.074806625047646]
DNS Challengeは、リアルタイム単一チャンネル音声強調における協調研究を促進することを目的としている。
我々は,ノイズ抑圧モデルの学習のための大規模クリーン音声コーパスとノイズコーパスをオープンソース化した。
また、ITU-T P.808をベースとしたオンライン主観的テストフレームワークをオープンソースとして公開し、研究者が開発を確実に行えるようにした。
論文 参考訳(メタデータ) (2020-05-16T23:48:37Z) - The INTERSPEECH 2020 Deep Noise Suppression Challenge: Datasets,
Subjective Speech Quality and Testing Framework [27.074806625047646]
InterSPEECH 2020 Deep Noise Suppression Challengeは、リアルタイム単一チャネル音声強調における協調研究を促進することを目的としている。
我々は,騒音抑制モデルを訓練するための大規模なクリーン音声とノイズコーパスをオープンソースとして公開し,実世界のシナリオに対する代表的テストセットを作成した。
この挑戦の勝者は、P.808フレームワークを使用した代表的テストセットの主観的評価に基づいて選ばれる。
論文 参考訳(メタデータ) (2020-01-23T17:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。