論文の概要: Residual acoustic echo suppression based on efficient multi-task
convolutional neural network
- arxiv url: http://arxiv.org/abs/2009.13931v2
- Date: Fri, 6 Nov 2020 03:33:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 07:04:16.243049
- Title: Residual acoustic echo suppression based on efficient multi-task
convolutional neural network
- Title(参考訳): マルチタスク畳み込みニューラルネットワークによる残留音響エコー抑圧
- Authors: Xinquan Zhou, Yanhong Leng
- Abstract要約: 本稿では,効率的な畳み込みニューラルネットワークを用いた実時間残響エコー抑圧法を提案する。
トレーニング基準は、残留エコーの抑制とニアエンド信号の歪みのバランスをとるために、抑制損失と呼ばれる新しい損失関数に基づいている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acoustic echo degrades the user experience in voice communication systems
thus needs to be suppressed completely. We propose a real-time residual
acoustic echo suppression (RAES) method using an efficient convolutional neural
network. The double talk detector is used as an auxiliary task to improve the
performance of RAES in the context of multi-task learning. The training
criterion is based on a novel loss function, which we call as the suppression
loss, to balance the suppression of residual echo and the distortion of
near-end signals. The experimental results show that the proposed method can
efficiently suppress the residual echo under different circumstances.
- Abstract(参考訳): 音響エコーは音声通信システムのユーザエクスペリエンスを劣化させるため、完全に抑制する必要がある。
本稿では,効率的な畳み込みニューラルネットワークを用いた実時間残響エコー抑圧法を提案する。
ダブルトーク検出器は、マルチタスク学習の文脈でRAESの性能を向上させる補助タスクとして使用される。
トレーニング基準は、残留エコーの抑制とニアエンド信号の歪みのバランスをとるために、抑制損失と呼ばれる新しい損失関数に基づいている。
実験の結果,提案手法は異なる状況下で残エコーを効率的に抑制できることがわかった。
関連論文リスト
- End-to-End Binaural Speech Synthesis [71.1869877389535]
本稿では,低ビットレート音声システムと強力なデコーダを組み合わせたエンドツーエンド音声合成システムを提案する。
実感的な聴覚シーンを作るために必要な環境効果を捉える上で, 対人的損失がもたらす効果を実証する。
論文 参考訳(メタデータ) (2022-07-08T05:18:36Z) - Audio-visual multi-channel speech separation, dereverberation and
recognition [70.34433820322323]
本稿では,音声-視覚的多チャンネル音声分離,デバーベレーション,認識手法を提案する。
音声を用いた場合の視覚的モダリティの利点は、2つのニューラルデバーベレーションアプローチでのみ示される。
LRS2データセットを用いて行った実験から,提案手法がベースラインよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-04-05T04:16:03Z) - Improving Noise Robustness of Contrastive Speech Representation Learning
with Speech Reconstruction [109.44933866397123]
実環境における音声認識システムの実現には,雑音の堅牢性が不可欠である。
雑音認識のための自己教師型フレームワークにより学習したノイズロスト表現を用いる。
ラベル付きデータのわずか16%で報告された最高の教師付きアプローチに匹敵するパフォーマンスを実現した。
論文 参考訳(メタデータ) (2021-10-28T20:39:02Z) - Removing Noise from Extracellular Neural Recordings Using Fully
Convolutional Denoising Autoencoders [62.997667081978825]
ノイズの多いマルチチャネル入力からクリーンなニューロン活動信号を生成することを学習する完全畳み込みデノイングオートエンコーダを提案する。
シミュレーションデータを用いた実験結果から,提案手法はノイズ崩壊型ニューラルネットワークの品質を大幅に向上させることができることがわかった。
論文 参考訳(メタデータ) (2021-09-18T14:51:24Z) - Deep Residual Echo Suppression with A Tunable Tradeoff Between Signal
Distortion and Echo Suppression [13.558688470594676]
UNetニューラルネットワークは、線形音響エコーキャンセラの出力をスペクトル領域の所望の信号にマッピングする。
このシステムは136万のパラメータを使用し、毎秒1.6ギガ浮動小数点演算と10メガバイトのメモリを必要とする。
論文 参考訳(メタデータ) (2021-06-25T09:49:18Z) - On End-to-end Multi-channel Time Domain Speech Separation in Reverberant
Environments [33.79711018198589]
本稿では,残響環境におけるマルチチャンネル時間領域音声分離手法を提案する。
完全な畳み込みニューラルネットワーク構造は、複数のマイク記録から直接音声を分離するために使われてきた。
残響が空間的特徴抽出に与える影響を低減するため, 残響前処理法が適用された。
論文 参考訳(メタデータ) (2020-11-11T18:25:07Z) - Acoustic Echo Cancellation by Combining Adaptive Digital Filter and
Recurrent Neural Network [11.335343110341354]
適応フィルタとニューラルネットワークを組み合わせた融合方式を音響エコーキャンセラに提案する。
適応フィルタリングによりエコーを大規模に低減することができ、残留エコーはほとんど得られなかった。
ニューラルネットワークは、そのような残留エコーを抑制するために精巧に設計され、訓練されている。
論文 参考訳(メタデータ) (2020-05-19T06:25:52Z) - Nonlinear Residual Echo Suppression Based on Multi-stream Conv-TasNet [22.56178941790508]
完全畳み込み時間領域音声分離ネットワーク(Conv-TasNet)の修正に基づく残響抑圧手法を提案する。
線形音響エコーキャンセラシステムの残差信号と適応フィルタの出力の両方を用いて、Conv-TasNetの複数のストリームを形成する。
論文 参考訳(メタデータ) (2020-05-15T16:41:16Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。