論文の概要: Acoustic Echo Cancellation by Combining Adaptive Digital Filter and
Recurrent Neural Network
- arxiv url: http://arxiv.org/abs/2005.09237v1
- Date: Tue, 19 May 2020 06:25:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 14:51:40.934081
- Title: Acoustic Echo Cancellation by Combining Adaptive Digital Filter and
Recurrent Neural Network
- Title(参考訳): 適応型ディジタルフィルタとリカレントニューラルネットワークを組み合わせた音響エコーキャンセラ
- Authors: Lu Ma, Hua Huang, Pei Zhao, Tengrong Su
- Abstract要約: 適応フィルタとニューラルネットワークを組み合わせた融合方式を音響エコーキャンセラに提案する。
適応フィルタリングによりエコーを大規模に低減することができ、残留エコーはほとんど得られなかった。
ニューラルネットワークは、そのような残留エコーを抑制するために精巧に設計され、訓練されている。
- 参考スコア(独自算出の注目度): 11.335343110341354
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acoustic Echo Cancellation (AEC) plays a key role in voice interaction. Due
to the explicit mathematical principle and intelligent nature to accommodate
conditions, adaptive filters with different types of implementations are always
used for AEC, giving considerable performance. However, there would be some
kinds of residual echo in the results, including linear residue introduced by
mismatching between estimation and the reality and non-linear residue mostly
caused by non-linear components on the audio devices. The linear residue can be
reduced with elaborate structure and methods, leaving the non-linear residue
intractable for suppression. Though, some non-linear processing methods have
already be raised, they are complicated and inefficient for suppression, and
would bring damage to the speech audio. In this paper, a fusion scheme by
combining adaptive filter and neural network is proposed for AEC. The echo
could be reduced in a large scale by adaptive filtering, resulting in little
residual echo. Though it is much smaller than speech audio, it could also be
perceived by human ear and would make communication annoy. The neural network
is elaborately designed and trained for suppressing such residual echo.
Experiments compared with prevailing methods are conducted, validating the
effectiveness and superiority of the proposed combination scheme.
- Abstract(参考訳): 音響エコーキャンセレーション(aec)は音声対話において重要な役割を果たす。
条件を満たすための明示的な数学的原理とインテリジェントな性質のため、異なる種類の実装を持つ適応フィルタは常にAECで使われており、性能はかなり高い。
しかし、推定と現実とのミスマッチによって生じる線形残差や、主にオーディオデバイス上の非線形成分によって生じる非線形残差など、結果に残留する残差がいくつか存在する。
線形残基は精巧な構造と方法によって減少することができ、非線形残基は抑制に難渋する。
しかし,一部の非線形処理手法はすでに引き上げられているが,抑制には複雑で非効率であり,音声にダメージを与える可能性がある。
本稿では,適応フィルタとニューラルネットワークを組み合わせた融合方式を提案する。
適応フィルタリングによってエコーを大規模に減らすことができ、残響が少なくなる。
音声よりもずっと小さいが、人間の耳によっても知覚され、コミュニケーションをいらいらさせる可能性がある。
ニューラルネットワークは、そのような残留エコーを抑制するために精巧に設計され、訓練されている。
提案手法との比較実験を行い,提案方式の有効性と優位性を検証した。
関連論文リスト
- Run-Time Adaptation of Neural Beamforming for Robust Speech Dereverberation and Denoising [15.152748065111194]
本稿では,実環境におけるリアルタイム自動音声認識のための音声強調について述べる。
ノイズの多いエコー混合分光器とディープニューラルネットワーク(DNN)からクリーンドライ音声のマスクを推定し、ビームフォーミングに用いる拡張フィルタを算出する。
しかし、このような教師付きアプローチのパフォーマンスは、ミスマッチした条件下で大幅に劣化する。
論文 参考訳(メタデータ) (2024-10-30T08:32:47Z) - UNIT-DSR: Dysarthric Speech Reconstruction System Using Speech Unit
Normalization [60.43992089087448]
変形性音声再構成システムは、変形性音声を正常な音声に変換することを目的としている。
本稿では,HuBERTのドメイン適応能力を活用して学習効率を向上させるユニットDSRシステムを提案する。
NEDアプローチと比較すると、ユニットDSRシステムは音声単位正規化器とユニットHiFi-GANボコーダのみで構成されている。
論文 参考訳(メタデータ) (2024-01-26T06:08:47Z) - Simple Pooling Front-ends For Efficient Audio Classification [56.59107110017436]
入力音声特徴量における時間的冗長性を排除することは,効率的な音声分類に有効な方法である可能性が示唆された。
本稿では、単純な非パラメトリックプーリング操作を用いて冗長な情報を削減する単純なプールフロントエンド(SimPFs)のファミリーを提案する。
SimPFは、市販オーディオニューラルネットワークの浮動小数点演算数の半数以上を削減できる。
論文 参考訳(メタデータ) (2022-10-03T14:00:41Z) - A Passive Similarity based CNN Filter Pruning for Efficient Acoustic
Scene Classification [23.661189257759535]
音響シーン分類(ASC)のための低複雑さ畳み込みニューラルネットワーク(CNN)の開発手法を提案する。
本稿では,CNNからの畳み込みフィルタを除去し,圧縮したCNNを生成するパッシブ・フィルタ・プルーニング・フレームワークを提案する。
提案手法は単純で,パラメータが25%少なく,精度が1%以下で,推論当たりの計算量を27%削減する。
論文 参考訳(メタデータ) (2022-03-29T17:00:06Z) - Exploiting Cross Domain Acoustic-to-articulatory Inverted Features For
Disordered Speech Recognition [57.15942628305797]
調音機能は音響信号歪みに不変であり、正常音声の自動音声認識システムにうまく組み込まれている。
本稿では,15時間 TORGO コーパスの並列音響・調音データをモデルトレーニングに用いるクロスドメイン音響・調音(A2A)インバージョン手法を提案する。
クロスドメインは102.7時間のUASpeechコーパスに適応し、調音的特徴を生産する。
論文 参考訳(メタデータ) (2022-03-19T08:47:18Z) - Discretization and Re-synthesis: an alternative method to solve the
Cocktail Party Problem [65.25725367771075]
この研究は、初めて合成に基づくアプローチがこの問題にうまく対応できることを示した。
具体的には,離散シンボルの認識に基づく音声分離/強調モデルを提案する。
離散シンボルの入力による合成モデルを利用することで、離散シンボル列の予測後、各ターゲット音声を再合成することができる。
論文 参考訳(メタデータ) (2021-12-17T08:35:40Z) - End-to-End Complex-Valued Multidilated Convolutional Neural Network for
Joint Acoustic Echo Cancellation and Noise Suppression [25.04740291728234]
本稿では、複雑な時間周波数マスクのオフセット補償機能を活用し、エンドツーエンドの複雑なニューラルネットワークアーキテクチャを提案する。
また,同時音声強調による共同エコーと雑音抑圧のための二重マスク手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T07:41:41Z) - Residual acoustic echo suppression based on efficient multi-task
convolutional neural network [0.0]
本稿では,効率的な畳み込みニューラルネットワークを用いた実時間残響エコー抑圧法を提案する。
トレーニング基準は、残留エコーの抑制とニアエンド信号の歪みのバランスをとるために、抑制損失と呼ばれる新しい損失関数に基づいている。
論文 参考訳(メタデータ) (2020-09-29T11:26:25Z) - Nonlinear Residual Echo Suppression Based on Multi-stream Conv-TasNet [22.56178941790508]
完全畳み込み時間領域音声分離ネットワーク(Conv-TasNet)の修正に基づく残響抑圧手法を提案する。
線形音響エコーキャンセラシステムの残差信号と適応フィルタの出力の両方を用いて、Conv-TasNetの複数のストリームを形成する。
論文 参考訳(メタデータ) (2020-05-15T16:41:16Z) - Filter Grafting for Deep Neural Networks: Reason, Method, and
Cultivation [86.91324735966766]
フィルタは現代の畳み込みニューラルネットワーク(CNN)のキーコンポーネントである
本稿では,この目的を達成するためにフィルタグラフト(textbfMethod)を導入する。
我々は,フィルタの情報を測定するための新しい基準と,グラフトされた情報をネットワーク間でバランスをとるための適応重み付け戦略を開発する。
論文 参考訳(メタデータ) (2020-04-26T08:36:26Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。