論文の概要: Nonlinear Residual Echo Suppression Based on Multi-stream Conv-TasNet
- arxiv url: http://arxiv.org/abs/2005.07631v1
- Date: Fri, 15 May 2020 16:41:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 22:42:35.235571
- Title: Nonlinear Residual Echo Suppression Based on Multi-stream Conv-TasNet
- Title(参考訳): マルチストリームconv-tasnetによる非線形残響抑圧
- Authors: Hongsheng Chen, Teng Xiang, Kai Chen, Jing Lu
- Abstract要約: 完全畳み込み時間領域音声分離ネットワーク(Conv-TasNet)の修正に基づく残響抑圧手法を提案する。
線形音響エコーキャンセラシステムの残差信号と適応フィルタの出力の両方を用いて、Conv-TasNetの複数のストリームを形成する。
- 参考スコア(独自算出の注目度): 22.56178941790508
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Acoustic echo cannot be entirely removed by linear adaptive filters due to
the nonlinear relationship between the echo and far-end signal. Usually a post
processing module is required to further suppress the echo. In this paper, we
propose a residual echo suppression method based on the modification of fully
convolutional time-domain audio separation network (Conv-TasNet). Both the
residual signal of the linear acoustic echo cancellation system, and the output
of the adaptive filter are adopted to form multiple streams for the
Conv-TasNet, resulting in more effective echo suppression while keeping a lower
latency of the whole system. Simulation results validate the efficacy of the
proposed method in both single-talk and double-talk situations.
- Abstract(参考訳): エコーと遠端信号の非線形関係により、線形適応フィルタにより音響エコーを完全に除去することはできない。
通常、後処理モジュールはエコーをさらに抑制するために必要となる。
本稿では,完全畳み込み型時間領域音声分離ネットワーク(conv-tasnet)の修正に基づく残響抑圧手法を提案する。
線形音響エコーキャンセラシステムの残差信号と適応フィルタの出力を併用して、Conv-TasNetの複数のストリームを形成することにより、システム全体の低レイテンシを維持しながら、より効率的なエコー抑圧を実現する。
シミュレーションにより,単発と二重発の両方において提案手法の有効性が検証された。
関連論文リスト
- Closed-form Filtering for Non-linear Systems [83.91296397912218]
我々は密度近似と計算効率の面でいくつかの利点を提供するガウスPSDモデルに基づく新しいフィルタのクラスを提案する。
本研究では,遷移や観測がガウスPSDモデルである場合,フィルタリングを効率的にクローズド形式で行うことができることを示す。
提案する推定器は, 近似の精度に依存し, 遷移確率の正則性に適応する推定誤差を伴って, 高い理論的保証を享受する。
論文 参考訳(メタデータ) (2024-02-15T08:51:49Z) - Simple Pooling Front-ends For Efficient Audio Classification [56.59107110017436]
入力音声特徴量における時間的冗長性を排除することは,効率的な音声分類に有効な方法である可能性が示唆された。
本稿では、単純な非パラメトリックプーリング操作を用いて冗長な情報を削減する単純なプールフロントエンド(SimPFs)のファミリーを提案する。
SimPFは、市販オーディオニューラルネットワークの浮動小数点演算数の半数以上を削減できる。
論文 参考訳(メタデータ) (2022-10-03T14:00:41Z) - A neural network-supported two-stage algorithm for lightweight
dereverberation on hearing devices [13.49645012479288]
本稿では,2段階の軽量オンライン補聴器のオンライン補聴アルゴリズムについて述べる。
このアプローチは、マルチチャネルのマルチフレーム線形フィルタとシングルチャネルのシングルフレームポストフィルタを組み合わせる。
どちらのコンポーネントも、ディープニューラルネットワーク(DNN)によって提供されるパワースペクトル密度(PSD)の推定に依存している。
論文 参考訳(メタデータ) (2022-04-06T11:08:28Z) - Adaptive Low-Pass Filtering using Sliding Window Gaussian Processes [71.23286211775084]
ガウス過程回帰に基づく適応型低域通過フィルタを提案する。
本研究では,提案手法の誤差が一様境界であることを示す。
論文 参考訳(メタデータ) (2021-11-05T17:06:59Z) - End-to-End Complex-Valued Multidilated Convolutional Neural Network for
Joint Acoustic Echo Cancellation and Noise Suppression [25.04740291728234]
本稿では、複雑な時間周波数マスクのオフセット補償機能を活用し、エンドツーエンドの複雑なニューラルネットワークアーキテクチャを提案する。
また,同時音声強調による共同エコーと雑音抑圧のための二重マスク手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T07:41:41Z) - Deep Residual Echo Suppression with A Tunable Tradeoff Between Signal
Distortion and Echo Suppression [13.558688470594676]
UNetニューラルネットワークは、線形音響エコーキャンセラの出力をスペクトル領域の所望の信号にマッピングする。
このシステムは136万のパラメータを使用し、毎秒1.6ギガ浮動小数点演算と10メガバイトのメモリを必要とする。
論文 参考訳(メタデータ) (2021-06-25T09:49:18Z) - Class-Conditional Defense GAN Against End-to-End Speech Attacks [82.21746840893658]
本稿では,DeepSpeech や Lingvo といった先進的な音声テキストシステムを騙すために開発された,エンドツーエンドの敵対攻撃に対する新しいアプローチを提案する。
従来の防御手法とは異なり、提案手法は入力信号のオートエンコードのような低レベル変換を直接利用しない。
我々の防衛GANは、単語誤り率と文レベルの認識精度において、従来の防衛アルゴリズムよりもかなり優れています。
論文 参考訳(メタデータ) (2020-10-22T00:02:02Z) - Residual acoustic echo suppression based on efficient multi-task
convolutional neural network [0.0]
本稿では,効率的な畳み込みニューラルネットワークを用いた実時間残響エコー抑圧法を提案する。
トレーニング基準は、残留エコーの抑制とニアエンド信号の歪みのバランスをとるために、抑制損失と呼ばれる新しい損失関数に基づいている。
論文 参考訳(メタデータ) (2020-09-29T11:26:25Z) - Acoustic Echo Cancellation by Combining Adaptive Digital Filter and
Recurrent Neural Network [11.335343110341354]
適応フィルタとニューラルネットワークを組み合わせた融合方式を音響エコーキャンセラに提案する。
適応フィルタリングによりエコーを大規模に低減することができ、残留エコーはほとんど得られなかった。
ニューラルネットワークは、そのような残留エコーを抑制するために精巧に設計され、訓練されている。
論文 参考訳(メタデータ) (2020-05-19T06:25:52Z) - Audio-visual Multi-channel Recognition of Overlapped Speech [79.21950701506732]
本稿では,音声とマルチチャンネルの重なり合う音声認識システムについて述べる。
実験により,提案したマルチチャネルAVSRシステムは,音声のみのASRシステムを最大6.81% (26.83%) ,22.22% (56.87%) の絶対単語誤り率 (WER) で比較した。
論文 参考訳(メタデータ) (2020-05-18T10:31:19Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。