論文の概要: Deep Residual Echo Suppression with A Tunable Tradeoff Between Signal
Distortion and Echo Suppression
- arxiv url: http://arxiv.org/abs/2106.13531v1
- Date: Fri, 25 Jun 2021 09:49:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-28 12:52:51.890549
- Title: Deep Residual Echo Suppression with A Tunable Tradeoff Between Signal
Distortion and Echo Suppression
- Title(参考訳): 信号歪みとエコー抑圧の調整可能なトレードオフによる深い残留エコー抑圧
- Authors: Amir Ivry, Israel Cohen, Baruch Berdugo
- Abstract要約: UNetニューラルネットワークは、線形音響エコーキャンセラの出力をスペクトル領域の所望の信号にマッピングする。
このシステムは136万のパラメータを使用し、毎秒1.6ギガ浮動小数点演算と10メガバイトのメモリを必要とする。
- 参考スコア(独自算出の注目度): 13.558688470594676
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a residual echo suppression method using a UNet
neural network that directly maps the outputs of a linear acoustic echo
canceler to the desired signal in the spectral domain. This system embeds a
design parameter that allows a tunable tradeoff between the desired-signal
distortion and residual echo suppression in double-talk scenarios. The system
employs 136 thousand parameters, and requires 1.6 Giga floating-point
operations per second and 10 Mega-bytes of memory. The implementation satisfies
both the timing requirements of the AEC challenge and the computational and
memory limitations of on-device applications. Experiments are conducted with
161~h of data from the AEC challenge database and from real independent
recordings. We demonstrate the performance of the proposed system in real-life
conditions and compare it with two competing methods regarding echo suppression
and desired-signal distortion, generalization to various environments, and
robustness to high echo levels.
- Abstract(参考訳): 本稿では,線形音響エコーキャンセラの出力を直接スペクトル領域の所望信号にマッピングするUNetニューラルネットワークを用いた残留エコー抑圧手法を提案する。
このシステムでは、ダブルトークシナリオにおける所望の信号歪みと残留エコー抑圧との調整可能なトレードオフを可能にする設計パラメータを組み込む。
このシステムは136万のパラメータを使用し、毎秒1.6ギガ浮動小数点演算と10メガバイトのメモリを必要とする。
この実装は、AECチャレンジのタイミング要件とオンデバイスアプリケーションの計算およびメモリ制限の両方を満たす。
AECチャレンジデータベースと実際の独立記録から161〜hのデータを用いて実験を行う。
提案システムの性能を実生活環境で実証し、エコー抑圧と所望の信号歪み、様々な環境への一般化、高エコーレベルの堅牢性に関する2つの競合手法と比較する。
関連論文リスト
- RF Challenge: The Data-Driven Radio Frequency Signal Separation Challenge [66.33067693672696]
本稿では、新しいデータ駆動手法を用いて、高周波信号における干渉拒否の重大な問題に対処する。
まず、干渉除去アルゴリズムの開発と解析の基礎となる洞察に富んだ信号モデルを提案する。
第2に,さまざまなRF信号とコードテンプレートを備えた公開データセットであるRF Challengeを紹介する。
第3に,UNetやWaveNetなどのアーキテクチャにおいて,新しいAIに基づく拒絶アルゴリズムを提案し,その性能を8種類の信号混合タイプで評価する。
論文 参考訳(メタデータ) (2024-09-13T13:53:41Z) - DGSD: Dynamical Graph Self-Distillation for EEG-Based Auditory Spatial
Attention Detection [49.196182908826565]
AAD(Auditory Attention Detection)は、マルチスピーカー環境で脳信号からターゲット話者を検出することを目的としている。
現在のアプローチは主に、画像のようなユークリッドデータを処理するために設計された従来の畳み込みニューラルネットワークに依存している。
本稿では、入力として音声刺激を必要としないAADのための動的グラフ自己蒸留(DGSD)手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T13:43:46Z) - Simultaneous source separation of unknown numbers of single-channel underwater acoustic signals based on deep neural networks with separator-decoder structure [0.0]
本稿では,可能なターゲットの最大数に等しい一定数の出力チャネルを持つ,深層学習に基づく同時分離ソリューションを提案する。
この解は、目標への出力のアライメントによって引き起こされる置換問題による次元的災害を回避する。
放射音の混合を模擬した実験により, 提案手法は, 既知信号数と同等の分離性能が得られることを示した。
論文 参考訳(メタデータ) (2022-07-24T14:04:34Z) - End-to-End Complex-Valued Multidilated Convolutional Neural Network for
Joint Acoustic Echo Cancellation and Noise Suppression [25.04740291728234]
本稿では、複雑な時間周波数マスクのオフセット補償機能を活用し、エンドツーエンドの複雑なニューラルネットワークアーキテクチャを提案する。
また,同時音声強調による共同エコーと雑音抑圧のための二重マスク手法を提案する。
論文 参考訳(メタデータ) (2021-10-02T07:41:41Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。
我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文 参考訳(メタデータ) (2020-10-12T16:50:22Z) - Residual acoustic echo suppression based on efficient multi-task
convolutional neural network [0.0]
本稿では,効率的な畳み込みニューラルネットワークを用いた実時間残響エコー抑圧法を提案する。
トレーニング基準は、残留エコーの抑制とニアエンド信号の歪みのバランスをとるために、抑制損失と呼ばれる新しい損失関数に基づいている。
論文 参考訳(メタデータ) (2020-09-29T11:26:25Z) - Nonlinear Residual Echo Suppression Based on Multi-stream Conv-TasNet [22.56178941790508]
完全畳み込み時間領域音声分離ネットワーク(Conv-TasNet)の修正に基づく残響抑圧手法を提案する。
線形音響エコーキャンセラシステムの残差信号と適応フィルタの出力の両方を用いて、Conv-TasNetの複数のストリームを形成する。
論文 参考訳(メタデータ) (2020-05-15T16:41:16Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。