論文の概要: A Time-domain Generalized Wiener Filter for Multi-channel Speech
Separation
- arxiv url: http://arxiv.org/abs/2112.03533v1
- Date: Tue, 7 Dec 2021 07:16:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 15:19:32.011402
- Title: A Time-domain Generalized Wiener Filter for Multi-channel Speech
Separation
- Title(参考訳): 多チャンネル音声分離のための時間領域一般化ウィナーフィルタ
- Authors: Yi Luo
- Abstract要約: 周波数領域ニューラルビームフォーマは、近年のマルチチャネル音声分離モデルの主流手法である。
本稿では、従来の周波数領域ビームフォーマの拡張として、時間領域ワイナー一般化フィルタ(TD-GWF)を提案する。
実験結果から,周波数領域ビームフォーマをTD-GWFに置き換えることで,大幅な性能向上が達成できた。
- 参考スコア(独自算出の注目度): 11.970226369922598
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Frequency-domain neural beamformers are the mainstream methods for recent
multi-channel speech separation models. Despite their well-defined behaviors
and the effectiveness, such frequency-domain beamformers still have the
limitations of a bounded oracle performance and the difficulties of designing
proper networks for the complex-valued operations. In this paper, we propose a
time-domain generalized Wiener filter (TD-GWF), an extension to the
conventional frequency-domain beamformers that has higher oracle performance
and only involves real-valued operations. We also provide discussions on how
TD-GWF can be connected to conventional frequency-domain beamformers.
Experiment results show that a significant performance improvement can be
achieved by replacing frequency-domain beamformers by the TD-GWF in the
recently proposed sequential neural beamforming pipelines.
- Abstract(参考訳): 周波数領域ニューラルビームフォーマは、近年のマルチチャネル音声分離モデルの主流手法である。
これらの周波数領域ビームフォーマは、よく定義された振舞いと有効性にもかかわらず、有界オラクル性能の限界と複雑な演算のために適切なネットワークを設計することが困難である。
本稿では,時間領域一般化Wienerフィルタ(TD-GWF)を提案する。
また、従来の周波数領域ビームフォーマにTD-GWFを接続する方法についても論じる。
実験の結果,最近提案された逐次ニューラルネットワークビームフォーミングパイプラインにおいて,周波数領域ビームフォーマをtd-gwfに置き換えることで,大幅な性能向上を実現することができた。
関連論文リスト
- FAITH: Frequency-domain Attention In Two Horizons for Time Series Forecasting [13.253624747448935]
時系列予測は、産業機器の保守、気象学、エネルギー消費、交通流、金融投資など、様々な分野で重要な役割を果たしている。
現在のディープラーニングベースの予測モデルは、予測結果と基礎的真実の間に大きな違いを示すことが多い。
本稿では、時系列をトレンドと季節成分に分解する2つのホライズンズにおける周波数領域注意モデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T02:37:02Z) - ATFNet: Adaptive Time-Frequency Ensembled Network for Long-term Time Series Forecasting [7.694820760102176]
ATFNetは、時間ドメインモジュールと周波数ドメインモジュールを組み合わせた革新的なフレームワークである。
本稿では,2つのモジュール間の重み調整機構であるドミナント・ハーモニック・シリーズ・エナジー・ウェイトリングを紹介する。
我々の複素数値スペクトル注意機構は、異なる周波数の組み合わせ間の複雑な関係を識別するための新しいアプローチを提供する。
論文 参考訳(メタデータ) (2024-04-08T04:41:39Z) - WFTNet: Exploiting Global and Local Periodicity in Long-term Time Series
Forecasting [61.64303388738395]
本稿では,長期連続予測のためのWavelet-Fourier Transform Network (WFTNet)を提案する。
さまざまな時系列データセットのテストでは、WFTNetは他の最先端のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-09-20T13:44:18Z) - Adaptive Frequency Filters As Efficient Global Token Mixers [100.27957692579892]
適応周波数フィルタは効率的なグローバルトークンミキサーとして機能することを示す。
我々は、AFFNetと呼ばれる軽量ニューラルネットワークを構築するために、AFFトークンミキサーを主要なニューラルネットワークとして捉えています。
論文 参考訳(メタデータ) (2023-07-26T07:42:28Z) - Transform Once: Efficient Operator Learning in Frequency Domain [69.74509540521397]
本研究では、周波数領域の構造を利用して、空間や時間における長距離相関を効率的に学習するために設計されたディープニューラルネットワークについて検討する。
この研究は、単一変換による周波数領域学習のための青写真を導入している。
論文 参考訳(メタデータ) (2022-11-26T01:56:05Z) - Adaptive Frequency Learning in Two-branch Face Forgery Detection [66.91715092251258]
本稿では、AFDと呼ばれる2分岐検出フレームワークにおいて、周波数情報を適応的に学習する手法を提案する。
我々は、固定周波数変換からネットワークを解放し、データおよびタスク依存の変換層でより良いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-27T14:25:52Z) - Deep Frequency Filtering for Domain Generalization [55.66498461438285]
Deep Neural Networks(DNN)は、学習プロセスにおいて、いくつかの周波数成分を優先する。
本稿では、ドメイン一般化可能な特徴を学習するためのDeep Frequency Filtering (DFF)を提案する。
提案したDFFをベースラインに適用すると,ドメインの一般化タスクにおける最先端の手法よりも優れることを示す。
論文 参考訳(メタデータ) (2022-03-23T05:19:06Z) - Rethinking FUN: Frequency-Domain Utilization Networks [21.10493050675827]
本稿では、新しい周波数領域利用ネットワークのファミリーであるFUNを紹介する。
これらのネットワークは、その領域で直接作業することで周波数領域の固有効率を利用する。
周波数領域での動作は、アーキテクチャに明示的な変更を加えることなく、推論時に入力を動的に圧縮できることを示す。
論文 参考訳(メタデータ) (2020-12-06T19:16:37Z) - F-FADE: Frequency Factorization for Anomaly Detection in Edge Streams [53.70940420595329]
エッジストリームにおける異常検出のための新しいアプローチであるF-FADEを提案する。
ノード対間の相互作用の周波数の時間進化分布を効率的にモデル化するために、新しい周波数分解技術を用いる。
F-FADEは、一定メモリしか必要とせず、時間的および構造的な変化を伴う幅広い種類の異常をオンラインストリーミング環境で処理できる。
論文 参考訳(メタデータ) (2020-11-09T19:55:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。