論文の概要: Learning Filterbanks for End-to-End Acoustic Beamforming
- arxiv url: http://arxiv.org/abs/2111.04614v1
- Date: Mon, 8 Nov 2021 16:36:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 17:49:38.301953
- Title: Learning Filterbanks for End-to-End Acoustic Beamforming
- Title(参考訳): エンドツーエンド音響ビームフォーミングのための学習フィルタバンク
- Authors: Samuele Cornell, Manuel Pariente, Fran\c{c}ois Grondin, Stefano
Squartini
- Abstract要約: モノラル音源分離に関する最近の研究は, 窓が短い完全学習フィルタバンクを用いることで, 性能を向上できることを示した。
一方、従来のビームフォーミング技術では、長い解析ウィンドウで性能が向上する。
この研究では、これらの2つの世界のギャップを埋め、完全なエンドツーエンドのハイブリッド・ニューラルビームフォーミングを探求する。
- 参考スコア(独自算出の注目度): 8.721077261941234
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work on monaural source separation has shown that performance can be
increased by using fully learned filterbanks with short windows. On the other
hand it is widely known that, for conventional beamforming techniques,
performance increases with long analysis windows. This applies also to most
hybrid neural beamforming methods which rely on a deep neural network (DNN) to
estimate the spatial covariance matrices. In this work we try to bridge the gap
between these two worlds and explore fully end-to-end hybrid neural beamforming
in which, instead of using the Short-Time-Fourier Transform, also the analysis
and synthesis filterbanks are learnt jointly with the DNN. In detail, we
explore two different types of learned filterbanks: fully learned and analytic.
We perform a detailed analysis using the recent Clarity Challenge data and show
that by using learnt filterbanks is possible to surpass oracle-mask based
beamforming for short windows.
- Abstract(参考訳): モノラル音源分離に関する最近の研究により, 窓が短い完全学習フィルタバンクを用いることで, 性能を向上できることが示されている。
一方、従来のビームフォーミング技術では、長い分析ウィンドウで性能が向上することが広く知られている。
これはまた、空間共分散行列を推定するためにディープニューラルネットワーク(DNN)に依存するほとんどのハイブリッドニューラルネットワークビームフォーミング手法にも適用される。
本研究では,これら2つの世界のギャップを橋渡しし,完全エンドツーエンドのハイブリッドニューラルネットワークビームフォーミングを探索する。そこでは,短時間フーリエ変換を用いる代わりに,解析と合成フィルタバンクをdnnと共同で学習する。
詳細は、学習されたフィルタバンクの2つの異なるタイプについて調べる。
我々は最近のClarity Challengeデータを用いて詳細な解析を行い、学習したフィルタバンクを使用することで、短い窓のオラクルマスクベースのビームフォーミングを超えることができることを示す。
関連論文リスト
- Unveiling the Unseen: Identifiable Clusters in Trained Depthwise
Convolutional Kernels [56.69755544814834]
深部分離型畳み込みニューラルネットワーク(DS-CNN)の最近の進歩は、新しいアーキテクチャをもたらす。
本稿では,DS-CNNアーキテクチャのもう一つの顕著な特性を明らかにする。
論文 参考訳(メタデータ) (2024-01-25T19:05:53Z) - A Continuous Convolutional Trainable Filter for Modelling Unstructured
Data [0.0]
トレーニング可能な畳み込みフィルタの連続バージョンを提案する。
実験の結果,連続フィルタは最先端の離散フィルタに匹敵する精度を達成できることがわかった。
論文 参考訳(メタデータ) (2022-10-24T17:34:10Z) - Utilizing Excess Resources in Training Neural Networks [41.07083436560303]
カーネルフィルタリング方式でフィルタリングレイヤの線形カスケードを実装することにより、トレーニング済みアーキテクチャが不要に深くなるのを防ぐことができる。
これにより、ほぼすべてのネットワークアーキテクチャで私たちのアプローチを使用でき、テスト時間内にフィルタリングレイヤを単一のレイヤに組み合わせることができます。
教師あり学習における様々なネットワークモデルとデータセットにおけるKFLOの利点を実証する。
論文 参考訳(メタデータ) (2022-07-12T13:48:40Z) - On the Role of Spatial, Spectral, and Temporal Processing for DNN-based
Non-linear Multi-channel Speech Enhancement [18.133635752982105]
ディープニューラルネットワーク(DNN)を使用して、マルチチャネル音声強調のためのフィルタを直接学習することは、2つの重要な利点がある。
非線形空間フィルタリングは線形処理モデルから生じる潜在的な制約を克服することができる。
空間情報とテンポスペクトル情報の合同処理により、異なる情報源間の相互依存を利用することができる。
論文 参考訳(メタデータ) (2022-06-22T15:42:44Z) - Optimization-Based Separations for Neural Networks [57.875347246373956]
本研究では,2層のシグモダルアクティベーションを持つディープ2ニューラルネットワークを用いて,ボールインジケータ関数を効率よく学習できることを示す。
これは最適化に基づく最初の分離結果であり、より強力なアーキテクチャの近似の利点は、実際に確実に現れる。
論文 参考訳(メタデータ) (2021-12-04T18:07:47Z) - Learning Versatile Convolution Filters for Efficient Visual Recognition [125.34595948003745]
本稿では,効率的な畳み込みニューラルネットワーク構築のための多目的フィルタを提案する。
本稿では,ネットワークの複雑性に関する理論的解析を行い,効率的な畳み込み手法を提案する。
ベンチマークデータセットとニューラルネットワークの実験結果は、我々の汎用フィルタが元のフィルタと同等の精度を達成できることを実証している。
論文 参考訳(メタデータ) (2021-09-20T06:07:14Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Graph Neural Networks with Adaptive Frequency Response Filter [55.626174910206046]
適応周波数応答フィルタを用いたグラフニューラルネットワークフレームワークAdaGNNを開発した。
提案手法の有効性を,様々なベンチマークデータセット上で実証的に検証した。
論文 参考訳(メタデータ) (2021-04-26T19:31:21Z) - Generalized Approach to Matched Filtering using Neural Networks [4.535489275919893]
我々は,新たな深層学習と従来の技術との関係について重要な観察を行う。
一致するフィルタリングは、特定のニューラルネットワークと正式に等価です。
提案するニューラルネットワークアーキテクチャがマッチングフィルタリングよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:07Z) - Fast accuracy estimation of deep learning based multi-class musical
source separation [79.10962538141445]
本稿では,ニューラルネットワークのトレーニングやチューニングを行うことなく,任意のデータセットにおける楽器の分離性を評価する手法を提案する。
理想的な比マスクを持つオラクルの原理に基づいて、我々の手法は最先端のディープラーニング手法の分離性能を推定するための優れたプロキシである。
論文 参考訳(メタデータ) (2020-10-19T13:05:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。