論文の概要: A neural network-supported two-stage algorithm for lightweight
dereverberation on hearing devices
- arxiv url: http://arxiv.org/abs/2204.02978v2
- Date: Wed, 31 May 2023 15:34:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 04:50:07.166468
- Title: A neural network-supported two-stage algorithm for lightweight
dereverberation on hearing devices
- Title(参考訳): ニューラルネット支援型2段階聴覚装置の軽量残響制御アルゴリズム
- Authors: Jean-Marie Lemercier, Joachim Thiemann, Raphael Koning and Timo
Gerkmann
- Abstract要約: 本稿では,2段階の軽量オンライン補聴器のオンライン補聴アルゴリズムについて述べる。
このアプローチは、マルチチャネルのマルチフレーム線形フィルタとシングルチャネルのシングルフレームポストフィルタを組み合わせる。
どちらのコンポーネントも、ディープニューラルネットワーク(DNN)によって提供されるパワースペクトル密度(PSD)の推定に依存している。
- 参考スコア(独自算出の注目度): 13.49645012479288
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A two-stage lightweight online dereverberation algorithm for hearing devices
is presented in this paper. The approach combines a multi-channel multi-frame
linear filter with a single-channel single-frame post-filter. Both components
rely on power spectral density (PSD) estimates provided by deep neural networks
(DNNs). By deriving new metrics analyzing the dereverberation performance in
various time ranges, we confirm that directly optimizing for a criterion at the
output of the multi-channel linear filtering stage results in a more efficient
dereverberation as compared to placing the criterion at the output of the DNN
to optimize the PSD estimation. More concretely, we show that training this
stage end-to-end helps further remove the reverberation in the range accessible
to the filter, thus increasing the \textit{early-to-moderate} reverberation
ratio. We argue and demonstrate that it can then be well combined with a
post-filtering stage to efficiently suppress the residual late reverberation,
thereby increasing the \textit{early-to-final} reverberation ratio. This
proposed two stage procedure is shown to be both very effective in terms of
dereverberation performance and computational demands, as compared to e.g.
recent state-of-the-art DNN approaches. Furthermore, the proposed two-stage
system can be adapted to the needs of different types of hearing-device users
by controlling the amount of reduction of early reflections.
- Abstract(参考訳): 本稿では,2段階の軽量オンライン補聴器の聴解アルゴリズムについて述べる。
このアプローチは、マルチチャネルマルチフレームリニアフィルタとシングルチャネルシングルフレームポストフィルタを組み合わせたものである。
どちらのコンポーネントも、ディープニューラルネットワーク(DNN)が提供するパワースペクトル密度(PSD)の推定に依存している。
様々な時間範囲でデバーバレーション性能を分析する新しい指標を導出することにより、マルチチャネル線形フィルタリングステージの出力における基準に対する直接最適化が、dnnの出力に基準を置き、psd推定を最適化するよりも効率的なデバーバレーションとなることを確認した。
より具体的には、この段階の終末訓練はフィルタにアクセスできる範囲の残響を更に除去し、従って \textit{early-to-moderate} 残響率を増加させることを示す。
その結果,残差残差残響を効果的に抑制するため,残差残差残響率を増加させることで,残差残余残響率と十分に組み合わせることができることを議論し,実証する。
この2段階の手順は、最近の最先端のDNN手法と比較して、デバーベーション性能と計算要求の両方において非常に効果的であることが示されている。
さらに,提案する2段階システムは,早期反射の低減量を制御することで,異なるタイプの聴覚機器ユーザのニーズに適応することができる。
関連論文リスト
- Run-Time Adaptation of Neural Beamforming for Robust Speech Dereverberation and Denoising [15.152748065111194]
本稿では,実環境におけるリアルタイム自動音声認識のための音声強調について述べる。
ノイズの多いエコー混合分光器とディープニューラルネットワーク(DNN)からクリーンドライ音声のマスクを推定し、ビームフォーミングに用いる拡張フィルタを算出する。
しかし、このような教師付きアプローチのパフォーマンスは、ミスマッチした条件下で大幅に劣化する。
論文 参考訳(メタデータ) (2024-10-30T08:32:47Z) - Low-rank extended Kalman filtering for online learning of neural
networks from streaming data [71.97861600347959]
非定常データストリームから非線形関数のパラメータを推定するための効率的なオンライン近似ベイズ推定アルゴリズムを提案する。
この方法は拡張カルマンフィルタ (EKF) に基づいているが、新しい低ランク+斜角行列分解法を用いている。
変分推論に基づく手法とは対照的に,本手法は完全に決定論的であり,ステップサイズチューニングを必要としない。
論文 参考訳(メタデータ) (2023-05-31T03:48:49Z) - Simple Pooling Front-ends For Efficient Audio Classification [56.59107110017436]
入力音声特徴量における時間的冗長性を排除することは,効率的な音声分類に有効な方法である可能性が示唆された。
本稿では、単純な非パラメトリックプーリング操作を用いて冗長な情報を削減する単純なプールフロントエンド(SimPFs)のファミリーを提案する。
SimPFは、市販オーディオニューラルネットワークの浮動小数点演算数の半数以上を削減できる。
論文 参考訳(メタデータ) (2022-10-03T14:00:41Z) - NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor
Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。
提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2021-09-02T17:54:31Z) - Neural Calibration for Scalable Beamforming in FDD Massive MIMO with
Implicit Channel Estimation [10.775558382613077]
チャネル推定とビームフォーミングは、周波数分割二重化(FDD)大規模マルチインプット多重出力(MIMO)システムにおいて重要な役割を果たす。
受信したアップリンクパイロットに応じて,基地局のビームフォーマを直接最適化する深層学習方式を提案する。
エンド・ツー・エンドの設計のスケーラビリティを向上させるために,ニューラルキャリブレーション法を提案する。
論文 参考訳(メタデータ) (2021-08-03T14:26:14Z) - Speaker Diarization using Two-pass Leave-One-Out Gaussian PLDA
Clustering of DNN Embeddings [9.826793576487736]
本稿では,クラスタリングと埋め込みを用いた話者ダイアリゼーションのためのシステムの2パスバージョンを提案する。
コールホームコーパスでは,タスク依存パラメータチューニングを使わずに,最初のエラー率を4%以下で達成する。
また,複数のダイアリゼーションタスクに対するロバストな単一ソリューションへの大きな進歩を示す。
論文 参考訳(メタデータ) (2021-04-06T12:52:55Z) - Exploiting Multiple Timescales in Hierarchical Echo State Networks [0.0]
エコー状態ネットワーク(ESN)は、線形出力重みのトレーニングのみを必要とする貯水池コンピューティングの強力な形態である。
ここでは,貯水池を2つの小さな貯水池に分割した階層型esnの時間スケールを考察する。
論文 参考訳(メタデータ) (2021-01-11T22:33:17Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z) - Temporal-Spatial Neural Filter: Direction Informed End-to-End
Multi-channel Target Speech Separation [66.46123655365113]
ターゲット音声分離とは、混合信号からターゲット話者の音声を抽出することを指す。
主な課題は、複雑な音響環境とリアルタイム処理の要件である。
複数話者混合から対象音声波形を直接推定する時間空間ニューラルフィルタを提案する。
論文 参考訳(メタデータ) (2020-01-02T11:12:50Z) - End-to-End Multi-Task Denoising for joint SDR and PESQ Optimization [43.15288441772729]
ネットワークの騒音は、ノイズの多い音声からマッピングを学習し、それらを直接掃除する。
既存のスキームにはスペクトルと計量ミスマッチの2つの重要な問題がある。
本稿では,SDRとPSSQ最適化を併用した新しいエンドツーエンドデノベーションフレームワークを提案する。
論文 参考訳(メタデータ) (2019-01-26T02:48:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。