論文の概要: A DNN based Normalized Time-frequency Weighted Criterion for Robust
Wideband DoA Estimation
- arxiv url: http://arxiv.org/abs/2302.10147v1
- Date: Mon, 20 Feb 2023 18:26:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 14:38:59.595316
- Title: A DNN based Normalized Time-frequency Weighted Criterion for Robust
Wideband DoA Estimation
- Title(参考訳): 広帯域DoA推定のためのDNNに基づく正規化時間周波数重み付き基準
- Authors: Kuan-Lin Chen and Ching-Hua Lee and Bhaskar D. Rao and Harinath
Garudadri
- Abstract要約: 本稿では、T-F領域における候補ステアリングベクトルとフィルタスナップショットとの距離を最小化する正規化時間周波数重み付き基準を提案する。
本手法では固有分解を必要とせず,ノイズスナップショットによる最適化目標の誤認を防止するため,単純な正規化を用いる。
実験により,提案手法は,雑音および残響環境において広く用いられている部分空間法を含む,一般的なDNNに基づくDoA推定法よりも優れていた。
- 参考スコア(独自算出の注目度): 24.175086158375464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks (DNNs) have greatly benefited direction of arrival (DoA)
estimation methods for speech source localization in noisy environments.
However, their localization accuracy is still far from satisfactory due to the
vulnerability to nonspeech interference. To improve the robustness against
interference, we propose a DNN based normalized time-frequency (T-F) weighted
criterion which minimizes the distance between the candidate steering vectors
and the filtered snapshots in the T-F domain. Our method requires no
eigendecomposition and uses a simple normalization to prevent the optimization
objective from being misled by noisy filtered snapshots. We also study
different designs of T-F weights guided by a DNN. We find that duplicating the
Hadamard product of speech ratio masks is highly effective and better than
other techniques such as direct masking and taking the mean in the proposed
approach. However, the best-performing design of T-F weights is
criterion-dependent in general. Experiments show that the proposed method
outperforms popular DNN based DoA estimation methods including widely used
subspace methods in noisy and reverberant environments.
- Abstract(参考訳): ディープニューラルネットワーク (DNN) は, 雑音環境下での音源定位のための到着方向推定法 (DoA) に大きく貢献している。
しかし,その位置推定精度は,非スパイチ干渉による脆弱性のため,まだ十分ではない。
干渉に対するロバスト性を改善するため,T-F領域における候補ステアリングベクトルとフィルタスナップショットとの距離を最小化するDNNベースの正規化時間周波数重み付き基準を提案する。
本手法は, 固有分解を必要とせず, 単純な正規化を用いて, ノイズの多いフィルタ付きスナップショットによる最適化目標の誤認を防止する。
また、DNNでガイドされるT-F重みの異なる設計についても検討する。
音声比マスクのアダマール積の重複は, 直接マスキングや提案手法における平均化など, 他の手法よりも効果的かつ良好であることがわかった。
しかし、t-f重みの最も優れた設計は概して基準依存である。
実験により,提案手法は,雑音および残響環境において広く用いられている部分空間法を含む,一般的なDNNに基づくDoA推定法よりも優れていた。
関連論文リスト
- Run-Time Adaptation of Neural Beamforming for Robust Speech Dereverberation and Denoising [15.152748065111194]
本稿では,実環境におけるリアルタイム自動音声認識のための音声強調について述べる。
ノイズの多いエコー混合分光器とディープニューラルネットワーク(DNN)からクリーンドライ音声のマスクを推定し、ビームフォーミングに用いる拡張フィルタを算出する。
しかし、このような教師付きアプローチのパフォーマンスは、ミスマッチした条件下で大幅に劣化する。
論文 参考訳(メタデータ) (2024-10-30T08:32:47Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Domain Generalization Guided by Gradient Signal to Noise Ratio of
Parameters [69.24377241408851]
ソースドメインへのオーバーフィッティングは、ディープニューラルネットワークの勾配に基づくトレーニングにおいて一般的な問題である。
本稿では,ネットワークパラメータの勾配-信号-雑音比(GSNR)を選択することを提案する。
論文 参考訳(メタデータ) (2023-10-11T10:21:34Z) - One-Dimensional Deep Image Prior for Curve Fitting of S-Parameters from
Electromagnetic Solvers [57.441926088870325]
Deep Image Prior(ディープ・イメージ・プライオリ、ディープ・イメージ・プライオリ、DIP)は、ランダムなd畳み込みニューラルネットワークの重みを最適化し、ノイズや過度な測定値からの信号に適合させる技術である。
本稿では,Vector Fitting (VF) の実装に対して,ほぼすべてのテスト例において優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-06T20:28:37Z) - Noise Injection Node Regularization for Robust Learning [0.0]
ノイズインジェクションノード規則化(NINR)は、トレーニング期間中に、構造化されたノイズをディープニューラルネットワーク(DNN)に注入する手法である。
本研究は、NINRの下で訓練されたフィードフォワードDNNに対する各種試験データ摂動に対するロバスト性を大幅に改善する理論的および実証的な証拠を示す。
論文 参考訳(メタデータ) (2022-10-27T20:51:15Z) - Mixture GAN For Modulation Classification Resiliency Against Adversarial
Attacks [55.92475932732775]
本稿では,GANをベースとした新たな生成逆ネットワーク(Generative Adversarial Network, GAN)を提案する。
GANベースの目的は、DNNベースの分類器に入力する前に、敵の攻撃例を排除することである。
シミュレーションの結果,DNNをベースとしたAMCの精度が約81%に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-29T22:30:32Z) - Neural Network-augmented Kalman Filtering for Robust Online Speech
Dereverberation in Noisy Reverberant Environments [13.49645012479288]
ノイズローバストオンラインデバーベレーションのためのニューラルネットワーク拡張アルゴリズムを提案する。
提示されたフレームワークは、単一チャネルのノイズの多い残響データセット上で堅牢なデバーベレーションを可能にする。
論文 参考訳(メタデータ) (2022-04-06T11:38:04Z) - Time-Domain Mapping Based Single-Channel Speech Separation With
Hierarchical Constraint Training [10.883458728718047]
複数話者音声認識には単一チャンネル音声分離が必要である。
時間領域音声分離網(TasNet)に着目した最近の深層学習に基づくアプローチ
音声分離用混合物からクリーンソースを直接近似する注意増強型DPRNN(AttnAugDPRNN)を導入する。
論文 参考訳(メタデータ) (2021-10-20T14:42:50Z) - Using Kalman Filter The Right Way: Noise Estimation Is Not Optimal [46.556605821252276]
kfの仮定を少しでも破っても、効果のあるノイズを著しく修正できることを示す。
KFの対称および正定値(SPD)パラメータに勾配に基づく最適化を効率的に適用する方法を提案する。
論文 参考訳(メタデータ) (2021-04-06T08:59:15Z) - Positive-Negative Momentum: Manipulating Stochastic Gradient Noise to
Improve Generalization [89.7882166459412]
勾配雑音(SGN)は、ディープラーニングの暗黙の正規化として機能する。
深層学習を改善するためにランダムノイズを注入してSGNを人工的にシミュレートしようとした作品もある。
低計算コストでSGNをシミュレーションし、学習率やバッチサイズを変更することなく、PNM(Positive-Negative Momentum)アプローチを提案する。
論文 参考訳(メタデータ) (2021-03-31T16:08:06Z) - Deep Networks for Direction-of-Arrival Estimation in Low SNR [89.45026632977456]
我々は,真の配列多様体行列の変異チャネルデータから学習した畳み込みニューラルネットワーク(CNN)を導入する。
我々は低SNR体制でCNNを訓練し、すべてのSNRでDoAを予測する。
私たちの堅牢なソリューションは、ワイヤレスアレイセンサーから音響マイクロフォンやソナーまで、いくつかの分野に適用できます。
論文 参考訳(メタデータ) (2020-11-17T12:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。