Fugu-MT 論文翻訳(概要): Synthetic Wave-Geometric Impulse Responses for Improved Speech Dereverberation

論文の概要: Synthetic Wave-Geometric Impulse Responses for Improved Speech Dereverberation

arxiv url: http://arxiv.org/abs/2212.05360v1
Date: Sat, 10 Dec 2022 20:15:23 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-13 15:44:14.305275
Title: Synthetic Wave-Geometric Impulse Responses for Improved Speech Dereverberation
Title（参考訳）: 音声の残響改善のための合成波-幾何インパルス応答
Authors: Rohith Aralikatti, Zhenyu Tang, Dinesh Manocha
Abstract要約: 室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
参考スコア（独自算出の注目度）: 69.1351513309953
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present a novel approach to improve the performance of learning-based speech dereverberation using accurate synthetic datasets. Our approach is designed to recover the reverb-free signal from a reverberant speech signal. We show that accurately simulating the low-frequency components of Room Impulse Responses (RIRs) is important to achieving good dereverberation. We use the GWA dataset that consists of synthetic RIRs generated in a hybrid fashion: an accurate wave-based solver is used to simulate the lower frequencies and geometric ray tracing methods simulate the higher frequencies. We demonstrate that speech dereverberation models trained on hybrid synthetic RIRs outperform models trained on RIRs generated by prior geometric ray tracing methods on four real-world RIR datasets.
Abstract（参考訳）: 本稿では,正確な合成データセットを用いた学習に基づく発話の残響性向上のための新しい手法を提案する。本稿では,残響音声信号から残響のない信号を復元する手法を提案する。室内インパルス応答 (rirs) の低周波成分を正確にシミュレートすることは, 良好な収差を達成する上で重要である。我々は、合成RIRをハイブリッド方式で生成したGWAデータセットを用いて、より低い周波数をシミュレートする正確なウェーブベースソルバと、高い周波数をシミュレートする幾何的レイトレーシング手法を用いる。本研究では,4つの実世界のRIRデータセット上での幾何線トレーシング法により学習されたRIRに対して,ハイブリッド合成RIRで訓練された音声の残響モデルが,RIRで訓練されたモデルよりも優れていることを示す。

関連論文リスト

MB-RIRs: a Synthetic Room Impulse Response Dataset with Frequency-Dependent Absorption Coefficients [7.468132532398651]
従来の画像ソース方式(ISM)の靴箱RIR上に3つの機能を実装した。我々は、各RIRデータセットに対してDeepFilternet3モデルをトレーニングし、実RIRのテストセットの性能を評価する。
論文参考訳（メタデータ） (2025-07-13T19:00:26Z)
DiffusionRIR: Room Impulse Response Interpolation using Diffusion Models [16.92449230293275]
高品質なRIR推定は、仮想マイク、音源のローカライゼーション、拡張現実、データ拡張などのアプリケーションを駆動する。本研究は, 騒音拡散確率モデル(DDPM)を用いて, 室内の未測定箇所でRIRを推定することの課題に対処する。
論文参考訳（メタデータ） (2025-04-29T10:52:07Z)
SpINR: Neural Volumetric Reconstruction for FMCW Radars [0.15193212081459279]
本稿では、周波数変調連続波(FMCW)レーダデータを用いたボリューム再構成のための新しいフレームワークSpINRを紹介する。従来のバックプロジェクション手法や既存の学習ベースアプローチよりも,SpINRの方が優れていることを示す。
論文参考訳（メタデータ） (2025-03-30T04:44:57Z)
UltraRay: Full-Path Ray Tracing for Enhancing Realism in Ultrasound Simulation [43.433512581459176]
レイトレーシングアルゴリズムを用いてエコーデータを生成する新しい超音波シミュレーションパイプラインを提案する。先進的な超音波イメージングを再現するため,平面波イメージングに最適化されたレイエミッション方式を導入し,遅延とステアリング機能を取り入れた。提案手法であるUltraRayは,視覚的品質の向上だけでなく,シミュレーション画像のリアリズムの向上にも寄与する。
論文参考訳（メタデータ） (2025-01-10T10:07:41Z)
Model and Deep learning based Dynamic Range Compression Inversion [12.002024727237837]
DRCの反転は、元のダイナミクスを復元し、新しいミックスを生成したり、オーディオ信号の全体的な品質を改善するのに役立つ。 DRCインバージョンのためのニューラルネットワークを用いたモデルベースアプローチを提案する。その結果,提案手法の有効性とロバスト性について,いくつかの最先端手法と比較した。
論文参考訳（メタデータ） (2024-11-07T00:33:07Z)
Speech enhancement with frequency domain auto-regressive modeling [34.55703785405481]
遠距離実環境における音声アプリケーションは、残響によって破損した信号を扱うことが多い。本稿では,音声品質と自動音声認識(ASR)性能を向上させるために,音声認識の統一的枠組みを提案する。
論文参考訳（メタデータ） (2023-09-24T03:25:51Z)
Radio Generation Using Generative Adversarial Networks with An Unrolled Design [18.049453261384013]
無線生成のための新しいGANフレームワーク「Radio GAN」を開発した。 1つ目は、電波信号のサンプリング分布をモデル化することを目的としたサンプリングポイントに基づく学習である。 2つ目は、未学習のジェネレータ設計であり、予測された純粋な信号分布を前者として組み合わせることで、学習の難易度を大幅に低減することができる。
論文参考訳（メタデータ） (2023-06-24T07:47:22Z)
Boosting Fast and High-Quality Speech Synthesis with Linear Diffusion [85.54515118077825]
本稿では, 常微分方程式に基づく線形拡散モデル(LinDiff)を提案する。計算複雑性を低減するため、LinDiffでは、入力信号を小さなパッチに分割するパッチベースの処理アプローチを採用している。我々のモデルは、より高速な合成速度で自己回帰モデルに匹敵する品質の音声を合成することができる。
論文参考訳（メタデータ） (2023-06-09T07:02:43Z)
Machine learning for phase-resolved reconstruction of nonlinear ocean wave surface elevations from sparse remote sensing data [37.69303106863453]
ニューラルネットワークを用いた位相分解波面再構成のための新しい手法を提案する。提案手法は,一次元格子を用いた合成的かつ高精度な訓練データを利用する。
論文参考訳（メタデータ） (2023-05-18T12:30:26Z)
Towards Improved Room Impulse Response Estimation for Speech Recognition [53.04440557465013]
遠距離場自動音声認識(ASR)におけるブラインドルームインパルス応答(RIR)推定システムを提案する。まず、改良されたRIR推定と改善されたASR性能の関連性について、ニューラルネットワークを用いたRIR推定器の評価を行った。次に、残響音声からRIR特徴を符号化し、符号化された特徴からRIRを構成するGANベースのアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-11-08T00:40:27Z)
Few-Shot Audio-Visual Learning of Environment Acoustics [89.16560042178523]
室内インパルス応答 (RIR) 関数は、周囲の物理的環境がリスナーが聴く音をどう変換するかをキャプチャする。我々は、空間で観測された画像とエコーのスパースセットに基づいて、RIRを推測する方法を探る。 3次元環境のための最先端オーディオ視覚シミュレータを用いた実験において,本手法が任意のRIRを生成できることを実証した。
論文参考訳（メタデータ） (2022-06-08T16:38:24Z)
Deep Impulse Responses: Estimating and Parameterizing Filters with Deep Networks [76.830358429947]
高雑音および地中設定におけるインパルス応答推定は難しい問題である。本稿では,ニューラル表現学習の最近の進歩に基づいて,インパルス応答のパラメータ化と推定を行う新しいフレームワークを提案する。
論文参考訳（メタデータ） (2022-02-07T18:57:23Z)
FAST-RIR: Fast neural diffuse room impulse response generator [81.96114823691343]
本研究では, ニューラルネットワークを用いた高速拡散室インパルス応答生成器(FAST-RIR)について, 所定の音響環境に対して室インパルス応答(RIR)を生成する。我々のFAST-RIRは、平均誤差0.02sで与えられた入力残響時間に対してRIRを生成することができる。提案するバッチサイズ1のFAST-RIRは,CPU上の拡散音響シミュレータ(DAS)の400倍高速であることを示す。
論文参考訳（メタデータ） (2021-10-07T05:21:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。