論文の概要: Mean absorption estimation from room impulse responses using virtually
supervised learning
- arxiv url: http://arxiv.org/abs/2109.00393v1
- Date: Wed, 1 Sep 2021 14:06:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 11:03:16.805263
- Title: Mean absorption estimation from room impulse responses using virtually
supervised learning
- Title(参考訳): 仮想教師付き学習による室内インパルス応答の平均吸収推定
- Authors: C\'edric Foy (UMRAE ), Antoine Deleforge (MULTISPEECH), Diego Di Carlo
(PANAMA)
- Abstract要約: 本稿では,室内インパルス応答(RIR)のみから平均吸収係数を推定する新しい手法を紹介し,検討する。
この逆問題は、仮想教師付き学習、すなわち、人工ニューラルネットワークを用いたシミュレーションデータセット上の回帰によって暗黙的に学習される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the context of building acoustics and the acoustic diagnosis of an
existing room, this paper introduces and investigates a new approach to
estimate mean absorption coefficients solely from a room impulse response
(RIR). This inverse problem is tackled via virtually-supervised learning,
namely, the RIR-to-absorption mapping is implicitly learned by regression on a
simulated dataset using artificial neural networks. We focus on simple models
based on well-understood architectures. The critical choices of geometric,
acoustic and simulation parameters used to train the models are extensively
discussed and studied, while keeping in mind conditions that are representative
of the field of building acoustics. Estimation errors from the learned neural
models are compared to those obtained with classical formulas that require
knowledge of the room's geometry and reverberation times. Extensive comparisons
made on a variety of simulated test sets highlight different conditions under
which the learned models can overcome the well-known limitations of the diffuse
sound field hypothesis underlying these formulas. Results obtained on real RIRs
measured in an acoustically configurable room show that at 1~kHz and above, the
proposed approach performs comparably to classical models when reverberation
times can be reliably estimated, and continues to work even when they cannot.
- Abstract(参考訳): そこで本研究では, 室内インパルス応答(RIR)のみから平均吸音率を推定する手法を新たに導入し, 検討した。
この逆問題は、仮想教師付き学習、すなわち、人工ニューラルネットワークを用いたシミュレーションデータセット上の回帰によって暗黙的に学習される。
私たちはよく理解されたアーキテクチャに基づいたシンプルなモデルにフォーカスします。
模型の訓練に使用する幾何学的・音響的・シミュレーション的パラメータの重要な選択は、建築音響学の分野の代表的条件を念頭に置きながら、広く議論され研究されている。
学習したニューラルモデルから推定誤差を、部屋の形状や残響時間に関する知識を必要とする古典式と比較する。
様々なシミュレートテストセットで行った広範囲な比較は、学習モデルがこれらの公式の基礎となる拡散音場仮説の既知の制限を克服できる様々な条件を浮き彫りにしている。
音響的に構成可能な室内で測定された実RIRで得られた結果から, 残響時間を確実に推定できる場合, 1〜kHz以上の場合において, 提案手法は古典モデルと相容れない性能を示し, 動作を継続する。
関連論文リスト
- Unsupervised Blind Joint Dereverberation and Room Acoustics Estimation with Diffusion Models [21.669363620480333]
BUDDyと呼ばれるブラインド・デバーベーションと室内インパルス応答推定の教師なし手法を提案する。
室内のインパルス応答が不明な視覚的シナリオでは、BUDDyは音声の発声に成功している。
一般化に苦しむ教師付き手法とは異なり、BUDDyは異なる音響条件にシームレスに適応する。
論文 参考訳(メタデータ) (2024-08-14T11:31:32Z) - Conditional score-based diffusion models for solving inverse problems in mechanics [6.319616423658121]
条件付きスコアベース拡散モデルを用いてベイズ推定を行う枠組みを提案する。
条件付きスコアベース拡散モデルは条件分布のスコア関数を近似する生成モデルである。
メカニクスにおける高次元逆問題に対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2024-06-19T02:09:15Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Neural Acoustic Context Field: Rendering Realistic Room Impulse Response
With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。
RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。
実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文 参考訳(メタデータ) (2023-09-27T19:50:50Z) - Bayesian inference and neural estimation of acoustic wave propagation [10.980762871305279]
本稿では,物理と機械学習を組み合わせて音響信号を解析する新しい枠組みを提案する。
この課題のために, スペクトル音響特性を推定するベイズ推定法, 前方および後方の物理的損失をニューラルネットワークに装備するニューラルネットワーク物理モデル, ベンチマークとして機能する非線形最小二乗法, の3つの手法が開発された。
このフレームワークの単純さと効率性は、シミュレーションデータ上で実証的に検証されている。
論文 参考訳(メタデータ) (2023-05-28T15:14:46Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z) - Posterior Coreset Construction with Kernelized Stein Discrepancy for
Model-Based Reinforcement Learning [78.30395044401321]
我々は、強化学習(MBRL)のための新しいモデルベースアプローチを開発する。
ターゲット遷移モデルの仮定を緩和し、混合モデルの一般的な族に属する。
連続的な制御環境では、壁時計の時間を最大50%削減することができる。
論文 参考訳(メタデータ) (2022-06-02T17:27:49Z) - Repeat after me: Self-supervised learning of acoustic-to-articulatory
mapping by vocal imitation [9.416401293559112]
そこで本稿では,限定的な解釈可能な音声パラメータ集合から複雑な音声刺激を再現可能な,事前学習されたニューラル音声合成器を組み合わせた音声生成の計算モデルを提案する。
フォワードモデルと逆モデルの両方は、異なる話者からの生の音響のみの音声データから、自己指導的な方法で共同で訓練される。
模倣シミュレーションは客観的かつ主観的に評価され、非常に奨励的なパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-04-05T15:02:49Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。