論文の概要: Sound field reconstruction in rooms: inpainting meets super-resolution
- arxiv url: http://arxiv.org/abs/2001.11263v2
- Date: Thu, 6 Aug 2020 16:14:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 12:47:59.078450
- Title: Sound field reconstruction in rooms: inpainting meets super-resolution
- Title(参考訳): 室内の音場再構成--超高分解能の塗装
- Authors: Francesc Llu\'is, Pablo Mart\'inez-Nuevo, Martin Bo M{\o}ller, Sven
Ewan Shepstone
- Abstract要約: 音場再構成のためのディープラーニング手法を提案する。
この方法は、シミュレーションデータのみに基づいてトレーニングされた部分的畳み込みを備えたU-netのようなニューラルネットワークに基づいている。
実聴室でのシミュレーションデータと実験検証を併用した実験を行った。
- 参考スコア(独自算出の注目度): 1.0705399532413618
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, a deep-learning-based method for sound field reconstruction is
proposed. It is shown the possibility to reconstruct the magnitude of the sound
pressure in the frequency band 30-300 Hz for an entire room by using a very low
number of irregularly distributed microphones arbitrarily arranged. Moreover,
the approach is agnostic to the location of the measurements in the Euclidean
space. In particular, the presented approach uses a limited number of arbitrary
discrete measurements of the magnitude of the sound field pressure in order to
extrapolate this field to a higher-resolution grid of discrete points in space
with a low computational complexity. The method is based on a U-net-like neural
network with partial convolutions trained solely on simulated data, which
itself is constructed from numerical simulations of Green's function across
thousands of common rectangular rooms. Although extensible to three dimensions
and different room shapes, the method focuses on reconstructing a
two-dimensional plane of a rectangular room from measurements of the
three-dimensional sound field. Experiments using simulated data together with
an experimental validation in a real listening room are shown. The results
suggest a performance which may exceed conventional reconstruction techniques
for a low number of microphones and computational requirements.
- Abstract(参考訳): 本稿では,音場再構成のための深層学習手法を提案する。
部屋全体の周波数帯30〜300Hzの音圧を、任意に配置された非常に低数の不規則分布マイクロホンを用いて再構成することが可能である。
さらに、このアプローチはユークリッド空間における測定値の位置に依存しない。
特に,提案手法では,空間内の離散点の高分解能グリッドへの外挿のために,音場圧力の大きさの任意の離散的な測定値が限られている。
この方法は、シミュレーションデータのみに基づいてトレーニングされた部分畳み込みを持つU-netのようなニューラルネットワークに基づいている。
3次元と異なる部屋形状に拡張できるが、3次元音場の測定から矩形室内の2次元平面を再構成することに注力する。
実聴室における実験検証とともにシミュレーションデータを用いた実験を行った。
以上の結果から,マイクロホンの低容量化と計算要求に対する従来の再構成手法を超える性能が示唆された。
関連論文リスト
- N-BVH: Neural ray queries with bounding volume hierarchies [51.430495562430565]
3Dコンピュータグラフィックスでは、シーンのメモリ使用量の大部分がポリゴンとテクスチャによるものである。
N-BVHは3次元の任意の光線クエリに応答するように設計されたニューラル圧縮アーキテクチャである。
本手法は, 視認性, 深度, 外観特性を忠実に近似する。
論文 参考訳(メタデータ) (2024-05-25T13:54:34Z) - Room Transfer Function Reconstruction Using Complex-valued Neural Networks and Irregularly Distributed Microphones [15.396703290586418]
第1室共鳴の周波数範囲における室内伝達関数を推定するために,複素数値ニューラルネットワークを用いる。
複雑な数値のニューラルネットワークが部屋の移動関数を推定するために使われるのは、これが初めてである。
論文 参考訳(メタデータ) (2024-02-01T21:16:40Z) - Reconstruction of Sound Field through Diffusion Models [15.192190218332843]
室内の音場再構築は、音制御や拡張現実(AR)、仮想現実(VR)など、いくつかのアプリケーションにとって重要な課題である。
室内の音場の大きさを変調周波数域に着目して再構成するデータ駆動生成モデルを提案する。
本研究では,音場(SF-Diff)を拡張領域上に再構築するために訓練された条件付き拡散確率モデル(DDPM)を初めて導入する。
論文 参考訳(メタデータ) (2023-12-14T11:11:26Z) - Adaptive Shells for Efficient Neural Radiance Field Rendering [92.18962730460842]
本稿では, 表面および表面のレンダリングを円滑に遷移させるニューラル放射率の定式化を提案する。
我々の手法は、非常に高い忠実度で効率的なレンダリングを可能にする。
また,抽出したエンベロープは,アニメーションやシミュレーションなどの下流アプリケーションを可能にすることを示す。
論文 参考訳(メタデータ) (2023-11-16T18:58:55Z) - Generative adversarial networks with physical sound field priors [6.256923690998173]
本稿では,GANを用いた音場再構築のための深層学習に基づくアプローチを提案する。
提案手法は, 平面波ベースと室内圧力の統計的分布を用いて, 限られた数の測定値から音場を再構成する。
提案手法は, 音場再構成に有望な手法であることを示す。
論文 参考訳(メタデータ) (2023-08-01T10:11:23Z) - $PC^2$: Projection-Conditioned Point Cloud Diffusion for Single-Image 3D
Reconstruction [97.06927852165464]
単一のRGB画像から物体の3次元形状を再構築することは、コンピュータビジョンにおける長年の課題である。
条件付き偏光拡散プロセスによりスパース点雲を生成する単一像3次元再構成法を提案する。
論文 参考訳(メタデータ) (2023-02-21T13:37:07Z) - Score-based Diffusion Models in Function Space [140.792362459734]
拡散モデルは、最近、生成モデリングの強力なフレームワークとして登場した。
本稿では,関数空間における拡散モデルをトレーニングするためのDDO(Denoising Diffusion Operators)という,数学的に厳密なフレームワークを提案する。
データ解像度に依存しない固定コストで、対応する離散化アルゴリズムが正確なサンプルを生成することを示す。
論文 参考訳(メタデータ) (2023-02-14T23:50:53Z) - Super-resolution GANs of randomly-seeded fields [68.8204255655161]
ランダムスパースセンサからフィールド量の推定を行うための,GAN(Super- resolution Generative Adversarial Network)フレームワークを提案する。
このアルゴリズムはランダムサンプリングを利用して、高解像度の基底分布の不完全ビューを提供する。
提案手法は, 流体流動シミュレーション, 海洋表面温度分布測定, 粒子画像速度測定データの合成データベースを用いて検証した。
論文 参考訳(メタデータ) (2022-02-23T18:57:53Z) - Blind Room Parameter Estimation Using Multiple-Multichannel Speech
Recordings [37.145413836886455]
部屋の幾何学的パラメータや音響的パラメータを知ることは、オーディオ拡張現実、音声のデバーベレーション、音声法医学などの応用に有用である。
室内の総表面積,体積,および周波数依存残響時間と平均表面吸収を共同で推定する問題について検討した。
単一チャネルとチャネル間キューの両方を活用する新しい畳み込みニューラルネットワークアーキテクチャを提案し、大規模で現実的なシミュレーションデータセットでトレーニングする。
論文 参考訳(メタデータ) (2021-07-29T08:51:49Z) - Volume Rendering of Neural Implicit Surfaces [57.802056954935495]
本稿では,ニューラルボリュームレンダリングにおける幾何学的表現と再構成を改善することを目的とする。
体積密度を幾何学の関数としてモデル化することで実現する。
この新たな密度表現を挑戦的なシーンマルチビューデータセットに適用することで、高品質な幾何学的再構成を実現した。
論文 参考訳(メタデータ) (2021-06-22T20:23:16Z) - Deep Sound Field Reconstruction in Real Rooms: Introducing the ISOBEL
Sound Field Dataset [0.0]
本稿では,4つの実室から測定したデータセットを導入し,低周波音場復元の評価を拡張した。
本稿では,低音域マイクロホンを用いた近年の深層学習に基づく音場再構成法について述べる。
論文 参考訳(メタデータ) (2021-02-12T11:34:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。