論文の概要: Reciprocal Latent Fields for Precomputed Sound Propagation
- arxiv url: http://arxiv.org/abs/2602.06937v1
- Date: Fri, 06 Feb 2026 18:31:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.530176
- Title: Reciprocal Latent Fields for Precomputed Sound Propagation
- Title(参考訳): あらかじめ計算した音波伝搬のための相互潜伏場
- Authors: Hugo Seuté, Pranai Vasudev, Etienne Richan, Louis-Xavier Buffoni,
- Abstract要約: 本稿では、音響パラメータの符号化と予測のためのメモリ効率の高いフレームワークであるReciprocal Latent Fields (RLF)を紹介する。
RLFは、メモリフットプリントを桁違いに削減しつつ、複製品質を維持していることを示す。
- 参考スコア(独自算出の注目度): 0.6474760227870046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Realistic sound propagation is essential for immersion in a virtual scene, yet physically accurate wave-based simulations remain computationally prohibitive for real-time applications. Wave coding methods address this limitation by precomputing and compressing impulse responses of a given scene into a set of scalar acoustic parameters, which can reach unmanageable sizes in large environments with many source-receiver pairs. We introduce Reciprocal Latent Fields (RLF), a memory-efficient framework for encoding and predicting these acoustic parameters. The RLF framework employs a volumetric grid of trainable latent embeddings decoded with a symmetric function, ensuring acoustic reciprocity. We study a variety of decoders and show that leveraging Riemannian metric learning leads to a better reproduction of acoustic phenomena in complex scenes. Experimental validation demonstrates that RLF maintains replication quality while reducing the memory footprint by several orders of magnitude. Furthermore, a MUSHRA-like subjective listening test indicates that sound rendered via RLF is perceptually indistinguishable from ground-truth simulations.
- Abstract(参考訳): 仮想シーンでの没入には現実的な音波伝搬が不可欠であるが、物理的に正確な波動シミュレーションはリアルタイムアプリケーションでは計算が禁じられている。
ウェーブコーディング法は、与えられたシーンのインパルス応答をスカラー音響パラメータの集合にプリ計算し、圧縮することにより、この制限に対処する。
本稿では,これらの音響パラメータを符号化し,予測するためのメモリ効率の高いフレームワークであるReciprocal Latent Fields (RLF)を紹介する。
RLFフレームワークは、対称関数でデコードされた訓練可能な潜伏埋め込みの体積格子を用いて、音響的相互性を保証する。
我々は様々なデコーダを研究し、リーマン計量学習を活用することで複雑な場面における音響現象の再現性が向上することを示した。
RLFは、メモリフットプリントを桁違いに減らしながら、レプリケーション品質を維持している。
さらに,MUSHRAライクな主観的聴力テストでは,RLFによる音の知覚的識別が地中構造シミュレーションと区別できないことが示唆された。
関連論文リスト
- DOA Estimation with Lightweight Network on LLM-Aided Simulated Acoustic Scenes [46.0445214387366]
空間音響および音響信号処理において,方向推定(DOA)が重要である。
奥行き分離可能な畳み込みに基づく軽量なDOA推定モデルであるLightDOAを提案する。
実験結果から,LightDOAは様々な音響シーンで良好な精度とロバスト性が得られることがわかった。
論文 参考訳(メタデータ) (2025-11-11T09:15:06Z) - Wave-Based Semantic Memory with Resonance-Based Retrieval: A Phase-Aware Alternative to Vector Embedding Stores [51.56484100374058]
本稿では,波動パターン$psi(x) = A(x) eiphi(x)$として知識をモデル化し,共振に基づく干渉によってそれを検索する新しいフレームワークを提案する。
このアプローチは振幅情報と位相情報の両方を保存し、より表現的かつ堅牢な意味的類似性を実現する。
論文 参考訳(メタデータ) (2025-08-21T10:13:24Z) - Neural-Enhanced Dynamic Range Compression Inversion: A Hybrid Approach for Restoring Audio Dynamics [18.219015975713003]
ダイナミックレンジ圧縮(Dynamic Range Compression, DRC)は、音楽制作、放送、音声処理における信号力学を調節する効果である。
既存のDRCインバージョン手法は、キーパラメータを見渡すか、正確なパラメータ値に頼るかのいずれかであり、正確に見積もるのは困難である。
モデルベースDRCインバージョンとニューラルネットワークを組み合わせるハイブリッドアプローチを導入し、堅牢なDRCパラメータ推定とオーディオ復元を同時に実現する。
論文 参考訳(メタデータ) (2024-11-07T00:33:07Z) - Neural Acoustic Context Field: Rendering Realistic Room Impulse Response
With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。
RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。
実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文 参考訳(メタデータ) (2023-09-27T19:50:50Z) - Blind Acoustic Room Parameter Estimation Using Phase Features [4.473249957074495]
本稿では,新しい位相関連機能を活用して,近年のアプローチを拡張し,いわゆる「残響指紋」パラメータを盲目的に推定する。
これらの特徴の追加は、マグニチュードベースのスペクトル特徴のみに依存する既存の手法よりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-03-13T20:05:41Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z) - Deep Impulse Responses: Estimating and Parameterizing Filters with Deep
Networks [76.830358429947]
高雑音および地中設定におけるインパルス応答推定は難しい問題である。
本稿では,ニューラル表現学習の最近の進歩に基づいて,インパルス応答のパラメータ化と推定を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T18:57:23Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。