Fugu-MT 論文翻訳(概要): Materialistic RIR: Material Conditioned Realistic RIR Generation

論文の概要: Materialistic RIR: Material Conditioned Realistic RIR Generation

arxiv url: http://arxiv.org/abs/2604.21119v1
Date: Wed, 22 Apr 2026 22:04:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-24 14:40:06.197995
Title: Materialistic RIR: Material Conditioned Realistic RIR Generation
Title（参考訳）: 物質的RIR: 物質的条件付き現実的RIR生成
Authors: Mahnoor Fatima Saad, Sagnik Majumder, Kristen Grauman, Ziad Al-Halah,
Abstract要約: 本稿では,シーンにおける空間的および物質的手がかりの影響を明示的に解消する,材料制御型室内インパルス応答(RIR)生成手法を提案する。本手法は,シーンの空間的レイアウトの影響を捉えた空間的モジュールと,ユーザが指定した素材構成に従って空間的RIRを変調する物質的モジュールの2つのモジュールを用いて,RIRをモデル化する。
参考スコア（独自算出の注目度）: 53.5354731425141
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Rings like gold, thuds like wood! The sound we hear in a scene is shaped not only by the spatial layout of the environment but also by the materials of the objects and surfaces within it. For instance, a room with wooden walls will produce a different acoustic experience from a room with the same spatial layout but concrete walls. Accurately modeling these effects is essential for applications such as virtual reality, robotics, architectural design, and audio engineering. Yet, existing methods for acoustic modeling often entangle spatial and material influences in correlated representations, which limits user control and reduces the realism of the generated acoustics. In this work, we present a novel approach for material-controlled Room Impulse Response (RIR) generation that explicitly disentangles the effects of spatial and material cues in a scene. Our approach models the RIR using two modules: a spatial module that captures the influence of the spatial layout of the scene, and a material module that modulates this spatial RIR according to a user-specified material configuration. This explicitly disentangled design allows users to easily modify the material configuration of a scene and observe its impact on acoustics without altering the spatial structure or scene content. Our model provides significant improvements over prior approaches on both acoustic-based metrics (up to +16% on RTE) and material-based metrics (up to +70%). Furthermore, through a human perceptual study, we demonstrate the improved realism and material sensitivity of our model compared to the strongest baselines.
Abstract（参考訳）: 金のような指輪、木のようなぬいぐるみ! シーンで聞こえる音は、環境の空間的配置だけでなく、内部の物体や表面の素材によっても形作られます。例えば、木製の壁のある部屋は、同じ空間配置を持つがコンクリート壁を持つ部屋から異なる音響体験をもたらす。これらの効果を正確にモデル化することは、仮想現実、ロボット工学、建築設計、オーディオ工学といった応用に不可欠である。しかし,既存の音響モデリング手法では,ユーザの制御を制限し,生成した音響の現実性を低下させる相関表現において,空間的・物質的影響が絡み合うことがしばしばある。本研究では,シーンにおける空間的および物質的手がかりの影響を明示的に解消する,材料制御された室内インパルス応答(RIR)生成のための新しいアプローチを提案する。本手法では,シーンの空間的レイアウトの影響を捉えた空間的モジュールと,ユーザが指定した素材構成に従って空間的RIRを変調する物質的モジュールの2つのモジュールを用いて,RIRをモデル化する。これにより、空間構造やシーン内容を変更することなく、シーンの素材構成を容易に変更し、音響への影響を観察することができる。本モデルでは, 従来手法に比べて, 音響的指標(RTEで最大+16%) と材料的指標(最大70%) の両方において, 大幅に改善されている。さらに,人間の知覚研究を通じて,最強のベースラインと比較して,モデルの性能向上と物質感受性を実証した。

関連論文リスト

Enhancing XR Auditory Realism via Multimodal Scene-Aware Acoustic Rendering [5.528622598353137]
物理的環境に動的に適応して空間的に正確な音を描画する新しいオンデバイスシステムであるSAMOSAを紹介する。 SAMOSAは、室内形状、表面材料、意味駆動音響コンテキストのリアルタイム推定を融合することにより、相乗的マルチモーダルシーン表現を利用する。このリッチな表現により、シーン先行による効率的な音響キャリブレーションが可能になり、システムは非常にリアルなRoom Impulse Response(RIR)を合成できる。
論文参考訳（メタデータ） (2025-11-14T23:13:02Z)
How Would It Sound? Material-Controlled Multimodal Acoustic Profile Generation for Indoor Scenes [16.57879794516524]
材料制御音響プロファイル生成の課題について紹介する。目標は,ユーザ定義の材料構成に基づいて,推定時にターゲット音響プロファイルを生成することである。本課題は,映像観察からシーンのキー特性を符号化する,新しいエンコーダ・デコーダアプローチを用いて解決する。提案手法は材料情報を効果的に符号化し,高忠実度RIRを生成する。
論文参考訳（メタデータ） (2025-08-04T21:11:26Z)
Hearing Anything Anywhere [26.415266601469767]
DiffRIRは,シーンの音響特性を解釈可能なパラメトリックモデルで表現可能なRIRレンダリングフレームワークである。これにより、任意のソースオーディオを用いて、空間を通して新しい聴覚体験を合成することができる。我々のモデルは、モノラルなRIRや音楽のレンダリングにおいて、最先端のベースラインよりも優れています。
論文参考訳（メタデータ） (2024-06-11T17:56:14Z)
ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling [57.1025908604556]
環境音響モデルは、室内環境の物理的特性によって音がどのように変換されるかを表す。本研究では,非マップ環境の環境音響モデルを効率的に構築する新しい課題であるアクティブ音響サンプリングを提案する。我々は,音声・視覚センサストリームからの情報を利用してエージェントナビゲーションを誘導し,最適な音響データサンプリング位置を決定する強化学習ポリシーであるActiveRIRを紹介する。
論文参考訳（メタデータ） (2024-04-24T21:30:01Z)
Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。 RAFは密集した室内音響データを提供する最初のデータセットである。
論文参考訳（メタデータ） (2024-03-27T17:59:56Z)
Neural Acoustic Context Field: Rendering Realistic Room Impulse Response With Neural Fields [61.07542274267568]
このレターでは、音声シーンをパラメータ化するためのNACFと呼ばれる新しいニューラルネットワークコンテキストフィールドアプローチを提案する。 RIRのユニークな性質により、時間相関モジュールとマルチスケールエネルギー崩壊基準を設計する。実験の結果,NACFは既存のフィールドベース手法よりも顕著なマージンで優れていた。
論文参考訳（メタデータ） (2023-09-27T19:50:50Z)
Few-Shot Audio-Visual Learning of Environment Acoustics [89.16560042178523]
室内インパルス応答 (RIR) 関数は、周囲の物理的環境がリスナーが聴く音をどう変換するかをキャプチャする。我々は、空間で観測された画像とエコーのスパースセットに基づいて、RIRを推測する方法を探る。 3次元環境のための最先端オーディオ視覚シミュレータを用いた実験において,本手法が任意のRIRを生成できることを実証した。
論文参考訳（メタデータ） (2022-06-08T16:38:24Z)
How to See Hidden Patterns in Metamaterials with Interpretable Machine Learning [82.67551367327634]
我々は,材料単位セルのパターンを見つけるための,解釈可能な多分解能機械学習フレームワークを開発した。具体的には、形状周波数特徴と単位セルテンプレートと呼ばれるメタマテリアルの2つの新しい解釈可能な表現を提案する。
論文参考訳（メタデータ） (2021-11-10T21:19:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。