Fugu-MT 論文翻訳(概要): RGI-Net: 3D Room Geometry Inference from Room Impulse Responses in the Absence of First-order Echoes

論文の概要: RGI-Net: 3D Room Geometry Inference from Room Impulse Responses in the Absence of First-order Echoes

arxiv url: http://arxiv.org/abs/2309.01513v1
Date: Mon, 4 Sep 2023 10:45:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-06 19:03:51.657104
Title: RGI-Net: 3D Room Geometry Inference from Room Impulse Responses in the Absence of First-order Echoes
Title（参考訳）: rgi-net: 1次エコーのない部屋インパルス応答からの3次元室内形状推定
Authors: Inmo Yeon and Jung-Woo Choi
Abstract要約: 本稿では,壁数に関する事前の知識を必要とせずに部屋のジオメトリを推定できるディープニューラルネットワーク(DNN, RGI-Net)を導入する。 RGI-Netには、壁の確率を別々に評価する評価ネットワークが含まれており、壁の数に関する事前の知識なしに幾何学的推論が可能である。
参考スコア（独自算出の注目度）: 5.1308092683559225
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Room geometry is important prior information for implementing realistic 3D audio rendering. For this reason, various room geometry inference (RGI) methods have been developed by utilizing the time of arrival (TOA) or time difference of arrival (TDOA) information in room impulse responses. However, the conventional RGI technique poses several assumptions, such as convex room shapes, the number of walls known in priori, and the visibility of first-order reflections. In this work, we introduce the deep neural network (DNN), RGI-Net, which can estimate room geometries without the aforementioned assumptions. RGI-Net learns and exploits complex relationships between high-order reflections in room impulse responses (RIRs) and, thus, can estimate room shapes even when the shape is non-convex or first-order reflections are missing in the RIRs. The network takes RIRs measured from a compact audio device equipped with a circular microphone array and a single loudspeaker, which greatly improves its practical applicability. RGI-Net includes the evaluation network that separately evaluates the presence probability of walls, so the geometry inference is possible without prior knowledge of the number of walls.
Abstract（参考訳）: 室内形状はリアルな3Dオーディオレンダリングを実装する上で重要な事前情報である。このため, 室内インパルス応答における到着時刻(TOA)や到着時刻差(TDOA)情報を利用して, 様々な室内形状推定法(RGI)が開発されている。しかし,従来のrgi手法では,凸室形状,壁面の数,一階反射の視認性など,いくつかの仮定がなされている。本研究では,上記の仮定を使わずに部屋のジオメトリを推定できるディープニューラルネットワーク(DNN)RGI-Netを導入する。 RGI-Netは、室内インパルス応答(RIR)における高次反射の複雑な関係を学習し、利用することにより、RIRに不凸や一階反射が欠落している場合でも、室内形状を推定することができる。このネットワークは、円形マイクアレイと1つのスピーカを備えた小型オーディオ装置からRIRを計測し、実用性を大幅に向上させる。 RGI-Netは、壁の存在確率を別々に評価する評価ネットワークを含んでおり、壁の数について事前の知識なしに幾何学的推論が可能である。

関連論文リスト

Reflections Unlock: Geometry-Aware Reflection Disentanglement in 3D Gaussian Splatting for Photorealistic Scenes Rendering [51.223347330075576]
Ref-Unlockは3Dガウススプラッティングをベースとした新しい幾何認識反射モデリングフレームワークである。提案手法では、高次球面高調波を用いた二重分岐表現を用いて、高周波反射の詳細を捉える。そこで本手法は,反射シーンのリアルなレンダリングのための効率的で一般化可能なソリューションを提供する。
論文参考訳（メタデータ） (2025-07-08T15:45:08Z)
GS-2DGS: Geometrically Supervised 2DGS for Reflective Object Reconstruction [51.99776072246151]
2次元ガウス散乱(2DGS)に基づく反射物体に対するGS-2DGSと呼ばれる新しい再構成法を提案する。合成および実データを用いた実験結果から,本手法はガウスの手法を再現・啓蒙の面で著しく上回っていることが示された。
論文参考訳（メタデータ） (2025-06-16T05:40:16Z)
LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning [75.9814389360821]
層状光線交差(LaRI)は、1つの画像から未知の幾何学的推論を行う新しい方法である。コンパクトで階層的な表現から恩恵を受けることで、LaRIは完全で効率的でビュー整合な幾何学的推論を可能にする。 3Dオブジェクトやシーンを含む、合成および実世界のデータのための完全なトレーニングデータ生成パイプラインを構築します。
論文参考訳（メタデータ） (2025-04-25T15:31:29Z)
NeRFPrior: Learning Neural Radiance Field as a Prior for Indoor Scene Reconstruction [46.776602829615115]
我々は,ニューラルラジアンス場を符号付き距離場を学習するための先行として採用したNeRFPriorを提案する。われわれのNeRFは、幾何学的手がかりと色覚的手がかりの両方を提供することができる。
論文参考訳（メタデータ） (2025-03-24T05:48:59Z)
PBR-NeRF: Inverse Rendering with Physics-Based Neural Fields [49.6405458373509]
シーン形状,材料,照明を共同で推定できる逆レンダリング(IR)モデルを提案する。本手法は, 材料推定を必要とする他の逆レンダリングおよび3次元再構成フレームワークに容易に適用可能である。
論文参考訳（メタデータ） (2024-12-12T19:00:21Z)
Self-training Room Layout Estimation via Geometry-aware Ray-casting [27.906107629563852]
本研究では,未表示のシーンにおける室内レイアウト推定モデルのための幾何学的自己学習フレームワークを提案する。提案手法では,異なる視点からの複数の推定値の集計にレイキャストの定式化を用いる。
論文参考訳（メタデータ） (2024-07-21T03:25:55Z)
InfoNorm: Mutual Information Shaping of Normals for Sparse-View Reconstruction [15.900375207144759]
多視点画像からの3次元表面再構成はシーン理解とインタラクションに不可欠である。ニューラルレージアンス場(NeRF)や符号付き距離関数(SDF)といった近年の暗黙的な表面表現は、観測情報の欠如を解決するために様々な幾何学的先行法を用いている。本稿では,高度に相関したシーンポイントの表面正規化における相互情報を明確に促進することにより,幾何学的モデリングの正規化を提案する。
論文参考訳（メタデータ） (2024-07-17T15:46:25Z)
DoubleTake: Geometry Guided Depth Estimation [17.464549832122714]
RGB画像の列から深度を推定することは、基本的なコンピュータビジョンタスクである。本稿では,現在のカメラ位置から深度マップとして描画された,ボリューム特徴と先行幾何学のヒントを組み合わせた再構成手法を提案する。本手法は, オフライン・インクリメンタルな評価シナリオにおいて, 対話的な速度, 最先端の深度推定, および3次元シーンで動作可能であることを示す。
論文参考訳（メタデータ） (2024-06-26T14:29:05Z)
UniSDF: Unifying Neural Representations for High-Fidelity 3D Reconstruction of Complex Scenes with Reflections [92.38975002642455]
大規模な複雑なシーンをリフレクションで再構成できる汎用3次元再構成手法UniSDFを提案する。提案手法は,複雑な大規模シーンを細部と反射面で頑健に再構築することができる。
論文参考訳（メタデータ） (2023-12-20T18:59:42Z)
U-RED: Unsupervised 3D Shape Retrieval and Deformation for Partial Point Clouds [84.32525852378525]
教師なし形状検索および変形パイプラインであるU-REDを提案する。任意のオブジェクトの観察を入力として受け取り、通常RGBの画像やスキャンによってキャプチャされ、幾何学的に類似したCADモデルを共同で検索して変形する。我々は,U-REDが既存の最先端アプローチを47.3%,16.7%,31.6%で上回っていることを示す。
論文参考訳（メタデータ） (2023-08-11T20:56:05Z)
Shape, Pose, and Appearance from a Single Image via Bootstrapped Radiance Field Inversion [54.151979979158085]
提案手法では,自然画像に対する基本的エンドツーエンド再構築フレームワークを導入し,正確な地平のポーズが得られない。そこで,モデルが解の第一の推算を生成するハイブリッド・インバージョン・スキームを適用する。当社のフレームワークでは,イメージを10ステップでデレンダリングすることが可能で,現実的なシナリオで使用することが可能です。
論文参考訳（メタデータ） (2022-11-21T17:42:42Z)
Towards High-Fidelity Single-view Holistic Reconstruction of Indoor Scenes [50.317223783035075]
単視点画像から総合的な3次元屋内シーンを再構築するための新しい枠組みを提案する。詳細なオブジェクト再構成のためのインスタンス整列型暗黙関数(InstPIFu)を提案する。私たちのコードとモデルは公開されます。
論文参考訳（メタデータ） (2022-07-18T14:54:57Z)
SNeS: Learning Probably Symmetric Neural Surfaces from Incomplete Data [77.53134858717728]
我々はニューラルレイディアンスフィールド(NeRF)のようなニューラルリコンストラクションとレンダリングの最近の進歩の強みの上に構築する。我々は3次元形状と材料特性にソフト対称性の制約を適用し,光,アルベド色,反射率に分解された外観を有する。保存されていない領域を高い忠実度で再構成し、高品質な新しいビュー画像を作成することができることを示す。
論文参考訳（メタデータ） (2022-06-13T17:37:50Z)
NeRFactor: Neural Factorization of Shape and Reflectance Under an Unknown Illumination [60.89737319987051]
照明条件が不明な物体の多視点像から物体の形状と空間的反射率を復元する問題に対処する。これにより、任意の環境照明下でのオブジェクトの新たなビューのレンダリングや、オブジェクトの材料特性の編集が可能になる。
論文参考訳（メタデータ） (2021-06-03T16:18:01Z)
Learning to Reconstruct 3D Non-Cuboid Room Layout from a Single RGB Image [32.5277483805739]
単一画像から部屋の囲い3次元構造を再構築することを目的としている。本稿では,室内のより一般的な仮定,すなわち1つの天井,1つの床,2つの垂直壁からなる部屋配置について考察する。
論文参考訳（メタデータ） (2021-04-16T09:24:08Z)
Learning to Detect 3D Reflection Symmetry for Single-View Reconstruction [32.14605731030579]
単一のRGB画像からの3D再構成は、コンピュータビジョンにおいて難しい問題である。従来の手法は通常データ駆動であり、不正確な3次元形状の復元と限定的な一般化能力をもたらす。本稿では,人造物体によく見られる反射対称性の鏡面を初めて検出し,その対称性の画素内対応を見いだして深度マップを予測する。
論文参考訳（メタデータ） (2020-06-17T17:58:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。