論文の概要: Windowed-FourierMixer: Enhancing Clutter-Free Room Modeling with Fourier
Transform
- arxiv url: http://arxiv.org/abs/2402.18287v1
- Date: Wed, 28 Feb 2024 12:27:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-29 15:07:05.054509
- Title: Windowed-FourierMixer: Enhancing Clutter-Free Room Modeling with Fourier
Transform
- Title(参考訳): Windowed-FourierMixer:フーリエ変換によるクラッタフリールームモデリングの強化
- Authors: Bruno Henriques, Benjamin Allaert, Jean-Philippe Vandeborre
- Abstract要約: 室内空間の内部構造をモデル化する上で,単一画像からの室内環境の塗布が重要な役割を担っている。
我々はU-Formerアーキテクチャと新しいWindowed-FourierMixerブロックに基づく革新的なアプローチを提案する。
この新たなアーキテクチャは、対称性が普及する屋内シーンに関わるタスクに有利であることが証明されている。
- 参考スコア(独自算出の注目度): 3.864321514889099
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the growing demand for immersive digital applications, the need to
understand and reconstruct 3D scenes has significantly increased. In this
context, inpainting indoor environments from a single image plays a crucial
role in modeling the internal structure of interior spaces as it enables the
creation of textured and clutter-free reconstructions. While recent methods
have shown significant progress in room modeling, they rely on constraining
layout estimators to guide the reconstruction process. These methods are highly
dependent on the performance of the structure estimator and its generative
ability in heavily occluded environments. In response to these issues, we
propose an innovative approach based on a U-Former architecture and a new
Windowed-FourierMixer block, resulting in a unified, single-phase network
capable of effectively handle human-made periodic structures such as indoor
spaces. This new architecture proves advantageous for tasks involving indoor
scenes where symmetry is prevalent, allowing the model to effectively capture
features such as horizon/ceiling height lines and cuboid-shaped rooms.
Experiments show the proposed approach outperforms current state-of-the-art
methods on the Structured3D dataset demonstrating superior performance in both
quantitative metrics and qualitative results. Code and models will be made
publicly available.
- Abstract(参考訳): 没入型デジタルアプリケーションへの需要が高まり、3dシーンの理解と再構築の必要性が大幅に高まっている。
この文脈では、内部空間の内部構造をモデル化する上で、1枚の画像から室内環境を塗布することが重要な役割を担っている。
近年の手法は部屋のモデリングにおいて顕著な進歩を見せているものの,再構築プロセスの指導にはレイアウト推定器の制約に頼っている。
これらの手法は、構造推定器の性能と、密集した環境におけるその生成能力に大きく依存する。
そこで,本稿では,u-formerアーキテクチャと新しいwindowed-fouriermixerブロックを用いた革新的なアプローチを提案する。
この新たなアーキテクチャは、対称性が普及している屋内シーンに関わるタスクに有利であることが証明され、水平線やシーリングの高さ線やキュービド型の部屋といった特徴を効果的に捉えることができる。
提案手法は, 定量的指標と質的結果の両方において, 優れた性能を示す構造化3dデータセットにおいて, 最先端の手法よりも優れていることを示す。
コードとモデルは公開される予定だ。
関連論文リスト
- DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - Exploiting Semantic Scene Reconstruction for Estimating Building Envelope Characteristics [6.382787013075262]
2次元画像入力から幾何構造特性を推定する新しいフレームワークであるBuildNet3Dを提案する。
本フレームワークは, 窓面間比と建物のフットプリントの推定において, 高い精度と一般化性を示すとともに, 様々な複雑な建築物構造について評価する。
論文 参考訳(メタデータ) (2024-10-29T13:29:01Z) - Exploring the design space of deep-learning-based weather forecasting systems [56.129148006412855]
本稿では,異なる設計選択がディープラーニングに基づく天気予報システムに与える影響を系統的に分析する。
UNet、完全畳み込みアーキテクチャ、トランスフォーマーベースモデルなどの固定グリッドアーキテクチャについて検討する。
固定グリッドモデルの強靭な性能とグリッド不変アーキテクチャの柔軟性を組み合わせたハイブリッドシステムを提案する。
論文 参考訳(メタデータ) (2024-10-09T22:25:50Z) - VoxNeRF: Bridging Voxel Representation and Neural Radiance Fields for
Enhanced Indoor View Synthesis [51.49008959209671]
本稿では,室内ビュー合成の品質と効率を高めるために,ボリューム表現を活用する新しいアプローチであるVoxNeRFを紹介する。
我々は,空間的特徴を適応的に捉えるためにマルチレゾリューション・ハッシュ・グリッドを使用し,室内シーンの閉塞や複雑な形状を効果的に管理する。
我々は,3つの屋内データセットに対するアプローチを検証するとともに,VoxNeRFが最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2023-11-09T11:32:49Z) - Human as Points: Explicit Point-based 3D Human Reconstruction from
Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。
提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。
我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文 参考訳(メタデータ) (2023-11-06T05:52:29Z) - Exploiting Multiple Priors for Neural 3D Indoor Reconstruction [15.282699095607594]
本研究では,大規模屋内環境の再現性を向上するために,複数の正規化戦略を活用するニューラル暗黙的モデリング手法を提案する。
実験結果から,本手法は屋内の挑戦的なシナリオにおいて最先端の3D再構成を実現することが示唆された。
論文 参考訳(メタデータ) (2023-09-13T15:23:43Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z) - Reconstructing Compact Building Models from Point Clouds Using Deep
Implicit Fields [4.683612295430956]
我々は点雲からコンパクトで水密な多角形建築モデルを再構築するための新しい枠組みを提案する。
合成および実世界の点雲の両方の実験により、我々の神経誘導戦略により、高品質な建築モデルは、忠実性、コンパクト性、計算効率において大きな利点をもって得られることが実証された。
論文 参考訳(メタデータ) (2021-12-24T21:32:32Z) - PanoDR: Spherical Panorama Diminished Reality for Indoor Scenes [0.0]
Diminished Reality (DR)は、シーン内の既存のオブジェクトを削除するために、そのようなアプリケーションの要件を満たす。
屋内(再)計画アプリケーションにおける「現実」の保存には,シーンの構造保存が不可欠である。
本研究では,まず屋内シーンの構造を予測するモデルを提案し,そのモデルを用いて,同じシーンの空の背景のみを再現する手法を提案する。
論文 参考訳(メタデータ) (2021-06-01T12:56:53Z) - Enhanced 3D Human Pose Estimation from Videos by using Attention-Based
Neural Network with Dilated Convolutions [12.900524511984798]
従来のネットワークや制約の形式が、どのように注意の枠組みに組み込むことができるのかを体系的な設計で示します。
拡張畳み込みのマルチスケール構造により,時間受容場を適応させることにより,これを実現する。
提案手法は,Human3.6Mデータセット上での関節位置誤差の平均を33.4mmに減らし,最先端性能を達成し,既存の手法よりも優れる。
論文 参考訳(メタデータ) (2021-03-04T17:26:51Z) - S2RMs: Spatially Structured Recurrent Modules [105.0377129434636]
モジュール構造とテンポラル構造の両方を同時に活用できる動的構造を利用するための一歩を踏み出します。
我々のモデルは利用可能なビューの数に対して堅牢であり、追加のトレーニングなしで新しいタスクに一般化できる。
論文 参考訳(メタデータ) (2020-07-13T17:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。