論文の概要: Deep Learning-based Scalable Image-to-3D Facade Parser for Generating Thermal 3D Building Models
- arxiv url: http://arxiv.org/abs/2508.04406v1
- Date: Wed, 06 Aug 2025 12:48:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.722615
- Title: Deep Learning-based Scalable Image-to-3D Facade Parser for Generating Thermal 3D Building Models
- Title(参考訳): 深層学習に基づく3次元サーマルビルディングモデル生成のためのスケーラブルな3次元ファサードパーザ
- Authors: Yinan Yu, Alex Gonzalez-Caceres, Samuel Scheidegger, Sanjay Somanath, Alexander Hollberg,
- Abstract要約: 早期の改修計画には、レベル・オブ・ディテール(LoD)3の熱3Dモデルに基づくシミュレーションが必要である。
本稿では,コンピュータビジョンとディープラーニングの両方を用いて画像からジオメトリを抽出し,LoD3熱モデルを生成するパイプラインを提案する。
典型的なスウェーデンの住宅で試験され、SI3FPは約5%の誤差を窓と壁の比率で達成した。
- 参考スコア(独自算出の注目度): 40.44787916333075
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Renovating existing buildings is essential for climate impact. Early-phase renovation planning requires simulations based on thermal 3D models at Level of Detail (LoD) 3, which include features like windows. However, scalable and accurate identification of such features remains a challenge. This paper presents the Scalable Image-to-3D Facade Parser (SI3FP), a pipeline that generates LoD3 thermal models by extracting geometries from images using both computer vision and deep learning. Unlike existing methods relying on segmentation and projection, SI3FP directly models geometric primitives in the orthographic image plane, providing a unified interface while reducing perspective distortions. SI3FP supports both sparse (e.g., Google Street View) and dense (e.g., hand-held camera) data sources. Tested on typical Swedish residential buildings, SI3FP achieved approximately 5% error in window-to-wall ratio estimates, demonstrating sufficient accuracy for early-stage renovation analysis. The pipeline facilitates large-scale energy renovation planning and has broader applications in urban development and planning.
- Abstract(参考訳): 既存の建物を改修することは気候への影響に欠かせない。
早期の改修計画には、窓のような機能を含むレベル・オブ・ディテール(LoD)3の熱3Dモデルに基づくシミュレーションが必要である。
しかし、そのような機能のスケーラブルで正確な識別は依然として課題である。
本稿では,コンピュータビジョンとディープラーニングの両方を用いて画像からジオメトリを抽出することにより,LoD3熱モデルを生成するパイプラインであるスケーラブル画像から3Dファサードパーサ(SI3FP)を提案する。
分割と投影に依存する既存の方法とは異なり、SI3FPは直交画像平面の幾何学的プリミティブを直接モデル化し、視点歪みを低減しつつ統一されたインターフェースを提供する。
SI3FPはスパース(例えばGoogleストリートビュー)と高密度(例えばハンドヘルドカメラ)のデータソースの両方をサポートする。
典型的なスウェーデンの住宅で試験されたSI3FPは、窓と壁の比率の推定で約5%の誤差を達成し、早期の改修分析に十分な精度を示した。
このパイプラインは大規模なエネルギー再生計画を促進し、都市開発と計画に幅広い応用がある。
関連論文リスト
- E3D-Bench: A Benchmark for End-to-End 3D Geometric Foundation Models [78.1674905950243]
3次元幾何学基礎モデル(GFM)の総合ベンチマークを初めて提示する。
GFMは、単一のフィードフォワードパスで密度の高い3D表現を直接予測し、スローまたは未使用のカメラパラメータを不要にする。
我々は16の最先端GFMを評価し、タスクやドメイン間の長所と短所を明らかにした。
すべてのコード、評価スクリプト、処理されたデータは公開され、3D空間インテリジェンスの研究が加速される。
論文 参考訳(メタデータ) (2025-06-02T17:53:09Z) - Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images [0.0]
Texture2LoD3では,3次元ビルディングモデルとパノラマストリートレベルの画像の両立を利用した新しい手法を提案する。
本手法がファサードセグメンテーション精度を11%向上させることを示した。
We believe that Texture2LoD3 can scale the adoption of LoD3 model, open application in the estimation building Solar potential or enhance autonomous driving simulations。
論文 参考訳(メタデータ) (2025-04-07T16:40:16Z) - Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model [15.892685514932323]
マルチビュールームレイアウト推定のための新しい手法であるPlain-DUSt3Rを提案する。
Plane-DUSt3RはDUSt3Rフレームワークを室内レイアウトデータセット(Structure3D)に組み込んで構造平面を推定する。
均一かつ同相な結果を生成することにより、Plane-DUSt3Rは、単一の後処理ステップと2D検出結果のみを用いて、部屋レイアウトの推定を可能にする。
論文 参考訳(メタデータ) (2025-02-24T02:14:19Z) - GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - StructuredMesh: 3D Structured Optimization of Fa\c{c}ade Components on
Photogrammetric Mesh Models using Binary Integer Programming [17.985961236568663]
我々は、フォトグラムメッシュモデル内の建物の規則性に応じてファサード構造を再構築する新しい手法であるStructuredMeshを提案する。
本手法では,仮想カメラを用いて建物モデルの多視点色と深度画像を取得する。
次に、深度画像を用いてこれらのボックスを3次元空間に再マップし、初期ファサードレイアウトを生成する。
論文 参考訳(メタデータ) (2023-06-07T06:40:54Z) - Learning to Generate 3D Representations of Building Roofs Using
Single-View Aerial Imagery [68.3565370706598]
本研究では,空撮画像から建物屋根メッシュの条件分布を学習するための新しいパイプラインを提案する。
同一物体の複数の画像を必要とする代替手法とは違って,本手法では,一つの画像のみを用いて予測を行う3次元屋根メッシュを推定できる。
論文 参考訳(メタデータ) (2023-03-20T15:47:05Z) - Elevation Estimation-Driven Building 3D Reconstruction from Single-View
Remote Sensing Imagery [20.001807614214922]
リモートセンシング画像からの3D再構築は、スマートシティやフォトグラムなどの分野に幅広い応用がある。
入力単視点リモートセンシング画像から3次元ビルディングモデルを再構築するための効率的なDSM推定駆動再構築フレームワーク(Building3D)を提案する。
我々のビル3Dは高度予測のためのSFFDEネットワークに根ざし、マスク構築のためのビル抽出ネットワークと同期し、点雲再構成、表面再構成(シティGMLモデル再構成)を順次実施する。
論文 参考訳(メタデータ) (2023-01-11T17:20:30Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z) - Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction [11.263458202880038]
本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本研究では,単一段ネットワークにおけるアンカーフリー検出を融合させる新しい手法を提案する。
我々はBlenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
論文 参考訳(メタデータ) (2021-06-02T03:10:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。