論文の概要: Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction
- arxiv url: http://arxiv.org/abs/2106.00912v1
- Date: Wed, 2 Jun 2021 03:10:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 07:03:42.838377
- Title: Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction
- Title(参考訳): 3次元建物再建のための翻訳対称性を考慮したファサード解析
- Authors: Hantang Liu, Wentong Li, Jianke Zhu
- Abstract要約: 本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本研究では,単一段ネットワークにおけるアンカーフリー検出を融合させる新しい手法を提案する。
我々はBlenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
- 参考スコア(独自算出の注目度): 11.263458202880038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effectively parsing the facade is essential to 3D building reconstruction,
which is an important computer vision problem with a large amount of
applications in high precision map for navigation, computer aided design, and
city generation for digital entertainments. To this end, the key is how to
obtain the shape grammars from 2D images accurately and efficiently. Although
enjoying the merits of promising results on the semantic parsing, deep learning
methods cannot directly make use of the architectural rules, which play an
important role for man-made structures. In this paper, we present a novel
translational symmetry-based approach to improving the deep neural networks.
Our method employs deep learning models as the base parser, and a module taking
advantage of translational symmetry is used to refine the initial parsing
results. In contrast to conventional semantic segmentation or bounding box
prediction, we propose a novel scheme to fuse segmentation with anchor-free
detection in a single stage network, which enables the efficient training and
better convergence. After parsing the facades into shape grammars, we employ an
off-the-shelf rendering engine like Blender to reconstruct the realistic
high-quality 3D models using procedural modeling. We conduct experiments on
three public datasets, where our proposed approach outperforms the
state-of-the-art methods. In addition, we have illustrated the 3D building
models built from 2D facade images.
- Abstract(参考訳): ファサードを効果的に解析することは、ナビゲーション、コンピュータ支援設計、デジタルエンターテイメントのための都市生成など、高精度な地図に大量の応用を施した重要なコンピュータビジョン問題である3Dビルディング再構築に不可欠である。
この目的のために、キーは2次元画像から形状文法を正確に効率的に取得する方法である。
セマンティック解析における有望な結果のメリットを享受しながらも、ディープラーニング手法は、人造構造において重要な役割を果たすアーキテクチャルールを直接利用することはできない。
本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本手法では,ベースパーサとしてディープラーニングモデルを用い,翻訳対称性を利用したモジュールを用いて初期解析結果を洗練する。
従来のセマンティクスセグメンテーションやバウンディングボックス予測とは対照的に,単一ステージネットワークにおいてアンカーフリー検出を伴うセグメンテーションを融合する新しい手法を提案する。
ファサードを形状文法に解析した後、Blenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
提案手法が最先端手法よりも優れている3つの公開データセットについて実験を行った。
さらに,2次元ファサード画像から構築した3次元ビルディングモデルについて解説した。
関連論文リスト
- SelfSplat: Pose-Free and 3D Prior-Free Generalizable 3D Gaussian Splatting [4.121797302827049]
ポーズフリーで3次元の事前自由な一般化可能な3次元再構成を実現するための新しい3次元ガウススプラッティングモデルであるSelfSplatを提案する。
本モデルでは,これらの課題に対して,自己教師付き深度とポーズ推定手法を効果的に統合することによって対処する。
提案手法の性能を評価するため,RealEstate10K,ACID,DL3DVなどの大規模実世界のデータセットを用いて評価を行った。
論文 参考訳(メタデータ) (2024-11-26T08:01:50Z) - Large Spatial Model: End-to-end Unposed Images to Semantic 3D [79.94479633598102]
大空間モデル(LSM)は、RGB画像を直接意味的放射場に処理する。
LSMは、単一のフィードフォワード操作における幾何学、外観、意味を同時に推定する。
新しい視点で言語と対話することで、多目的ラベルマップを生成することができる。
論文 参考訳(メタデータ) (2024-10-24T17:54:42Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal
Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - StructuredMesh: 3D Structured Optimization of Fa\c{c}ade Components on
Photogrammetric Mesh Models using Binary Integer Programming [17.985961236568663]
我々は、フォトグラムメッシュモデル内の建物の規則性に応じてファサード構造を再構築する新しい手法であるStructuredMeshを提案する。
本手法では,仮想カメラを用いて建物モデルの多視点色と深度画像を取得する。
次に、深度画像を用いてこれらのボックスを3次元空間に再マップし、初期ファサードレイアウトを生成する。
論文 参考訳(メタデータ) (2023-06-07T06:40:54Z) - SSR-2D: Semantic 3D Scene Reconstruction from 2D Images [54.46126685716471]
本研究では,3Dアノテーションを使わずにセマンティックなシーン再構成を行う中心的な3Dシーンモデリングタスクについて検討する。
提案手法の鍵となる考え方は,不完全な3次元再構成と対応するRGB-D画像の両方を用いたトレーニング可能なモデルの設計である。
本研究では,2つの大規模ベンチマークデータセットであるMatterPort3DとScanNetに対して,セマンティックシーン補完の最先端性能を実現する。
論文 参考訳(メタデータ) (2023-02-07T17:47:52Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Fine Detailed Texture Learning for 3D Meshes with Generative Models [33.42114674602613]
本稿では,多視点画像と単視点画像の両方から高品質なテクスチャ3Dモデルを再構成する手法を提案する。
第1段階では正確な幾何学を学ぶことに集中し、第2段階では、生成的対向ネットワークを用いてテクスチャを学ぶことに集中する。
本手法は従来の手法に比べて優れた3次元テクスチャモデルを実現することを実証する。
論文 参考訳(メタデータ) (2022-03-17T14:50:52Z) - Learnable Triangulation for Deep Learning-based 3D Reconstruction of
Objects of Arbitrary Topology from Single RGB Images [12.693545159861857]
モノクロ画像から3次元物体を再構成する深層強化学習手法を提案する。
提案手法は, 視覚的品質, 再構成精度, 計算時間において, 最先端技術よりも優れる。
論文 参考訳(メタデータ) (2021-09-24T09:44:22Z) - Using Adaptive Gradient for Texture Learning in Single-View 3D
Reconstruction [0.0]
3次元モデル再構築のための学習ベースのアプローチは、現代の応用によって注目を集めている。
本稿では,サンプリング画像のばらつきに基づいて予測座標の勾配を最適化し,新しいサンプリングアルゴリズムを提案する。
また,frechetインセプション距離(fid)を用いて学習における損失関数を形成し,レンダリング画像と入力画像とのギャップを橋渡しする。
論文 参考訳(メタデータ) (2021-04-29T07:52:54Z) - Self-Supervised 2D Image to 3D Shape Translation with Disentangled
Representations [92.89846887298852]
本稿では,2次元画像ビューと3次元オブジェクト形状を翻訳するフレームワークを提案する。
形状変換のための自己教師型画像変換フレームワークであるSISTを提案する。
論文 参考訳(メタデータ) (2020-03-22T22:44:02Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。