論文の概要: Vitruvio: 3D Building Meshes via Single Perspective Sketches
- arxiv url: http://arxiv.org/abs/2210.13634v1
- Date: Mon, 24 Oct 2022 22:24:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 13:54:50.365322
- Title: Vitruvio: 3D Building Meshes via Single Perspective Sketches
- Title(参考訳): Vitruvio:Single Perspective Sketchesによる3Dビルディングメッシュ
- Authors: Alberto Tono and Martin Fischer
- Abstract要約: Vitruvioは、特定のビルディングデータセット上のSVRタスクにOccupancy Networkを適用する。
推論プロセスは26%以上加速する。
これにより、再建精度(チャンファー距離で測定される)が18%向上する。
- 参考スコア(独自算出の注目度): 0.8339831319589134
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Today's architectural engineering and construction (AEC) software require a
learning curve to generate a three-dimension building representation. This
limits the ability to quickly validate the volumetric implications of an
initial design idea communicated via a single sketch. Allowing designers to
translate a single sketch to a 3D building will enable owners to instantly
visualize 3D project information without the cognitive load required. If
previous state-of-the-art (SOTA) data-driven methods for single view
reconstruction (SVR) showed outstanding results in the reconstruction process
from a single image or sketch, they lacked specific applications, analysis, and
experiments in the AEC. Therefore, this research addresses this gap,
introducing a deep learning method: Vitruvio. Vitruvio adapts Occupancy Network
for SVR tasks on a specific building dataset (Manhattan 1K). This adaptation
brings two main improvements. First, it accelerates the inference process by
more than 26\% (from 0.5s to 0.37s). Second, it increases the reconstruction
accuracy (measured by the Chamfer Distance) by 18\%. During this adaptation in
the AEC domain, we evaluate the effect of the building orientation in the
learning procedure since it constitutes an important design factor. While
aligning all the buildings to a canonical pose improved the overall
quantitative metrics, it did not capture fine-grain details in more complex
building shapes (as shown in our qualitative analysis). Finally, Vitruvio
outputs a 3D-printable building mesh with arbitrary topology and genus from a
single perspective sketch, providing a step forward to allow owners and
designers to communicate 3D information via a 2D, effective, intuitive, and
universal communication medium: the sketch.
- Abstract(参考訳): 今日の建築工学と建設(AEC)ソフトウェアは、3次元の建物表現を生成するために学習曲線を必要とする。
これにより、単一のスケッチを通じて伝達される初期設計思想のボリューム的含意を迅速に検証する能力が制限される。
デザイナーが1枚のスケッチを3dのビルに翻訳できるので、オーナーは認知的負荷なしに簡単に3dのプロジェクト情報を視覚化できる。
従来のSOTA(State-of-the-art)データ駆動型単一ビュー再構成(SVR)が単一画像やスケッチからの再構成プロセスにおいて優れた結果を示した場合、AECにおける具体的な応用、分析、実験が欠如している。
そこで本研究では,このギャップに対処し,深層学習手法であるVitruvioを導入する。
Vitruvioは、特定のビルディングデータセット(Manhattan 1K)上のSVRタスクにOccupancy Networkを適用する。
この適応は2つの大きな改善をもたらす。
まず、推論プロセスを26\%以上加速する(0.5sから0.37s)。
第2に、復元精度(シャムファー距離による測定)を18\%向上させる。
AEC領域におけるこの適応中に、重要な設計要素を構成するため、学習手順における建物配向の影響を評価する。
すべての建物を標準的な姿勢に合わせることで、全体的な定量的指標が向上したが、より複雑な建物形状(質的分析で示されるように)で細粒度の詳細を捉えなかった。
最後に、vitruvioは任意のトポロジーと種数を持つ3dプリント可能なビルディングメッシュを単一の視点スケッチから出力し、所有者とデザイナーが2d、効果的、直感的、そして普遍的なコミュニケーションメディアであるthe sketchを通じて3d情報を伝えるためのステップを提供する。
関連論文リスト
- Exploiting Semantic Scene Reconstruction for Estimating Building Envelope Characteristics [6.382787013075262]
2次元画像入力から幾何構造特性を推定する新しいフレームワークであるBuildNet3Dを提案する。
本フレームワークは, 窓面間比と建物のフットプリントの推定において, 高い精度と一般化性を示すとともに, 様々な複雑な建築物構造について評価する。
論文 参考訳(メタデータ) (2024-10-29T13:29:01Z) - SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。
SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。
SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-01T21:23:03Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - Semi-supervised Learning from Street-View Images and OpenStreetMap for
Automatic Building Height Estimation [59.6553058160943]
本稿では,Mapillary SVIとOpenStreetMapのデータから建物の高さを自動的に推定する半教師付き学習(SSL)手法を提案する。
提案手法は, 平均絶対誤差(MAE)が約2.1mである建物の高さを推定する上で, 明らかな性能向上につながる。
予備結果は,低コストなVGIデータに基づく提案手法のスケールアップに向けた今後の取り組みを期待し,動機づけるものである。
論文 参考訳(メタデータ) (2023-07-05T18:16:30Z) - Automatic Reconstruction of Semantic 3D Models from 2D Floor Plans [1.8581514902689347]
走査された2次元計画からベクトル化された3次元モデルの再構成を行うパイプラインを提案する。
この手法は、公開データセットCubeCasa5kで最先端の結果を示す。
論文 参考訳(メタデータ) (2023-06-02T16:06:42Z) - 3D-LatentMapper: View Agnostic Single-View Reconstruction of 3D Shapes [0.0]
視覚変換器(ViT)の中間潜時空間と共同画像テキスト表現モデル(CLIP)を高速かつ効率的なシングルビュー再構成(SVR)に活用する新しいフレームワークを提案する。
本研究ではShapeNetV2データセットを用いてSOTA法との比較実験を行い,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-12-05T11:45:26Z) - Structure-Aware 3D VR Sketch to 3D Shape Retrieval [113.20120789493217]
われわれは3DVRのスケッチに固有の不正確さによって引き起こされる課題に注目している。
我々は「適合ギャップ」によって引き起こされる適応利得値を持つ三重項損失を用いることを提案する。
観察からではなく、記憶から描かれた202個の3次元形状のための202個のVRスケッチのデータセットを紹介した。
論文 参考訳(メタデータ) (2022-09-19T14:29:26Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Translational Symmetry-Aware Facade Parsing for 3D Building
Reconstruction [11.263458202880038]
本稿では,深部ニューラルネットワーク改善のための新しい翻訳対称性に基づくアプローチを提案する。
本研究では,単一段ネットワークにおけるアンカーフリー検出を融合させる新しい手法を提案する。
我々はBlenderのような市販のレンダリングエンジンを使用して、手続きモデルを用いて現実的な高品質な3Dモデルを再構築する。
論文 参考訳(メタデータ) (2021-06-02T03:10:51Z) - Building-GAN: Graph-Conditioned Architectural Volumetric Design
Generation [10.024367148266721]
本稿では,入力プログラムグラフに基づくボリュームデザイン生成について述べる。
密度の高い3次元ボクセルを出力する代わりに、ジオメトリを構築するためにコンパクトかつ表現性の高い新しい3次元表現であるボクセルグラフを提案する。
私たちのジェネレータは、入力プログラムグラフと出力ボキセルグラフを接続するためのポインタメカニズムを使用するクロスモーダルグラフニューラルネットワークであり、パイプライン全体が逆のフレームワークを使用して訓練されます。
論文 参考訳(メタデータ) (2021-04-27T16:49:34Z) - 3D Sketch-aware Semantic Scene Completion via Semi-supervised Structure
Prior [50.73148041205675]
セマンティック・シーン・コンプリート(SSC)タスクの目標は、単一視点で観察することで、ボリューム占有率とシーン内のオブジェクトの意味ラベルの完全な3Dボクセル表現を同時に予測することである。
低解像度のボクセル表現で深度情報を埋め込む新しい幾何学的手法を提案する。
提案手法は,SSCフレームワークからの深度特徴学習よりも有効である。
論文 参考訳(メタデータ) (2020-03-31T09:33:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。