論文の概要: Segmentation-aware Prior Assisted Joint Global Information Aggregated 3D Building Reconstruction
- arxiv url: http://arxiv.org/abs/2410.18433v1
- Date: Thu, 24 Oct 2024 04:59:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-25 12:50:07.583899
- Title: Segmentation-aware Prior Assisted Joint Global Information Aggregated 3D Building Reconstruction
- Title(参考訳): 3次元ビル再建のための協調的グローバル情報収集のためのセグメンテーション・アウェア
- Authors: Hongxin Peng, Yongjian Liao, Weijun Li, Chuanyu Fu, Guoxin Zhang, Ziquan Ding, Zijie Huang, Qiku Cao, Shuting Cai,
- Abstract要約: マルチビューステレオは、3Dモデリング、精密なエンジニアリングサーベイ、定量的分析、モニタリングとメンテナンスを促進することで、土木工学において重要な役割を担っている。
しかし,Multi-View Stereoアルゴリズムは,大規模ビルディングシーン内の弱テクスチャ領域を再構築する際の課題に直面している。
これらの領域では、画素のステレオマッチングがしばしば失敗し、不正確な深さ推定につながる。
本稿では,弱テクスチャ領域を正確に分割し,その平面前処理を高精度に構築するアルゴリズムを提案する。
この関数は、深さ推定更新プロセス中に幾何学的整合性に制約された事前候補セットのグローバル情報に基づいて最適平面事前情報を選択する。
- 参考スコア(独自算出の注目度): 6.839442579589125
- License:
- Abstract: Multi-View Stereo plays a pivotal role in civil engineering by facilitating 3D modeling, precise engineering surveying, quantitative analysis, as well as monitoring and maintenance. It serves as a valuable tool, offering high-precision and real-time spatial information crucial for various engineering projects. However, Multi-View Stereo algorithms encounter challenges in reconstructing weakly-textured regions within large-scale building scenes. In these areas, the stereo matching of pixels often fails, leading to inaccurate depth estimations. Based on the Segment Anything Model and RANSAC algorithm, we propose an algorithm that accurately segments weakly-textured regions and constructs their plane priors. These plane priors, combined with triangulation priors, form a reliable prior candidate set. Additionally, we introduce a novel global information aggregation cost function. This function selects optimal plane prior information based on global information in the prior candidate set, constrained by geometric consistency during the depth estimation update process. Experimental results on both the ETH3D benchmark dataset, aerial dataset, building dataset and real scenarios substantiate the superior performance of our method in producing 3D building models compared to other state-of-the-art methods. In summary, our work aims to enhance the completeness and density of 3D building reconstruction, carrying implications for broader applications in urban planning and virtual reality.
- Abstract(参考訳): マルチビューステレオは、3Dモデリング、精密なエンジニアリングサーベイ、定量的分析、モニタリングとメンテナンスを促進することで、土木工学において重要な役割を担っている。
これは、様々なエンジニアリングプロジェクトにとって重要な高精度でリアルタイムな空間情報を提供する貴重なツールとして機能する。
しかし,Multi-View Stereoアルゴリズムは,大規模ビルディングシーン内の弱テクスチャ領域を再構築する際の課題に直面している。
これらの領域では、画素のステレオマッチングがしばしば失敗し、不正確な深さ推定につながる。
本稿では,Segment Anything ModelとRANSACアルゴリズムに基づいて,弱テクスチャ領域を正確にセグメンテーションし,平面前処理を行うアルゴリズムを提案する。
これらの平面事前と三角事前が組み合わさって、信頼できる事前候補集合を形成する。
さらに,新たなグローバル情報集約コスト関数を導入する。
この関数は、深さ推定更新プロセス中に幾何学的整合性に制約された事前候補セットのグローバル情報に基づいて最適平面事前情報を選択する。
ETH3Dベンチマークデータセット、空中データセット、構築データセット、実際のシナリオの両方の実験結果は、他の最先端手法と比較して、3Dビルディングモデルの生成において、我々の手法の優れた性能を裏付けるものである。
要約して,本研究は3次元ビル再建の完全性と密度を高めることを目的としており,都市計画やバーチャルリアリティーにおける幅広い応用に影響を及ぼすものである。
関連論文リスト
- UniPlane: Unified Plane Detection and Reconstruction from Posed Monocular Videos [12.328095228008893]
単眼ビデオから平面検出と再構成を統一する新しい手法であるUniPlaneを提案する。
我々はトランスフォーマーベースのディープニューラルネットワークを構築し、環境のための3D機能ボリュームを共同で構築する。
実世界のデータセットの実験では、UniPlaneは平面検出と再構成の両方において最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2024-07-04T03:02:27Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations [55.022519020409405]
本稿では,マルチモーダルな3Dシーンデータセットと階層型言語アノテーションを用いたベンチマーク,MMScanを構築した。
結果として得られたマルチモーダルな3Dデータセットは、109kオブジェクトと7.7kリージョン上の1.4Mメタアノテーション付きキャプションと、3Dビジュアルグラウンドと質問応答ベンチマークのための3.04M以上の多様なサンプルを含んでいる。
論文 参考訳(メタデータ) (2024-06-13T17:59:30Z) - Robust Geometry-Preserving Depth Estimation Using Differentiable
Rendering [93.94371335579321]
我々は、余分なデータやアノテーションを必要とせずに、幾何学保存深度を予測するためにモデルを訓練する学習フレームワークを提案する。
包括的な実験は、我々のフレームワークの優れた一般化能力を強調します。
我々の革新的な損失関数は、ドメイン固有のスケール・アンド・シフト係数を自律的に復元するモデルを可能にします。
論文 参考訳(メタデータ) (2023-09-18T12:36:39Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - 3D objects and scenes classification, recognition, segmentation, and
reconstruction using 3D point cloud data: A review [5.85206759397617]
3次元(3D)点雲解析は、現実的な画像やマシンビジョンにおいて魅力的な対象の1つとなっている。
最近、ディープラーニングモデルのような様々な技術を用いて、新しい戦略の開発に多大な努力が注がれている。
オブジェクトやシーンの検出,認識,セグメンテーション,再構築など,3Dポイントで行うさまざまなタスクについて検討した。
論文 参考訳(メタデータ) (2023-06-09T15:45:23Z) - Ground material classification and for UAV-based photogrammetric 3D data
A 2D-3D Hybrid Approach [1.3359609092684614]
近年,物理環境を表す3次元仮想データを作成するために,多くの領域でフォトグラム法が広く用いられている。
これらの最先端技術は、迅速な3D戦場再建、仮想訓練、シミュレーションを目的として、アメリカ陸軍と海軍の注意を引き付けている。
論文 参考訳(メタデータ) (2021-09-24T22:29:26Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - 3D Sketch-aware Semantic Scene Completion via Semi-supervised Structure
Prior [50.73148041205675]
セマンティック・シーン・コンプリート(SSC)タスクの目標は、単一視点で観察することで、ボリューム占有率とシーン内のオブジェクトの意味ラベルの完全な3Dボクセル表現を同時に予測することである。
低解像度のボクセル表現で深度情報を埋め込む新しい幾何学的手法を提案する。
提案手法は,SSCフレームワークからの深度特徴学習よりも有効である。
論文 参考訳(メタデータ) (2020-03-31T09:33:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。