論文の概要: Revisiting PatchMatch Multi-View Stereo for Urban 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2207.08439v1
- Date: Mon, 18 Jul 2022 08:45:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 17:15:22.425380
- Title: Revisiting PatchMatch Multi-View Stereo for Urban 3D Reconstruction
- Title(参考訳): 都市3次元再構築のためのパッチマッチ多視点ステレオの再検討
- Authors: Marco Orsingher, Paolo Zani, Paolo Medici, Massimo Bertozzi
- Abstract要約: PatchMatch Multi-View Stereo (MVS) に基づく画像に基づく都市シナリオの3次元再構築のための完全なパイプラインを提案する。
提案手法は、KITTIデータセット上の古典的MVSアルゴリズムと単分子深度ネットワークの両方に対して慎重に評価される。
- 参考スコア(独自算出の注目度): 1.1011268090482573
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a complete pipeline for image-based 3D reconstruction of urban
scenarios is proposed, based on PatchMatch Multi-View Stereo (MVS). Input
images are firstly fed into an off-the-shelf visual SLAM system to extract
camera poses and sparse keypoints, which are used to initialize PatchMatch
optimization. Then, pixelwise depths and normals are iteratively computed in a
multi-scale framework with a novel depth-normal consistency loss term and a
global refinement algorithm to balance the inherently local nature of
PatchMatch. Finally, a large-scale point cloud is generated by back-projecting
multi-view consistent estimates in 3D. The proposed approach is carefully
evaluated against both classical MVS algorithms and monocular depth networks on
the KITTI dataset, showing state of the art performances.
- Abstract(参考訳): 本稿では,patchmatch multi-view stereo (mvs) に基づく都市シナリオのイメージベース3次元再構成のための全パイプラインを提案する。
入力画像は、まず市販の視覚SLAMシステムに入力され、PatchMatch最適化の初期化に使用されるカメラポーズとスパースキーポイントを抽出する。
次に,PatchMatchの局所的な性質のバランスをとるために,新たな深度正規整合損失項と大域的精細化アルゴリズムを備えたマルチスケールフレームワークを用いて画素幅の深さと正規度を反復的に計算する。
最後に、大規模ポイントクラウドは、3Dで複数ビュー一貫した見積もりをバックプロジェクションすることによって生成される。
提案手法は,KITTIデータセット上の古典的MVSアルゴリズムと単眼深度ネットワークの両方に対して慎重に評価され,芸術的性能を示す。
関連論文リスト
- GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - SimpleMapping: Real-Time Visual-Inertial Dense Mapping with Deep
Multi-View Stereo [13.535871843518953]
モノクロ画像とIMU読解のみを用いた高画質のリアルタイムビジュアル慣性高密度マッピング法を提案する。
そこで本稿では,VIOシステムから得られる情報的だがノイズの多いスパースポイントを効果的に活用できるスパースポイント支援ステレオニューラルネットワーク(SPA-MVSNet)を提案する。
提案手法は,EuRoCデータセットの難易度評価において,既存システムよりも39.7%のFスコア向上を実現している。
論文 参考訳(メタデータ) (2023-06-14T17:28:45Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - VolumeFusion: Deep Depth Fusion for 3D Scene Reconstruction [71.83308989022635]
本稿では、ディープニューラルネットワークを用いた従来の2段階フレームワークの複製により、解釈可能性と結果の精度が向上することを提唱する。
ネットワークは,1)深部MVS技術を用いた局所深度マップの局所計算,2)深部マップと画像の特徴を融合させて単一のTSDFボリュームを構築する。
異なる視点から取得した画像間のマッチング性能を改善するために,PosedConvと呼ばれる回転不変な3D畳み込みカーネルを導入する。
論文 参考訳(メタデータ) (2021-08-19T11:33:58Z) - Pixel-Perfect Structure-from-Motion with Featuremetric Refinement [96.73365545609191]
複数視点からの低レベル画像情報を直接アライメントすることで、動きからの2つの重要なステップを洗練する。
これにより、様々なキーポイント検出器のカメラポーズとシーン形状の精度が大幅に向上する。
本システムは,大規模な画像コレクションに容易にスケールできるので,クラウドソースによる大規模なローカライゼーションを実現することができる。
論文 参考訳(メタデータ) (2021-08-18T17:58:55Z) - Multi-View Multi-Person 3D Pose Estimation with Plane Sweep Stereo [71.59494156155309]
既存のマルチビュー3Dポーズ推定手法は、複数のカメラビューからグループ2Dポーズ検出に対するクロスビュー対応を明確に確立する。
平面スイープステレオに基づくマルチビュー3Dポーズ推定手法を提案し、クロスビュー融合と3Dポーズ再構築を1ショットで共同で解決します。
論文 参考訳(メタデータ) (2021-04-06T03:49:35Z) - 3D Surface Reconstruction From Multi-Date Satellite Images [11.84274417463238]
本研究では,複数の衛星画像から点雲を再構成することのできるStructure from Motion (SfM) ベースのパイプラインの拡張を提案する。
衛星画像のコンテキストにおいて、最先端メッシュ再構成アルゴリズムを利用するために必須となるいくつかのステップについて、詳細な説明を提供する。
提案したパイプラインと現在のメッシュアルゴリズムが組み合わさって、完全性と中央値エラーの点で最先端のクラウド再構築アルゴリズムより優れていることを示す。
論文 参考訳(メタデータ) (2021-02-04T09:23:21Z) - Ladybird: Quasi-Monte Carlo Sampling for Deep Implicit Field Based 3D
Reconstruction with Symmetry [12.511526058118143]
本稿では,SGDに基づく最適化アルゴリズムの一般化と高速収束を理論的に促進するサンプリング手法を提案する。
物体の反射対称性に基づいて,自己閉塞による問題を緩和する特徴融合法を提案する。
提案システムでは,単一入力画像から高品質な3Dオブジェクト再構成を行うことができる。
論文 参考訳(メタデータ) (2020-07-27T09:17:00Z) - Multi view stereo with semantic priors [3.756550107432323]
我々は,オープンソースライブラリ OpenMVS に実装されている3次元シーンの標準的な3次元再構成を,セマンティックプリエントを用いて支援することを目的としている。
可能なエラーを除去し、ラベルごとにセグメント化された点雲を選択的に取得するために、余分な意味制約を課す。
論文 参考訳(メタデータ) (2020-07-05T11:30:29Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。