論文の概要: Deep Multi-View Stereo gone wild
- arxiv url: http://arxiv.org/abs/2104.15119v1
- Date: Fri, 30 Apr 2021 17:07:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 13:36:04.125337
- Title: Deep Multi-View Stereo gone wild
- Title(参考訳): Deep Multi-View Stereoが暴走
- Authors: Fran\c{c}ois Darmon and B\'en\'edicte Bascle and Jean-Cl\'ement Devaux
and Pascal Monasse and Mathieu Aubry
- Abstract要約: ディープマルチビューステレオ(ディープMSV)メソッドは、単純なデータセットで広く開発され、比較されています。
本稿では,インターネット写真収集作業において,制御されたシナリオで到達した結論が有効かどうかを問う。
ネットワークアーキテクチャ,トレーニングデータ,監督という,深層MSV手法の3つの側面から評価手法を提案し,その影響を検討する。
- 参考スコア(独自算出の注目度): 12.106051690920266
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep multi-view stereo (deep MVS) methods have been developed and extensively
compared on simple datasets, where they now outperform classical approaches. In
this paper, we ask whether the conclusions reached in controlled scenarios are
still valid when working with Internet photo collections. We propose a
methodology for evaluation and explore the influence of three aspects of deep
MVS methods: network architecture, training data, and supervision. We make
several key observations, which we extensively validate quantitatively and
qualitatively, both for depth prediction and complete 3D reconstructions.
First, we outline the promises of unsupervised techniques by introducing a
simple approach which provides more complete reconstructions than supervised
options when using a simple network architecture. Second, we emphasize that not
all multiscale architectures generalize to the unconstrained scenario,
especially without supervision. Finally, we show the efficiency of noisy
supervision from large-scale 3D reconstructions which can even lead to networks
that outperform classical methods in scenarios where very few images are
available.
- Abstract(参考訳): 深層マルチビューステレオ (deep multi-view stereo, deep mvs) 法は、単純なデータセットと比較して広く開発され、古典的アプローチよりも優れています。
本稿では,インターネット写真収集作業において,制御されたシナリオで到達した結論が有効かどうかを問う。
本稿では,ネットワークアーキテクチャ,トレーニングデータ,監視という,深層MVS手法の3つの側面の影響を評価する方法論を提案する。
我々は,深度予測と3次元再構成の両面において,定量的かつ定性的に検証する重要な観察を行った。
まず、単純なネットワークアーキテクチャを使用する際に、教師なしのオプションよりも完全な再構築を提供する単純なアプローチを導入することで、教師なしのテクニックの約束を概説する。
第二に、すべてのマルチスケールアーキテクチャが、特に監督なしで、制約のないシナリオに一般化するわけではないことを強調する。
最後に,画像の少ないシナリオでは,従来の手法に勝るネットワークに繋がる可能性がある,大規模3次元再構成によるノイズの監視の効率を示す。
関連論文リスト
- Learning-based Multi-View Stereo: A Survey [55.3096230732874]
MVS(Multi-View Stereo)アルゴリズムは、複雑な環境における正確な再構築を可能にする包括的な3D表現を合成する。
ディープラーニングの成功により、多くの学習ベースのMVS手法が提案され、従来の手法に対して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-27T17:53:18Z) - OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。
我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。
意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文 参考訳(メタデータ) (2023-12-14T18:58:52Z) - Multi-View Guided Multi-View Stereo [39.116228971420874]
本稿では,複数の画像フレームから高密度な3次元再構成を実現するための新しいフレームワークを提案する。
ディープ・マルチビューステレオネットワークを前提として,ニューラルネットワークのガイドにはスパース奥行きヒントが使用される。
我々は、最先端の多視点ステレオネットワークにおけるマルチビューガイドフレームワークの評価を行った。
論文 参考訳(メタデータ) (2022-10-20T17:59:18Z) - End-to-End Multi-View Structure-from-Motion with Hypercorrelation
Volumes [7.99536002595393]
この問題に対処するために深層学習技術が提案されている。
我々は現在最先端の2次元構造であるSfM(SfM)のアプローチを改善している。
一般的なマルチビューのケースに拡張し、複雑なベンチマークデータセットDTUで評価する。
論文 参考訳(メタデータ) (2022-09-14T20:58:44Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - VolumeFusion: Deep Depth Fusion for 3D Scene Reconstruction [71.83308989022635]
本稿では、ディープニューラルネットワークを用いた従来の2段階フレームワークの複製により、解釈可能性と結果の精度が向上することを提唱する。
ネットワークは,1)深部MVS技術を用いた局所深度マップの局所計算,2)深部マップと画像の特徴を融合させて単一のTSDFボリュームを構築する。
異なる視点から取得した画像間のマッチング性能を改善するために,PosedConvと呼ばれる回転不変な3D畳み込みカーネルを導入する。
論文 参考訳(メタデータ) (2021-08-19T11:33:58Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Towards Better Generalization: Joint Depth-Pose Learning without PoseNet [36.414471128890284]
自己教師型共同深層学習におけるスケール不整合の本質的問題に対処する。
既存の手法の多くは、全ての入力サンプルで一貫した深さとポーズを学習できると仮定している。
本稿では,ネットワーク推定からスケールを明示的に切り離す新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-04-03T00:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。