論文の概要: IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on
Binary Decisions
- arxiv url: http://arxiv.org/abs/2111.14420v1
- Date: Mon, 29 Nov 2021 10:04:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 17:01:34.396283
- Title: IB-MVS: An Iterative Algorithm for Deep Multi-View Stereo based on
Binary Decisions
- Title(参考訳): IB-MVS:二項決定に基づく深層多視点ステレオの反復アルゴリズム
- Authors: Christian Sormann (1), Mattia Rossi (2), Andreas Kuhn (2), Friedrich
Fraundorfer (1) ((1) Graz University of Technology, (2) Sony Europe B.V.)
- Abstract要約: 本稿では,マルチビューステレオのための新しいディープラーニング手法を提案する。
提案手法は,各画素における実現可能な深度値の連続空間を2値決定方式でトラバースすることにより,高分解能かつ高精度な深度マップを反復的に推定する。
提案手法をDTU, タンク, テンプル上の最先端のマルチビューステレオ手法と, 挑戦的なETH3Dベンチマークと比較し, 競争力のある結果を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel deep-learning-based method for Multi-View Stereo. Our
method estimates high resolution and highly precise depth maps iteratively, by
traversing the continuous space of feasible depth values at each pixel in a
binary decision fashion. The decision process leverages a deep-network
architecture: this computes a pixelwise binary mask that establishes whether
each pixel actual depth is in front or behind its current iteration individual
depth hypothesis. Moreover, in order to handle occluded regions, at each
iteration the results from different source images are fused using pixelwise
weights estimated by a second network. Thanks to the adopted binary decision
strategy, which permits an efficient exploration of the depth space, our method
can handle high resolution images without trading resolution and precision.
This sets it apart from most alternative learning-based Multi-View Stereo
methods, where the explicit discretization of the depth space requires the
processing of large cost volumes. We compare our method with state-of-the-art
Multi-View Stereo methods on the DTU, Tanks and Temples and the challenging
ETH3D benchmarks and show competitive results.
- Abstract(参考訳): マルチビューステレオの新しいディープラーニング手法を提案する。
本手法は,各画素における可逆深度値の連続空間を二元決定方法でトラバースすることにより,高分解能かつ高精度な深度マップを反復的に推定する。
決定プロセスはディープネットワークアーキテクチャを利用する。これはピクセルワイズバイナリマスクを計算し、各ピクセルの実際の深さが前か、現在のイテレーションの個々の深さ仮説の背後にあるかを決定する。
さらに、隠蔽領域を扱うために、各イテレーションで異なるソース画像の結果を第2のネットワークで推定した画素単位の重みで融合する。
深度空間を効率的に探索できる2値決定方式を採用することにより,高解像度画像の処理を高精度に行うことが可能となる。
これは、多くの学習ベースの多視点ステレオ法と異なり、深度空間の明示的な離散化は、大きなコストボリュームの処理を必要とする。
提案手法をDTU, タンク, テンプル上の最先端のマルチビューステレオ手法とETH3Dベンチマークを用いて比較し, 競争結果を示す。
関連論文リスト
- Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - DELS-MVS: Deep Epipolar Line Search for Multi-View Stereo [0.0]
深層学習に基づくマルチビューステレオ(MVS)のための新しいアプローチを提案する。
参照画像の各画素に対して,提案手法は深層構造を利用して,対応するエピポーラ線に沿ってソース画像の対応する点を直接探索する。
我々はETH3D, Tanks and Temples and DTUベンチマークでDELS-MVSをテストし、最先端のアプローチに関する競争結果を得た。
論文 参考訳(メタデータ) (2022-12-13T15:00:12Z) - Rethinking Disparity: A Depth Range Free Multi-View Stereo Based on
Disparity [17.98608948955211]
既存の学習ベースのマルチビューステレオ(MVS)手法は、3Dコストボリュームを構築するために深さ範囲に依存している。
本稿では,DipMVSと呼ばれるエピポーラ分散フロー(E-flow)に基づく分散型MVS法を提案する。
本研究では、DipMVSは深さ範囲に敏感ではなく、GPUメモリを低くすることで最先端の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-11-30T11:05:02Z) - RA-Depth: Resolution Adaptive Self-Supervised Monocular Depth Estimation [27.679479140943503]
本研究では,シーン深さのスケール不変性を学習し,自己教師付き単眼深度推定法(RA-Depth)を提案する。
RA-Depthは最先端の性能を達成し、解像度適応の優れた能力を示す。
論文 参考訳(メタデータ) (2022-07-25T08:49:59Z) - Uncertainty-Aware Deep Multi-View Photometric Stereo [100.97116470055273]
光度ステレオ(PS)は高周波表面の細部を復元するのに優れ、マルチビューステレオ(MVS)はPSによる低周波歪みを除去し、大域的な形状を維持するのに役立つ。
本稿では,PS と MVS の相補的強みを効果的に活用する手法を提案する。
我々は,不確実性を考慮したディープPSネットワークとディープMVSネットワークを用いて,画素ごとの表面の正規度と深さを推定する。
論文 参考訳(メタデータ) (2022-02-26T05:45:52Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z) - VolumeFusion: Deep Depth Fusion for 3D Scene Reconstruction [71.83308989022635]
本稿では、ディープニューラルネットワークを用いた従来の2段階フレームワークの複製により、解釈可能性と結果の精度が向上することを提唱する。
ネットワークは,1)深部MVS技術を用いた局所深度マップの局所計算,2)深部マップと画像の特徴を融合させて単一のTSDFボリュームを構築する。
異なる視点から取得した画像間のマッチング性能を改善するために,PosedConvと呼ばれる回転不変な3D畳み込みカーネルを導入する。
論文 参考訳(メタデータ) (2021-08-19T11:33:58Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Attention Aware Cost Volume Pyramid Based Multi-view Stereo Network for
3D Reconstruction [12.728154351588053]
マルチビュー画像から3次元再構成を行うための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
高分解能深度を実現するために粗粒度深度推論戦略を導入する。
論文 参考訳(メタデータ) (2020-11-25T13:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。