論文の概要: BP-MVSNet: Belief-Propagation-Layers for Multi-View-Stereo
- arxiv url: http://arxiv.org/abs/2010.12436v1
- Date: Fri, 23 Oct 2020 14:30:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 23:18:14.573010
- Title: BP-MVSNet: Belief-Propagation-Layers for Multi-View-Stereo
- Title(参考訳): BP-MVSNet:マルチビューステレオのための信念伝搬層
- Authors: Christian Sormann (1), Patrick Kn\"obelreiter (1), Andreas Kuhn (2),
Mattia Rossi (2), Thomas Pock (1), Friedrich Fraundorfer (1) ((1) Graz
University of Technology, (2) Sony Europe B.V.)
- Abstract要約: 本稿では,CNNをベースとした多視点ステレオ(MVS)手法を提案する。
CRFにおけるラベルジャンプを正規化するために,期待される3次元誤差に基づいて正規化を計算する方法を示す。
また,分数ラベルのジャンプを可能にするために,ペア項の計算に組み込む微分可能なステップを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we propose BP-MVSNet, a convolutional neural network
(CNN)-based Multi-View-Stereo (MVS) method that uses a differentiable
Conditional Random Field (CRF) layer for regularization. To this end, we
propose to extend the BP layer and add what is necessary to successfully use it
in the MVS setting. We therefore show how we can calculate a normalization
based on the expected 3D error, which we can then use to normalize the label
jumps in the CRF. This is required to make the BP layer invariant to different
scales in the MVS setting. In order to also enable fractional label jumps, we
propose a differentiable interpolation step, which we embed into the
computation of the pairwise term. These extensions allow us to integrate the BP
layer into a multi-scale MVS network, where we continuously improve a rough
initial estimate until we get high quality depth maps as a result. We evaluate
the proposed BP-MVSNet in an ablation study and conduct extensive experiments
on the DTU, Tanks and Temples and ETH3D data sets. The experiments show that we
can significantly outperform the baseline and achieve state-of-the-art results.
- Abstract(参考訳): 本研究では,cnn(convolutional neural network)ベースの多視点ステレオ(multi-view-stereo,mvs)手法であるbp-mvsnetを提案する。
この目的のために、BP層を拡張し、MVS設定でうまく利用するために必要なものを追加することを提案する。
そこで我々は,CRFにおけるラベルジャンプを正規化するために,期待される3次元誤差に基づいて正規化を計算する方法を示す。
MVS設定では、BP層を異なるスケールに不変にする必要がある。
また,分数ラベルのジャンプを可能にするために,ペア項の計算に組み込む微分可能な補間ステップを提案する。
これらの拡張により、BP層をマルチスケールMVSネットワークに統合し、結果として高品質な深度マップが得られるまで、粗い初期推定を継続的に改善できる。
BP-MVSNetをアブレーション実験で評価し,DTU,タンク・アンド・テンプル,ETH3Dデータセットについて広範な実験を行った。
実験の結果,ベースラインを著しく上回り,最先端の結果が得られることがわかった。
関連論文リスト
- LRP-QViT: Mixed-Precision Vision Transformer Quantization via Layer-wise
Relevance Propagation [0.0]
LRP-QViTは、異なる層に混合精度のビット割り当てを割り当てる説明可能性に基づく手法である。
実験結果から,固定ビット・混合ビット後量子化法が既存の4ビット・6ビット量子化法を超越していることが判明した。
論文 参考訳(メタデータ) (2024-01-20T14:53:19Z) - SD-MVS: Segmentation-Driven Deformation Multi-View Stereo with Spherical
Refinement and EM optimization [6.886220026399106]
テクスチャレス領域の3次元再構成における課題を解決するために,多視点ステレオ (SD-MVS) を導入する。
私たちは、シーン内のセグメンテーションインスタンスを区別するためにSAM(Segment Anything Model)を採用した最初の人です。
球面座標と正規点の勾配勾配と深度の画素方向探索間隔を組み合わせた独自の精細化戦略を提案する。
論文 参考訳(メタデータ) (2024-01-12T05:25:57Z) - Optimization Guarantees of Unfolded ISTA and ADMM Networks With Smooth
Soft-Thresholding [57.71603937699949]
我々は,学習エポックの数の増加とともに,ほぼゼロに近いトレーニング損失を達成するための最適化保証について検討した。
トレーニングサンプル数に対する閾値は,ネットワーク幅の増加とともに増加することを示す。
論文 参考訳(メタデータ) (2023-09-12T13:03:47Z) - ARAI-MVSNet: A multi-view stereo depth estimation network with adaptive
depth range and depth interval [19.28042366225802]
マルチビューステレオ(MVS)は幾何学的コンピュータビジョンの基本的な問題である。
適応的な全画素深度範囲と深度間隔を実現するために,新しい多段粗大化フレームワークを提案する。
我々のモデルは最先端の性能を達成し、競争一般化能力を得る。
論文 参考訳(メタデータ) (2023-08-17T14:52:11Z) - MV-JAR: Masked Voxel Jigsaw and Reconstruction for LiDAR-Based
Self-Supervised Pre-Training [58.07391711548269]
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
Masked Voxel Jigsaw and Reconstruction (MV-JAR) method for LiDAR-based self-supervised pre-training
論文 参考訳(メタデータ) (2023-03-23T17:59:02Z) - Boosting Convolution with Efficient MLP-Permutation for Volumetric
Medical Image Segmentation [32.645022002807416]
マルチレイヤパーセプトロン(MLP)ネットワークは、ViTに匹敵する結果により、研究者の間で人気を取り戻している。
本稿では,コンボリューションニューラルネットワーク(CNN)とPHNetの両方の長所を活かしたPHNetという,Vol-MedSeg用の新しい可変ハイブリッドネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-23T08:59:09Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view
Stereo [55.30992853477754]
本稿では,リアルタイムな単分子追跡と高密度フレームワークであるTANDEMを紹介する。
ポーズ推定のために、TANDEMはアライメントのスライディングウィンドウに基づいて光度バンドル調整を行う。
TANDEMは最先端のリアルタイム3D再構成性能を示す。
論文 参考訳(メタデータ) (2021-11-14T19:01:02Z) - Margin-Based Regularization and Selective Sampling in Deep Neural
Networks [7.219077740523683]
我々は、ディープニューラルネットワーク(DNN)のための新しいマージンベース正規化形式、MMR(Multi-margin regularization)を導出する。
CIFAR10, CIFAR100, ImageNet上で, MNLI, QQP, QNLI, MRPC, SST-2, RTEベンチマークのための最先端畳み込みニューラルネットワーク(CNN)とBERT-BASEアーキテクチャを用いて, 実験結果の改善を示す。
論文 参考訳(メタデータ) (2020-09-13T15:06:42Z) - Regularized Densely-connected Pyramid Network for Salient Instance
Segmentation [73.17802158095813]
我々は、エンドツーエンドの有能なインスタンスセグメンテーション(SIS)のための新しいパイプラインを提案する。
ディープネットワークにおけるリッチな特徴階層をよりよく活用するために、正規化された高密度接続を提案する。
マスク予測を改善するために,新しいマルチレベルRoIAlignベースのデコーダを導入し,多レベル特徴を適応的に集約する。
論文 参考訳(メタデータ) (2020-08-28T00:13:30Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。