論文の概要: PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction
- arxiv url: http://arxiv.org/abs/2203.02156v1
- Date: Fri, 4 Mar 2022 07:05:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-07 21:18:10.114124
- Title: PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction
- Title(参考訳): PatchMVSNet:弱表面再構成のためのパッチワイズ非教師付きマルチビューステレオ
- Authors: Haonan Dong, Jian Yao
- Abstract要約: 本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。
我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。
提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
- 参考スコア(独自算出の注目度): 2.9896482273918434
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based multi-view stereo (MVS) has gained fine reconstructions on
popular datasets. However, supervised learning methods require ground truth for
training, which is hard to be collected, especially for the large-scale
datasets. Though nowadays unsupervised learning methods have been proposed and
have gotten gratifying results, those methods still fail to reconstruct intact
results in challenging scenes, such as weakly-textured surfaces, as those
methods primarily depend on pixel-wise photometric consistency which is
subjected to various illuminations. To alleviate matching ambiguity in those
challenging scenes, this paper proposes robust loss functions leveraging
constraints beneath multi-view images: 1) Patch-wise photometric consistency
loss, which expands the receptive field of the features in multi-view
similarity measuring, 2) Robust twoview geometric consistency, which includes a
cross-view depth consistency checking with the minimum occlusion. Our
unsupervised strategy can be implemented with arbitrary depth estimation
frameworks and can be trained with arbitrary large-scale MVS datasets.
Experiments show that our method can decrease the matching ambiguity and
particularly improve the completeness of weakly-textured reconstruction.
Moreover, our method reaches the performance of the state-of-the-art methods on
popular benchmarks, like DTU, Tanks and Temples and ETH3D. The code will be
released soon.
- Abstract(参考訳): 学習ベースマルチビューステレオ(MVS)は,一般的なデータセットに対して微細に再構成されている。
しかし、教師あり学習法は、特に大規模データセットでは収集が難しいトレーニングのための基礎的真理を必要とする。
近年では教師なし学習法が提案され、満足度の高い結果が得られたが、これらの手法は様々な照明を受ける画素単位の光度整合性に依存するため、弱テクスチャ面などの難解な場面において、相変わらず再現に失敗している。
そこで本研究では,多視点画像下での制約を活かしたロバストな損失関数を提案する。
1) 多視点類似度測定における特徴の受容場を拡大するパッチワイド光度整合損失。
2) ロバストな2ビュー幾何一貫性:最小のオクルージョンによるクロスビュー深度の一貫性チェックを含む。
教師なし戦略は任意の深さ推定フレームワークで実装でき、任意の大規模なmvsデータセットでトレーニングできます。
実験の結果,提案手法は一致したあいまいさを低減し,特に弱テクスチャ復元の完全性を向上させることができることがわかった。
さらに,本手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
コードはまもなくリリースされる。
関連論文リスト
- SD-MVS: Segmentation-Driven Deformation Multi-View Stereo with Spherical
Refinement and EM optimization [6.886220026399106]
テクスチャレス領域の3次元再構成における課題を解決するために,多視点ステレオ (SD-MVS) を導入する。
私たちは、シーン内のセグメンテーションインスタンスを区別するためにSAM(Segment Anything Model)を採用した最初の人です。
球面座標と正規点の勾配勾配と深度の画素方向探索間隔を組み合わせた独自の精細化戦略を提案する。
論文 参考訳(メタデータ) (2024-01-12T05:25:57Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - TSAR-MVS: Textureless-aware Segmentation and Correlative Refinement Guided Multi-View Stereo [3.6728185343140685]
テクスチャレス・アンド・コリレーティブ・リファインメント・ガイド付きマルチビューステレオ (TSAR-MVS) 法を提案する。
フィルター,精細化,セグメンテーションによる3次元再構成におけるテクスチャレス領域による課題を効果的に解決する。
ETH3D, Tanks & Temples および Strecha データセットの実験により,提案手法の優れた性能と強みが示された。
論文 参考訳(メタデータ) (2023-08-19T11:40:57Z) - Learning from Multi-Perception Features for Real-Word Image
Super-resolution [87.71135803794519]
入力画像の複数の知覚的特徴を利用する新しいSR手法MPF-Netを提案する。
本稿では,MPFEモジュールを組み込んで,多様な知覚情報を抽出する手法を提案する。
また、モデルの学習能力を向上する対照的な正規化項(CR)も導入する。
論文 参考訳(メタデータ) (2023-05-26T07:35:49Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Towards Unpaired Depth Enhancement and Super-Resolution in the Wild [121.96527719530305]
最先端のデータ駆動による深度マップの超解像法は、同じシーンの低解像度と高解像度の深度マップの登録ペアに依存している。
未経験データからの学習に基づく深度マップの強化について考察する。
論文 参考訳(メタデータ) (2021-05-25T16:19:16Z) - 3D Human Pose, Shape and Texture from Low-Resolution Images and Videos [107.36352212367179]
本稿では,解像度認識ネットワーク,自己スーパービジョン損失,コントラスト学習スキームからなるrsc-netを提案する。
提案手法は1つのモデルで異なる解像度で3次元物体のポーズと形状を学習できる。
低解像度映像を扱うRSC-Netを拡張し、低解像度入力からテクスチャ化された3D歩行者の再構築に適用します。
論文 参考訳(メタデータ) (2021-03-11T06:52:12Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Self-Supervised Monocular 3D Face Reconstruction by Occlusion-Aware
Multi-view Geometry Consistency [40.56510679634943]
マルチビュー幾何整合性を利用した自己教師付きトレーニングアーキテクチャを提案する。
画素の整合性損失,奥行きの整合性損失,顔のランドマークに基づくエピポーラロスを含む,多視点整合性のための3つの新しい損失関数を設計する。
提案手法は精度が高く,特に多彩な表現,ポーズ,照明条件下では堅牢である。
論文 参考訳(メタデータ) (2020-07-24T12:36:09Z) - Towards Better Generalization: Joint Depth-Pose Learning without PoseNet [36.414471128890284]
自己教師型共同深層学習におけるスケール不整合の本質的問題に対処する。
既存の手法の多くは、全ての入力サンプルで一貫した深さとポーズを学習できると仮定している。
本稿では,ネットワーク推定からスケールを明示的に切り離す新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-04-03T00:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。