論文の概要: Deep PatchMatch MVS with Learned Patch Coplanarity, Geometric
Consistency and Adaptive Pixel Sampling
- arxiv url: http://arxiv.org/abs/2210.07582v1
- Date: Fri, 14 Oct 2022 07:29:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 16:50:42.523324
- Title: Deep PatchMatch MVS with Learned Patch Coplanarity, Geometric
Consistency and Adaptive Pixel Sampling
- Title(参考訳): Patch Coplanarity, Geometric Consistency, Adaptive Pixel Smpling を用いたDeep PatchMatch MVS
- Authors: Jae Yong Lee, Chuhang Zou, Derek Hoiem
- Abstract要約: 我々は、コプランナリティのパッチを学習し、幾何整合性を促進することにより、測光スコアを改善するための学習ベースのアプローチを構築した。
本稿では,より高解像度かつ高解像度なエンコーダでメモリを削減し,より大きな解像度でのトレーニングを可能にするための,適応的画素サンプリング戦略を提案する。
- 参考スコア(独自算出の注目度): 19.412014102866507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work in multi-view stereo (MVS) combines learnable photometric scores
and regularization with PatchMatch-based optimization to achieve robust
pixelwise estimates of depth, normals, and visibility. However, non-learning
based methods still outperform for large scenes with sparse views, in part due
to use of geometric consistency constraints and ability to optimize over many
views at high resolution. In this paper, we build on learning-based approaches
to improve photometric scores by learning patch coplanarity and encourage
geometric consistency by learning a scaled photometric cost that can be
combined with reprojection error. We also propose an adaptive pixel sampling
strategy for candidate propagation that reduces memory to enable training on
larger resolution with more views and a larger encoder. These modifications
lead to 6-15% gains in accuracy and completeness on the challenging ETH3D
benchmark, resulting in higher F1 performance than the widely used
state-of-the-art non-learning approaches ACMM and ACMP.
- Abstract(参考訳): マルチビューステレオ(MVS)における最近の研究は、学習可能な測光スコアと正則化をPatchMatchベースの最適化と組み合わせて、深度、正規度、可視性のピクセルワイドな推定を実現している。
しかし、非学習ベースの手法は、幾何的整合性制約と高解像度で多くのビューを最適化する能力によって、スパースビューの大きいシーンでは依然としてパフォーマンスが向上している。
本稿では,パッチのコプラナリティを学習することで測光スコアを改善するための学習に基づくアプローチを構築し,再投影誤差と組み合わせることができるスケールド測光コストを学習することで幾何的整合性を促進する。
また,より広い視野と大きなエンコーダでより大きな解像度でのトレーニングを可能にするため,メモリ削減のための適応的な画素サンプリング戦略を提案する。
これらの修正により、挑戦的なETH3Dベンチマークの精度と完全性が6-15%向上し、広く使われている最先端の非学習アプローチであるACMMやACMPよりも高いF1性能が得られる。
関連論文リスト
- SD-MVS: Segmentation-Driven Deformation Multi-View Stereo with Spherical
Refinement and EM optimization [6.886220026399106]
テクスチャレス領域の3次元再構成における課題を解決するために,多視点ステレオ (SD-MVS) を導入する。
私たちは、シーン内のセグメンテーションインスタンスを区別するためにSAM(Segment Anything Model)を採用した最初の人です。
球面座標と正規点の勾配勾配と深度の画素方向探索間隔を組み合わせた独自の精細化戦略を提案する。
論文 参考訳(メタデータ) (2024-01-12T05:25:57Z) - Adaptive Image Registration: A Hybrid Approach Integrating Deep Learning
and Optimization Functions for Enhanced Precision [13.242184146186974]
本稿では,ディープニューラルネットワークと最適化に基づく画像登録のための単一のフレームワークを提案する。
また, 実験データの最大1.6%の改善と, 同じ推定時間を維持しつつ, 変形場平滑化における1.0%の性能向上を示す。
論文 参考訳(メタデータ) (2023-11-27T02:48:06Z) - MP-MVS: Multi-Scale Windows PatchMatch and Planar Prior Multi-View
Stereo [7.130834755320434]
レジリエントで効果的なマルチビューステレオアプローチ(MP-MVS)を提案する。
マルチスケールウィンドウPatchMatch (mPM) を設計し, 信頼性の高い非テクスチャ領域の深さを求める。
他のマルチスケールアプローチとは対照的に、より高速で、PatchMatchベースのMVSアプローチに容易に拡張できる。
論文 参考訳(メタデータ) (2023-09-23T07:30:42Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - PatchMVSNet: Patch-wise Unsupervised Multi-View Stereo for
Weakly-Textured Surface Reconstruction [2.9896482273918434]
本稿では,多視点画像の制約を活かしたロバストな損失関数を提案し,あいまいさを緩和する。
我々の戦略は任意の深さ推定フレームワークで実装することができ、任意の大規模MVSデータセットでトレーニングすることができる。
提案手法は,DTU,タンク・アンド・テンプル,ETH3Dなどの一般的なベンチマーク上での最先端手法の性能に達する。
論文 参考訳(メタデータ) (2022-03-04T07:05:23Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - PatchMatch-RL: Deep MVS with Pixelwise Depth, Normal, and Visibility [23.427619869594437]
トレーニング可能なコストと正規化の利点を画素単位の推定と組み合わせた,エンドツーエンドのトレーニング可能なPatchMatchベースのMVSアプローチを提案する。
我々は、広く使われているMVSベンチマーク、ETH3D、タンク、テンプル(TnT)について評価する。
論文 参考訳(メタデータ) (2021-08-19T23:14:48Z) - An Adaptive Framework for Learning Unsupervised Depth Completion [59.17364202590475]
カラー画像から高密度深度マップとそれに伴うスパース深度測定を推定する手法を提案する。
正規化とコビジュアライゼーションは、モデルの適合度とデータによって関連付けられており、単一のフレームワークに統合可能であることを示す。
論文 参考訳(メタデータ) (2021-06-06T02:27:55Z) - Universal and Flexible Optical Aberration Correction Using Deep-Prior
Based Deconvolution [51.274657266928315]
そこで本研究では,収差画像とpsfマップを入力とし,レンズ固有深層プリエントを組み込んだ潜在高品質版を生成する,psf対応プラグイン・アンド・プレイ深層ネットワークを提案する。
具体的には、多彩なレンズの集合からベースモデルを事前訓練し、パラメータを迅速に精製して特定のレンズに適応させる。
論文 参考訳(メタデータ) (2021-04-07T12:00:38Z) - Depth image denoising using nuclear norm and learning graph model [107.51199787840066]
グループベース画像復元法は,パッチ間の類似性収集に有効である。
各パッチに対して、検索ウィンドウ内で最もよく似たパッチを見つけ、グループ化する。
提案手法は, 主観的, 客観的両面において, 最先端の復調法よりも優れている。
論文 参考訳(メタデータ) (2020-08-09T15:12:16Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。