論文の概要: Exploiting Correspondences with All-pairs Correlations for Multi-view
Depth Estimation
- arxiv url: http://arxiv.org/abs/2205.02481v1
- Date: Thu, 5 May 2022 07:38:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-06 14:56:12.090788
- Title: Exploiting Correspondences with All-pairs Correlations for Multi-view
Depth Estimation
- Title(参考訳): 多視点深度推定のための全ペア相関対応の活用
- Authors: Kai Cheng, Hao Chen, Wei Yin, Guangkai Xu, Xuejin Chen
- Abstract要約: 多視点深度推定は,3次元世界を再構築し,理解する上で重要な役割を担っている。
最適化過程を模倣した新しい反復的多視点深度推定フレームワークを設計する。
ScanNet,DeMoN,ETH3D,および7Scenesについて十分な実験を行い,本手法の優位性を実証した。
- 参考スコア(独自算出の注目度): 19.647670347925754
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-view depth estimation plays a critical role in reconstructing and
understanding the 3D world. Recent learning-based methods have made significant
progress in it. However, multi-view depth estimation is fundamentally a
correspondence-based optimization problem, but previous learning-based methods
mainly rely on predefined depth hypotheses to build correspondence as the cost
volume and implicitly regularize it to fit depth prediction, deviating from the
essence of iterative optimization based on stereo correspondence. Thus, they
suffer unsatisfactory precision and generalization capability. In this paper,
we are the first to explore more general image correlations to establish
correspondences dynamically for depth estimation. We design a novel iterative
multi-view depth estimation framework mimicking the optimization process, which
consists of 1) a correlation volume construction module that models the pixel
similarity between a reference image and source images as all-to-all
correlations; 2) a flow-based depth initialization module that estimates the
depth from the 2D optical flow; 3) a novel correlation-guided depth refinement
module that reprojects points in different views to effectively fetch relevant
correlations for further fusion and integrate the fused correlation for
iterative depth update. Without predefined depth hypotheses, the fused
correlations establish multi-view correspondence in an efficient way and guide
the depth refinement heuristically. We conduct sufficient experiments on
ScanNet, DeMoN, ETH3D, and 7Scenes to demonstrate the superiority of our method
on multi-view depth estimation and its best generalization ability.
- Abstract(参考訳): 多視点深度推定は3次元世界の再構築と理解において重要な役割を果たす。
近年の学習手法は大きな進歩を遂げている。
しかしながら、マルチビュー深度推定は、基本的に対応ベース最適化問題であるが、従来の学習ベース手法では、ステレオ対応に基づく反復最適化の本質から逸脱して、コストボリュームとして対応性を構築して暗黙的に正規化する事前定義された奥行き仮説に主に依存している。
したがって、それらは不十分な正確さと一般化能力に苦しむ。
本稿では,より一般的な画像相関を探索し,深度推定のために動的に対応性を確立する。
我々は最適化過程を模倣した新しい反復多視点深度推定フレームワークを設計する。
1)基準画像と原画像との画素類似性を全対全相関としてモデル化する相関ボリューム構成モジュール
2) 2次元の光学的流れから深さを推定する流れに基づく深さ初期化モジュール
3) 異なる視点の点を再投影し, さらなる融合のための関連相関を効果的に取得し, 繰り返し深度更新のための融合相関を統合する新しい相関誘導深度改善モジュール。
事前定義された深度仮説がなければ、融合された相関関係は効率的な方法で多視点対応を確立し、深度改善をヒューリスティックに導く。
ScanNet,DeMoN,ETH3D,および7Scenesについて十分な実験を行い,多視点深度推定における手法の優位性とその最適化能力を示す。
関連論文リスト
- DepthSplat: Connecting Gaussian Splatting and Depth [90.06180236292866]
ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
まず,事前学習した単眼深度特徴を生かして,頑健な多眼深度モデルを提案する。
また,ガウス的スプラッティングは教師なし事前学習の目的として機能することを示す。
論文 参考訳(メタデータ) (2024-10-17T17:59:58Z) - DCPI-Depth: Explicitly Infusing Dense Correspondence Prior to Unsupervised Monocular Depth Estimation [17.99904937160487]
DCPI-Depthは、これらの革新的なコンポーネントをすべて組み込んで、2つの双方向および協調的なストリームを結合するフレームワークである。
複数の公開データセットにまたがる最先端のパフォーマンスと一般化性を実現し、既存のすべての先行技術を上回っている。
論文 参考訳(メタデータ) (2024-05-27T08:55:17Z) - FS-Depth: Focal-and-Scale Depth Estimation from a Single Image in Unseen
Indoor Scene [57.26600120397529]
実際の(見えない)屋内シーンの単一の画像から絶対深度マップを予測するのには、長年不適切な問題だった。
本研究では,未確認屋内シーンの単一画像から絶対深度マップを正確に学習するための焦点・スケール深度推定モデルを開発した。
論文 参考訳(メタデータ) (2023-07-27T04:49:36Z) - Depth Refinement for Improved Stereo Reconstruction [13.941756438712382]
立体画像からの深度推定の現在の技術は、なおも内蔵の欠点に悩まされている。
簡単な解析により、深度誤差は物体の距離に2乗比例することが明らかになった。
本研究では,深度推定に改良ネットワークを用いた簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-12-15T12:21:08Z) - VolumeFusion: Deep Depth Fusion for 3D Scene Reconstruction [71.83308989022635]
本稿では、ディープニューラルネットワークを用いた従来の2段階フレームワークの複製により、解釈可能性と結果の精度が向上することを提唱する。
ネットワークは,1)深部MVS技術を用いた局所深度マップの局所計算,2)深部マップと画像の特徴を融合させて単一のTSDFボリュームを構築する。
異なる視点から取得した画像間のマッチング性能を改善するために,PosedConvと呼ばれる回転不変な3D畳み込みカーネルを導入する。
論文 参考訳(メタデータ) (2021-08-19T11:33:58Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Depth-conditioned Dynamic Message Propagation for Monocular 3D Object
Detection [86.25022248968908]
モノラル3Dオブジェクト検出の問題を解決するために、コンテキストと奥行きを認識する特徴表現を学びます。
KITTIベンチマークデータセットにおける単眼的アプローチにおける最新の結果を示す。
論文 参考訳(メタデータ) (2021-03-30T16:20:24Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Towards Better Generalization: Joint Depth-Pose Learning without PoseNet [36.414471128890284]
自己教師型共同深層学習におけるスケール不整合の本質的問題に対処する。
既存の手法の多くは、全ての入力サンプルで一貫した深さとポーズを学習できると仮定している。
本稿では,ネットワーク推定からスケールを明示的に切り離す新しいシステムを提案する。
論文 参考訳(メタデータ) (2020-04-03T00:28:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。