論文の概要: Learning Sub-Pixel Disparity Distribution for Light Field Depth
Estimation
- arxiv url: http://arxiv.org/abs/2208.09688v3
- Date: Tue, 21 Nov 2023 07:20:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 06:08:19.996190
- Title: Learning Sub-Pixel Disparity Distribution for Light Field Depth
Estimation
- Title(参考訳): 光深度推定のためのサブピクセル差分分布の学習
- Authors: Wentao Chao, Xuechun Wang, Yingqian Wang, Guanghui Wang, and Fuqing
Duan
- Abstract要約: 本稿では,ディープネットワークのパワーをフル活用して,サブピクセルの差分分布を学習するための,単純かつ効果的な手法を提案する。
提案手法は,HCI 4D LF Benchmarkにおける最近の最先端のLF深度アルゴリズムを4つの精度の指標で大きく上回っている。
- 参考スコア(独自算出の注目度): 16.966255245189114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Light field (LF) depth estimation plays a crucial role in many LF-based
applications. Existing LF depth estimation methods consider depth estimation as
a regression problem, where a pixel-wise L1 loss is employed to supervise the
training process. However, the disparity map is only a sub-space projection
(i.e., an expectation) of the disparity distribution, which is essential for
models to learn. In this paper, we propose a simple yet effective method to
learn the sub-pixel disparity distribution by fully utilizing the power of deep
networks, especially for LF of narrow baselines. We construct the cost volume
at the sub-pixel level to produce a finer disparity distribution and design an
uncertainty-aware focal loss to supervise the predicted disparity distribution
toward the ground truth. Extensive experimental results demonstrate the
effectiveness of our method.Our method significantly outperforms recent
state-of-the-art LF depth algorithms on the HCI 4D LF Benchmark in terms of all
four accuracy metrics (i.e., BadPix 0.01, BadPix 0.03, BadPix 0.07, and MSE
$\times$100). The code and model of the proposed method are available at
\url{https://github.com/chaowentao/SubFocal}.
- Abstract(参考訳): 光場(LF)深度推定は多くのLFベースアプリケーションにおいて重要な役割を果たす。
既存のLF深度推定法は、深度推定を回帰問題とみなし、画素単位のL1損失を用いてトレーニングプロセスを監督する。
しかし、不均等写像は不均等分布の部分空間射影(つまり予想)に過ぎず、これはモデルが学習するのに必須である。
本稿では,深層ネットワークのパワー,特に狭帯域ベースラインのlfを十分に活用して,低画素差分布を学習する簡易かつ効果的な手法を提案する。
サブピクセルレベルでのコストボリュームを構築し、より微細な不均一分布を発生させ、不確実性を考慮した焦点損失を設計し、予測された不均一分布を基底真実に向けて監督する。
我々の手法は,HCI 4D LF Benchmarkの4つの精度指標(BadPix 0.01,BadPix 0.03,BadPix 0.07,MSE $\times$100)において,最近の最先端LF深度アルゴリズムを著しく上回っている。
提案手法のコードとモデルは \url{https://github.com/chaowentao/subfocal} で利用可能である。
関連論文リスト
- Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Unsupervised Light Field Depth Estimation via Multi-view Feature
Matching with Occlusion Prediction [15.421219881815956]
監督訓練に十分な深度ラベルを得ることは費用がかかる。
本稿では,LF画像から深度を推定するための教師なしフレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-20T06:11:17Z) - IronDepth: Iterative Refinement of Single-View Depth using Surface
Normal and its Uncertainty [24.4764181300196]
本研究では,表面の正規化と不確実性を利用して予測深度マップを再現する新しいフレームワークを提案する。
提案手法は,NYUv2 と iBims-1 の深度および正規度の両面における最先端性能を示す。
論文 参考訳(メタデータ) (2022-10-07T16:34:20Z) - Non-parametric Depth Distribution Modelling based Depth Inference for
Multi-view Stereo [43.415242967722804]
最近のコストボリュームピラミッドに基づくディープニューラルネットワークは、多視点ステレオからの深度推論に高解像度の画像を効率的に活用する可能性を解き放った。
一般に、これらのアプローチは各ピクセルの深さが一様分布に従うと仮定する。
本研究では,非パラメトリック深度分布モデルを用いて,一様および多モード分布の画素を扱うコストボリュームを構築することを提案する。
論文 参考訳(メタデータ) (2022-05-08T05:13:04Z) - End-to-end Learning for Joint Depth and Image Reconstruction from
Diffracted Rotation [10.896567381206715]
回折回転から深度を学習する新しいエンド・ツー・エンド学習手法を提案する。
提案手法は, 単分子深度推定のタスクにおいて既存の手法よりもはるかに少ない複雑なモデルと少ないトレーニングデータを必要とする。
論文 参考訳(メタデータ) (2022-04-14T16:14:37Z) - Facial Depth and Normal Estimation using Single Dual-Pixel Camera [81.02680586859105]
DP指向のDepth/Normalネットワークを導入し,3次元顔形状を再構成する。
これは、メートル法スケールでの深度マップと表面正規を含む、対応する地上3次元モデルを含んでいる。
近年のDPベース深度/正規推定法で最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-11-25T05:59:27Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - Direct Depth Learning Network for Stereo Matching [79.3665881702387]
ステレオマッチングのための新しいダイレクトディープス学習ネットワーク(DDL-Net)が設計されている。
DDL-Netは、粗度推定段階と適応勾配深度補正段階の2段階からなる。
我々は,DDL-NetがSceneFlowデータセットで25%,DrivingStereoデータセットで12%の平均的な改善を実現していることを示す。
論文 参考訳(メタデータ) (2020-12-10T10:33:57Z) - Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement [156.18634427704583]
本稿では、深部ネットワークを用いた画像特異的曲線推定のタスクとして光強調を定式化するゼロ参照深部曲線推定法(Zero-DCE)を提案する。
提案手法は,DCE-Netという軽量な深層ネットワークをトレーニングし,画像のダイナミックレンジ調整のための画素幅と高次曲線を推定する。
論文 参考訳(メタデータ) (2020-01-19T13:49:15Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。