論文の概要: Learning Sub-Pixel Disparity Distribution for Light Field Depth
Estimation
- arxiv url: http://arxiv.org/abs/2208.09688v1
- Date: Sat, 20 Aug 2022 14:15:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:12:25.271378
- Title: Learning Sub-Pixel Disparity Distribution for Light Field Depth
Estimation
- Title(参考訳): 光深度推定のためのサブピクセル差分分布の学習
- Authors: Wentao Chao, Xuechun Wang, Yingqian Wang, Liang Chang, Fuqing Duan
- Abstract要約: 本稿では,ディープネットワークのパワーをフル活用して,サブピクセルの差分分布を学習するための,単純かつ効果的な手法を提案する。
提案手法はSubFocalと呼ばれ,HCI 4D LF Benchmarkで提案された99のアルゴリズムのうち,5つの精度指標のすべてにおいて第1位である。
- 参考スコア(独自算出の注目度): 11.524023244490648
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing light field (LF) depth estimation methods generally consider depth
estimation as a regression problem, supervised by a pixel-wise L1 loss between
the regressed disparity map and the groundtruth one. However, the disparity map
is only a sub-space projection (i.e., an expectation) of the disparity
distribution, while the latter one is more essential for models to learn. In
this paper, we propose a simple yet effective method to learn the sub-pixel
disparity distribution by fully utilizing the power of deep networks. In our
method, we construct the cost volume at sub-pixel level to produce a finer
depth distribution and design an uncertainty-aware focal loss to supervise the
disparity distribution to be close to the groundtruth one. Extensive
experimental results demonstrate the effectiveness of our method. Our method,
called SubFocal, ranks the first place among 99 submitted algorithms on the HCI
4D LF Benchmark in terms of all the five accuracy metrics (i.e., BadPix0.01,
BadPix0.03, BadPix0.07, MSE and Q25), and significantly outperforms recent
state-of-the-art LF depth methods such as OACC-Net and AttMLFNet. Code and
model are available at https://github.com/chaowentao/SubFocal.
- Abstract(参考訳): 既存の光場(LF)深度推定法は一般的に、奥行き推定を回帰問題とみなす。
しかし、不等式写像は不等式分布の部分空間射影(すなわち期待)のみであり、後者はモデルが学習する上でより重要である。
本稿では,ディープネットワークのパワーを十分に活用して,サブピクセルの差分布を学習する簡易かつ効果的な手法を提案する。
本手法では,サブピクセルレベルでのコストボリュームを構築し,より微細な深度分布を生成し,不確実性を考慮した焦点損失を設計し,その差分分布を基底部に近いものに監視する。
本手法の有効性を実験的に検証した。
本手法は,hci 4d lfベンチマークにおいて提出された99のアルゴリズムのうち,5つの精度指標(badpix0.01,badpix0.03,badpix0.07,mse,q25)で第1位をランク付けし,oacc-net や attmlfnet などの最新のlf深度法を有意に上回っている。
コードとモデルはhttps://github.com/chaowentao/subfocalで入手できる。
関連論文リスト
- Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Unsupervised Light Field Depth Estimation via Multi-view Feature
Matching with Occlusion Prediction [15.421219881815956]
監督訓練に十分な深度ラベルを得ることは費用がかかる。
本稿では,LF画像から深度を推定するための教師なしフレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-20T06:11:17Z) - IronDepth: Iterative Refinement of Single-View Depth using Surface
Normal and its Uncertainty [24.4764181300196]
本研究では,表面の正規化と不確実性を利用して予測深度マップを再現する新しいフレームワークを提案する。
提案手法は,NYUv2 と iBims-1 の深度および正規度の両面における最先端性能を示す。
論文 参考訳(メタデータ) (2022-10-07T16:34:20Z) - Non-parametric Depth Distribution Modelling based Depth Inference for
Multi-view Stereo [43.415242967722804]
最近のコストボリュームピラミッドに基づくディープニューラルネットワークは、多視点ステレオからの深度推論に高解像度の画像を効率的に活用する可能性を解き放った。
一般に、これらのアプローチは各ピクセルの深さが一様分布に従うと仮定する。
本研究では,非パラメトリック深度分布モデルを用いて,一様および多モード分布の画素を扱うコストボリュームを構築することを提案する。
論文 参考訳(メタデータ) (2022-05-08T05:13:04Z) - End-to-end Learning for Joint Depth and Image Reconstruction from
Diffracted Rotation [10.896567381206715]
回折回転から深度を学習する新しいエンド・ツー・エンド学習手法を提案する。
提案手法は, 単分子深度推定のタスクにおいて既存の手法よりもはるかに少ない複雑なモデルと少ないトレーニングデータを必要とする。
論文 参考訳(メタデータ) (2022-04-14T16:14:37Z) - Facial Depth and Normal Estimation using Single Dual-Pixel Camera [81.02680586859105]
DP指向のDepth/Normalネットワークを導入し,3次元顔形状を再構成する。
これは、メートル法スケールでの深度マップと表面正規を含む、対応する地上3次元モデルを含んでいる。
近年のDPベース深度/正規推定法で最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-11-25T05:59:27Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - Direct Depth Learning Network for Stereo Matching [79.3665881702387]
ステレオマッチングのための新しいダイレクトディープス学習ネットワーク(DDL-Net)が設計されている。
DDL-Netは、粗度推定段階と適応勾配深度補正段階の2段階からなる。
我々は,DDL-NetがSceneFlowデータセットで25%,DrivingStereoデータセットで12%の平均的な改善を実現していることを示す。
論文 参考訳(メタデータ) (2020-12-10T10:33:57Z) - Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement [156.18634427704583]
本稿では、深部ネットワークを用いた画像特異的曲線推定のタスクとして光強調を定式化するゼロ参照深部曲線推定法(Zero-DCE)を提案する。
提案手法は,DCE-Netという軽量な深層ネットワークをトレーニングし,画像のダイナミックレンジ調整のための画素幅と高次曲線を推定する。
論文 参考訳(メタデータ) (2020-01-19T13:49:15Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。