論文の概要: Zero-Shot Depth from Defocus
- arxiv url: http://arxiv.org/abs/2603.26658v1
- Date: Fri, 27 Mar 2026 17:56:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.631549
- Title: Zero-Shot Depth from Defocus
- Title(参考訳): Defocus (複数形 Defocuss)
- Authors: Yiming Zuo, Hongyu Wen, Venkat Subramanian, Patrick Chen, Karhan Kayan, Mario Bijelic, Felix Heide, Jia Deng,
- Abstract要約: Defocus (DfD) からの深さは、焦点スタックから密度計量深度マップを推定するタスクである。
本稿ではゼロショット一般化の挑戦的で実践的な設定に焦点を当てる。
まず、実世界のDfDベンチマークであるZEDDを提案する。このベンチマークでは、以前のベンチマークと比べて8.3倍のシーンと、かなり高品質な画像と地上深度マップが提供されている。
- 参考スコア(独自算出の注目度): 43.62160290661175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth from Defocus (DfD) is the task of estimating a dense metric depth map from a focus stack. Unlike previous works overfitting to a certain dataset, this paper focuses on the challenging and practical setting of zero-shot generalization. We first propose a new real-world DfD benchmark ZEDD, which contains 8.3x more scenes and significantly higher quality images and ground-truth depth maps compared to previous benchmarks. We also design a novel network architecture named FOSSA. FOSSA is a Transformer-based architecture with novel designs tailored to the DfD task. The key contribution is a stack attention layer with a focus distance embedding, allowing efficient information exchange across the focus stack. Finally, we develop a new training data pipeline allowing us to utilize existing large-scale RGBD datasets to generate synthetic focus stacks. Experiment results on ZEDD and other benchmarks show a significant improvement over the baselines, reducing errors by up to 55.7%. The ZEDD benchmark is released at https://zedd.cs.princeton.edu. The code and checkpoints are released at https://github.com/princeton-vl/FOSSA.
- Abstract(参考訳): Defocus (DfD) からの深さは、焦点スタックから密度計量深度マップを推定するタスクである。
本論文は, あるデータセットに過剰に適合する以前の研究とは異なり, ゼロショット一般化の挑戦的で実践的な設定に焦点を当てる。
まず、実世界のDfDベンチマークであるZEDDを提案する。このベンチマークでは、以前のベンチマークと比べて8.3倍のシーンと、かなり高品質な画像と地上深度マップが提供されている。
また、FOSSAという新しいネットワークアーキテクチャも設計する。
FOSSAはトランスフォーマーベースのアーキテクチャで、DfDタスクに合わせた新しい設計である。
重要なコントリビューションは、フォーカス距離を埋め込んだスタックアテンション層であり、フォーカススタック間の効率的な情報交換を可能にする。
最後に,既存の大規模RGBDデータセットを利用して合成フォーカススタックを生成するための,新たなトレーニングデータパイプラインを開発した。
ZEDDや他のベンチマークの実験結果は、ベースラインよりも大幅に改善され、エラーを最大55.7%削減した。
ZEDDベンチマークはhttps://zedd.cs.princeton.eduで公開されている。
コードとチェックポイントはhttps://github.com/princeton-vl/FOSSAで公開されている。
関連論文リスト
- Emphasizing Discriminative Features for Dataset Distillation in Complex Scenarios [60.470289963986716]
合成画像における重要な識別領域を強化するデータセット蒸留法であるEDFを提案する。
単純なデータセットでは、高活性化領域が画像の大部分を占めるのに対して、複雑なシナリオでは、これらの領域のサイズはずっと小さくなります。
特にEDFは、ImageNet-1Kサブセットのような複雑なシナリオにおいて、SOTAの結果を一貫して上回る。
論文 参考訳(メタデータ) (2024-10-22T17:13:19Z) - HybridDepth: Robust Metric Depth Fusion by Leveraging Depth from Focus and Single-Image Priors [10.88048563201236]
本稿では,深度推定における重要な課題に対処する頑健な深度推定パイプラインHYBRIDDEPTHを提案する。
HYBRIDDEPTHは、一般的なモバイルデバイスで便利なデータである焦点スタックを活用して、正確な距離深度マップを生成する。
包括的定量的および定性的分析により、HYBRIDDEPTHは最先端(SOTA)モデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-07-26T00:51:52Z) - PointRegGPT: Boosting 3D Point Cloud Registration using Generative Point-Cloud Pairs for Training [90.06520673092702]
生成点クラウドペアを用いた3Dポイントクラウドの登録をトレーニングのために促進するPointRegGPTを提案する。
我々の知る限り、これは屋内のクラウド登録のためのリアルなデータ生成を探求する最初の生成的アプローチである。
論文 参考訳(メタデータ) (2024-07-19T06:29:57Z) - OGNI-DC: Robust Depth Completion with Optimization-Guided Neural Iterations [23.0962036039182]
OGNI(Optimization-Guided Neural Iterations)は深度補正のための新しいフレームワークである。
OGNI-DCは強力な一般化を示し、目に見えないデータセットのベースラインと、さまざまな空間レベルのベースラインを上回ります。
精度が高く、NYUv2とKITTIベンチマークで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-06-17T16:30:29Z) - Defocus Blur Detection via Depth Distillation [64.78779830554731]
初めてDBDに深度情報を導入します。
より詳しくは, 地底の真理と, 十分に訓練された深度推定ネットワークから抽出した深度から, デフォーカスのぼかしを学習する。
我々の手法は、2つの一般的なデータセット上で11の最先端の手法より優れています。
論文 参考訳(メタデータ) (2020-07-16T04:58:09Z) - Single Image Depth Estimation Trained via Depth from Defocus Cues [105.67073923825842]
単一のRGB画像から深度を推定することはコンピュータビジョンの基本的な課題である。
この作業では、異なる視点ではなく、フォーカスキューからの奥行きに依存しています。
我々は,KITTIとMake3Dデータセットの教師あり手法と同等な結果を提示し,教師なし学習手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-14T20:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。