論文の概要: Booster: a Benchmark for Depth from Images of Specular and Transparent
Surfaces
- arxiv url: http://arxiv.org/abs/2301.08245v1
- Date: Thu, 19 Jan 2023 18:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-20 14:14:59.035067
- Title: Booster: a Benchmark for Depth from Images of Specular and Transparent
Surfaces
- Title(参考訳): Booster: スペックと透明な表面の画像の深さのベンチマーク
- Authors: Pierluigi Zama Ramirez, Alex Costanzino, Fabio Tosi, Matteo Poggi,
Samuele Salti, Stefano Mattoccia, Luigi Di Stefano
- Abstract要約: 本研究では,高分解能で高精度かつ高密度な地下構造ラベルを含む新しいデータセットを提案する。
我々の買収パイプラインは、新しい時空ステレオフレームワークを活用している。
データセットは85の異なるシーンで収集された606のサンプルで構成されている。
- 参考スコア(独自算出の注目度): 46.51297977960658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating depth from images nowadays yields outstanding results, both in
terms of in-domain accuracy and generalization. However, we identify two main
challenges that remain open in this field: dealing with non-Lambertian
materials and effectively processing high-resolution images. Purposely, we
propose a novel dataset that includes accurate and dense ground-truth labels at
high resolution, featuring scenes containing several specular and transparent
surfaces. Our acquisition pipeline leverages a novel deep space-time stereo
framework, enabling easy and accurate labeling with sub-pixel precision. The
dataset is composed of 606 samples collected in 85 different scenes, each
sample includes both a high-resolution pair (12 Mpx) as well as an unbalanced
stereo pair (Left: 12 Mpx, Right: 1.1 Mpx). Additionally, we provide manually
annotated material segmentation masks and 15K unlabeled samples. We divide the
dataset into a training set, and two testing sets, the latter devoted to the
evaluation of stereo and monocular depth estimation networks respectively to
highlight the open challenges and future research directions in this field.
- Abstract(参考訳): 画像から深度を推定すると、領域内精度と一般化の両面で優れた結果が得られる。
しかし,この領域では,非ランベルト材料を扱うこと,高解像度画像を効果的に処理すること,という2つの課題が解決されている。
そこで本研究では,高解像度で高精度かつ高密度な地下トラスラベルを含む新しいデータセットを提案する。
我々の獲得パイプラインは、新しい時空ステレオフレームワークを活用し、サブピクセル精度で簡単かつ正確なラベリングを可能にする。
データセットは85の異なるシーンで収集された606個のサンプルで構成され、それぞれのサンプルは高解像度のペア(12 Mpx)とアンバランスのステレオペア(12 Mpx, Right: 1.1 Mpx)の両方を含む。
さらに,手動でアノテートした材料セグメンテーションマスクと15Kの未ラベルサンプルも提供する。
データセットをトレーニングセットに分割し、2つのテストセット、後者はステレオとモノクルの深さ推定ネットワークの評価に向け、この分野におけるオープンな課題と今後の研究方向性を明らかにする。
関連論文リスト
- Pluralistic Salient Object Detection [108.74650817891984]
本稿では,与えられた入力画像に対して,複数の有意な有意な有意な有意な有意な有意な分割結果を生成することを目的とした新しい課題であるPSOD(multiistic Salient Object Detection)を紹介する。
新たに設計された評価指標とともに,2つのSODデータセット "DUTS-MM" と "DUS-MQ" を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:38:37Z) - PanBench: Towards High-Resolution and High-Performance Pansharpening [16.16122045172545]
パンシャーペニングでは、高解像度のマルチスペクトル画像と高解像度のパンクロマティック画像を統合することで、高解像度で多スペクトル情報を保持するイメージを合成する。
本稿では,主眼衛星を含む高解像度マルチシーンデータセットであるPanBenchを紹介する。
高忠実度合成を実現するために,Pansharpening のための Cascaded Multiscale Fusion Network (CMFNet) を提案する。
論文 参考訳(メタデータ) (2023-11-20T10:57:23Z) - High-Resolution Synthetic RGB-D Datasets for Monocular Depth Estimation [3.349875948009985]
我々は、GTA-V(Grand Theft Auto)から1920×1080の高解像度合成深度データセット(HRSD)を生成する。
実験と解析のために,提案した合成データセットに基づいて,最先端の変換器に基づくMDEアルゴリズムであるDPTアルゴリズムを訓練し,異なるシーンにおける深度マップの精度を9%向上させる。
論文 参考訳(メタデータ) (2023-05-02T19:03:08Z) - MonoGraspNet: 6-DoF Grasping with a Single RGB Image [73.96707595661867]
6-DoFロボットの把握は長続きするが未解決の問題だ。
近年の手法では3次元ネットワークを用いて深度センサから幾何的把握表現を抽出している。
我々はMonoGraspNetと呼ばれるRGBのみの6-DoFグルーピングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-09-26T21:29:50Z) - A Multi-purpose Real Haze Benchmark with Quantifiable Haze Levels and
Ground Truth [61.90504318229845]
本稿では,ハズフリー画像とその場でのハズ密度測定を併用した,最初の実画像ベンチマークデータセットを提案する。
このデータセットはコントロールされた環境で生成され、プロの煙発生装置がシーン全体を覆っている。
このデータセットのサブセットは、CVPR UG2 2022 チャレンジの Haze Track における Object Detection に使用されている。
論文 参考訳(メタデータ) (2022-06-13T19:14:06Z) - Open Challenges in Deep Stereo: the Booster Dataset [49.28588927121722]
そこで本研究では,高分解能で挑戦的なステレオ・データセット・フレーミング・屋内シーンについて,高密度かつ高精度な地上構造差を付加したアノテートを提示する。
私たちのデータセットには、いくつかの分光面と透明な面が存在する。
我々は64の異なるシーンで収集された合計419のサンプルを公開し、高密度な地道不一致で注釈付けした。
論文 参考訳(メタデータ) (2022-06-09T17:59:56Z) - LIGHTS: LIGHT Specularity Dataset for specular detection in Multi-view [12.612981566441908]
本研究では,新たな物理ベースレンダリングされたLIGHT Specularity(SLIGHT)データセットを提案する。
私たちのデータセットは、各シーンが複数のビューでレンダリングされる18の高品質の建築シーンで構成されています。
合計で2,603のビューがあり、1シーンあたり平均145のビューがあります。
論文 参考訳(メタデータ) (2021-01-26T13:26:49Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。