Fugu-MT 論文翻訳(概要): Booster: a Benchmark for Depth from Images of Specular and Transparent Surfaces

論文の概要: Booster: a Benchmark for Depth from Images of Specular and Transparent Surfaces

arxiv url: http://arxiv.org/abs/2301.08245v1
Date: Thu, 19 Jan 2023 18:59:28 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-20 14:14:59.035067
Title: Booster: a Benchmark for Depth from Images of Specular and Transparent Surfaces
Title（参考訳）: Booster: スペックと透明な表面の画像の深さのベンチマーク
Authors: Pierluigi Zama Ramirez, Alex Costanzino, Fabio Tosi, Matteo Poggi, Samuele Salti, Stefano Mattoccia, Luigi Di Stefano
Abstract要約: 本研究では,高分解能で高精度かつ高密度な地下構造ラベルを含む新しいデータセットを提案する。我々の買収パイプラインは、新しい時空ステレオフレームワークを活用している。データセットは85の異なるシーンで収集された606のサンプルで構成されている。
参考スコア（独自算出の注目度）: 46.51297977960658
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Estimating depth from images nowadays yields outstanding results, both in terms of in-domain accuracy and generalization. However, we identify two main challenges that remain open in this field: dealing with non-Lambertian materials and effectively processing high-resolution images. Purposely, we propose a novel dataset that includes accurate and dense ground-truth labels at high resolution, featuring scenes containing several specular and transparent surfaces. Our acquisition pipeline leverages a novel deep space-time stereo framework, enabling easy and accurate labeling with sub-pixel precision. The dataset is composed of 606 samples collected in 85 different scenes, each sample includes both a high-resolution pair (12 Mpx) as well as an unbalanced stereo pair (Left: 12 Mpx, Right: 1.1 Mpx). Additionally, we provide manually annotated material segmentation masks and 15K unlabeled samples. We divide the dataset into a training set, and two testing sets, the latter devoted to the evaluation of stereo and monocular depth estimation networks respectively to highlight the open challenges and future research directions in this field.
Abstract（参考訳）: 画像から深度を推定すると、領域内精度と一般化の両面で優れた結果が得られる。しかし,この領域では,非ランベルト材料を扱うこと,高解像度画像を効果的に処理すること,という2つの課題が解決されている。そこで本研究では,高解像度で高精度かつ高密度な地下トラスラベルを含む新しいデータセットを提案する。我々の獲得パイプラインは、新しい時空ステレオフレームワークを活用し、サブピクセル精度で簡単かつ正確なラベリングを可能にする。データセットは85の異なるシーンで収集された606個のサンプルで構成され、それぞれのサンプルは高解像度のペア(12 Mpx)とアンバランスのステレオペア(12 Mpx, Right: 1.1 Mpx)の両方を含む。さらに,手動でアノテートした材料セグメンテーションマスクと15Kの未ラベルサンプルも提供する。データセットをトレーニングセットに分割し、2つのテストセット、後者はステレオとモノクルの深さ推定ネットワークの評価に向け、この分野におけるオープンな課題と今後の研究方向性を明らかにする。

関連論文リスト

Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation [18.8622645280467]
LayeredDepthは、実世界のベンチマークと合成データジェネレータを含む、多層深度アノテーションを備えた最初のデータセットである。我々のベンチマークは、様々なシーンから1,500枚の画像で構成され、その上で最先端の深度推定手法を評価することで、透明な物体に苦しむことを明らかにした。この合成データセットのみをトレーニングしたベースラインモデルは、優れたクロスドメイン多層深さ推定を生成する。
論文参考訳（メタデータ） (2025-03-14T17:52:06Z)
Helvipad: A Real-World Dataset for Omnidirectional Stereo Depth Estimation [83.841877607646]
全方位ステレオ深度推定のための実世界のデータセットであるHelvipadを紹介する。このデータセットは、3Dポイント雲を等方形画像に投影することで、正確な深度と不均質のラベルを含む。標準画像と全方位画像のステレオ深度推定モデルをベンチマークする。
論文参考訳（メタデータ） (2024-11-27T13:34:41Z)
Pluralistic Salient Object Detection [108.74650817891984]
本稿では,与えられた入力画像に対して,複数の有意な有意な有意な有意な有意な有意な分割結果を生成することを目的とした新しい課題であるPSOD(multiistic Salient Object Detection)を紹介する。新たに設計された評価指標とともに,2つのSODデータセット "DUTS-MM" と "DUS-MQ" を提案する。
論文参考訳（メタデータ） (2024-09-04T01:38:37Z)
PanBench: Towards High-Resolution and High-Performance Pansharpening [16.16122045172545]
パンシャーペニングでは、高解像度のマルチスペクトル画像と高解像度のパンクロマティック画像を統合することで、高解像度で多スペクトル情報を保持するイメージを合成する。本稿では,主眼衛星を含む高解像度マルチシーンデータセットであるPanBenchを紹介する。高忠実度合成を実現するために,Pansharpening のための Cascaded Multiscale Fusion Network (CMFNet) を提案する。
論文参考訳（メタデータ） (2023-11-20T10:57:23Z)
High-Resolution Synthetic RGB-D Datasets for Monocular Depth Estimation [3.349875948009985]
我々は、GTA-V(Grand Theft Auto)から1920×1080の高解像度合成深度データセット(HRSD)を生成する。実験と解析のために,提案した合成データセットに基づいて,最先端の変換器に基づくMDEアルゴリズムであるDPTアルゴリズムを訓練し,異なるシーンにおける深度マップの精度を9%向上させる。
論文参考訳（メタデータ） (2023-05-02T19:03:08Z)
MonoGraspNet: 6-DoF Grasping with a Single RGB Image [73.96707595661867]
6-DoFロボットの把握は長続きするが未解決の問題だ。近年の手法では3次元ネットワークを用いて深度センサから幾何的把握表現を抽出している。我々はMonoGraspNetと呼ばれるRGBのみの6-DoFグルーピングパイプラインを提案する。
論文参考訳（メタデータ） (2022-09-26T21:29:50Z)
A Multi-purpose Real Haze Benchmark with Quantifiable Haze Levels and Ground Truth [61.90504318229845]
本稿では,ハズフリー画像とその場でのハズ密度測定を併用した,最初の実画像ベンチマークデータセットを提案する。このデータセットはコントロールされた環境で生成され、プロの煙発生装置がシーン全体を覆っている。このデータセットのサブセットは、CVPR UG2 2022 チャレンジの Haze Track における Object Detection に使用されている。
論文参考訳（メタデータ） (2022-06-13T19:14:06Z)
Open Challenges in Deep Stereo: the Booster Dataset [49.28588927121722]
そこで本研究では,高分解能で挑戦的なステレオ・データセット・フレーミング・屋内シーンについて,高密度かつ高精度な地上構造差を付加したアノテートを提示する。私たちのデータセットには、いくつかの分光面と透明な面が存在する。我々は64の異なるシーンで収集された合計419のサンプルを公開し、高密度な地道不一致で注釈付けした。
論文参考訳（メタデータ） (2022-06-09T17:59:56Z)
LIGHTS: LIGHT Specularity Dataset for specular detection in Multi-view [12.612981566441908]
本研究では,新たな物理ベースレンダリングされたLIGHT Specularity(SLIGHT)データセットを提案する。私たちのデータセットは、各シーンが複数のビューでレンダリングされる18の高品質の建築シーンで構成されています。合計で2,603のビューがあり、1シーンあたり平均145のビューがあります。
論文参考訳（メタデータ） (2021-01-26T13:26:49Z)
Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文参考訳（メタデータ） (2020-01-18T12:26:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。