論文の概要: Booster: a Benchmark for Depth from Images of Specular and Transparent
Surfaces
- arxiv url: http://arxiv.org/abs/2301.08245v1
- Date: Thu, 19 Jan 2023 18:59:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-20 14:14:59.035067
- Title: Booster: a Benchmark for Depth from Images of Specular and Transparent
Surfaces
- Title(参考訳): Booster: スペックと透明な表面の画像の深さのベンチマーク
- Authors: Pierluigi Zama Ramirez, Alex Costanzino, Fabio Tosi, Matteo Poggi,
Samuele Salti, Stefano Mattoccia, Luigi Di Stefano
- Abstract要約: 本研究では,高分解能で高精度かつ高密度な地下構造ラベルを含む新しいデータセットを提案する。
我々の買収パイプラインは、新しい時空ステレオフレームワークを活用している。
データセットは85の異なるシーンで収集された606のサンプルで構成されている。
- 参考スコア(独自算出の注目度): 46.51297977960658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating depth from images nowadays yields outstanding results, both in
terms of in-domain accuracy and generalization. However, we identify two main
challenges that remain open in this field: dealing with non-Lambertian
materials and effectively processing high-resolution images. Purposely, we
propose a novel dataset that includes accurate and dense ground-truth labels at
high resolution, featuring scenes containing several specular and transparent
surfaces. Our acquisition pipeline leverages a novel deep space-time stereo
framework, enabling easy and accurate labeling with sub-pixel precision. The
dataset is composed of 606 samples collected in 85 different scenes, each
sample includes both a high-resolution pair (12 Mpx) as well as an unbalanced
stereo pair (Left: 12 Mpx, Right: 1.1 Mpx). Additionally, we provide manually
annotated material segmentation masks and 15K unlabeled samples. We divide the
dataset into a training set, and two testing sets, the latter devoted to the
evaluation of stereo and monocular depth estimation networks respectively to
highlight the open challenges and future research directions in this field.
- Abstract(参考訳): 画像から深度を推定すると、領域内精度と一般化の両面で優れた結果が得られる。
しかし,この領域では,非ランベルト材料を扱うこと,高解像度画像を効果的に処理すること,という2つの課題が解決されている。
そこで本研究では,高解像度で高精度かつ高密度な地下トラスラベルを含む新しいデータセットを提案する。
我々の獲得パイプラインは、新しい時空ステレオフレームワークを活用し、サブピクセル精度で簡単かつ正確なラベリングを可能にする。
データセットは85の異なるシーンで収集された606個のサンプルで構成され、それぞれのサンプルは高解像度のペア(12 Mpx)とアンバランスのステレオペア(12 Mpx, Right: 1.1 Mpx)の両方を含む。
さらに,手動でアノテートした材料セグメンテーションマスクと15Kの未ラベルサンプルも提供する。
データセットをトレーニングセットに分割し、2つのテストセット、後者はステレオとモノクルの深さ推定ネットワークの評価に向け、この分野におけるオープンな課題と今後の研究方向性を明らかにする。
関連論文リスト
- PanBench: Towards High-Resolution and High-Performance Pansharpening [16.16122045172545]
パンシャーペニングでは、高解像度のマルチスペクトル画像と高解像度のパンクロマティック画像を統合することで、高解像度で多スペクトル情報を保持するイメージを合成する。
本稿では,主眼衛星を含む高解像度マルチシーンデータセットであるPanBenchを紹介する。
高忠実度合成を実現するために,Pansharpening のための Cascaded Multiscale Fusion Network (CMFNet) を提案する。
論文 参考訳(メタデータ) (2023-11-20T10:57:23Z) - Learning Depth Estimation for Transparent and Mirror Surfaces [46.07527228487614]
透明またはミラー(ToM)表面の深さを推定することは、センサー、アルゴリズム、またはディープネットワークにとって難しい課題である。
本稿では,ニューラルネットワークを用いた表面の深度を適切に推定する簡単なパイプラインを提案する。
論文 参考訳(メタデータ) (2023-07-27T17:57:06Z) - High-Resolution Synthetic RGB-D Datasets for Monocular Depth Estimation [3.349875948009985]
我々は、GTA-V(Grand Theft Auto)から1920×1080の高解像度合成深度データセット(HRSD)を生成する。
実験と解析のために,提案した合成データセットに基づいて,最先端の変換器に基づくMDEアルゴリズムであるDPTアルゴリズムを訓練し,異なるシーンにおける深度マップの精度を9%向上させる。
論文 参考訳(メタデータ) (2023-05-02T19:03:08Z) - MonoGraspNet: 6-DoF Grasping with a Single RGB Image [73.96707595661867]
6-DoFロボットの把握は長続きするが未解決の問題だ。
近年の手法では3次元ネットワークを用いて深度センサから幾何的把握表現を抽出している。
我々はMonoGraspNetと呼ばれるRGBのみの6-DoFグルーピングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-09-26T21:29:50Z) - A Multi-purpose Real Haze Benchmark with Quantifiable Haze Levels and
Ground Truth [61.90504318229845]
本稿では,ハズフリー画像とその場でのハズ密度測定を併用した,最初の実画像ベンチマークデータセットを提案する。
このデータセットはコントロールされた環境で生成され、プロの煙発生装置がシーン全体を覆っている。
このデータセットのサブセットは、CVPR UG2 2022 チャレンジの Haze Track における Object Detection に使用されている。
論文 参考訳(メタデータ) (2022-06-13T19:14:06Z) - Open Challenges in Deep Stereo: the Booster Dataset [49.28588927121722]
そこで本研究では,高分解能で挑戦的なステレオ・データセット・フレーミング・屋内シーンについて,高密度かつ高精度な地上構造差を付加したアノテートを提示する。
私たちのデータセットには、いくつかの分光面と透明な面が存在する。
我々は64の異なるシーンで収集された合計419のサンプルを公開し、高密度な地道不一致で注釈付けした。
論文 参考訳(メタデータ) (2022-06-09T17:59:56Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - LIGHTS: LIGHT Specularity Dataset for specular detection in Multi-view [12.612981566441908]
本研究では,新たな物理ベースレンダリングされたLIGHT Specularity(SLIGHT)データセットを提案する。
私たちのデータセットは、各シーンが複数のビューでレンダリングされる18の高品質の建築シーンで構成されています。
合計で2,603のビューがあり、1シーンあたり平均145のビューがあります。
論文 参考訳(メタデータ) (2021-01-26T13:26:49Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。