論文の概要: Open Challenges in Deep Stereo: the Booster Dataset
- arxiv url: http://arxiv.org/abs/2206.04671v1
- Date: Thu, 9 Jun 2022 17:59:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-10 14:38:11.007671
- Title: Open Challenges in Deep Stereo: the Booster Dataset
- Title(参考訳): Deep Stereoのオープンチャレンジ - ブースターデータセット
- Authors: Pierluigi Zama Ramirez, Fabio Tosi, Matteo Poggi, Samuele Salti,
Stefano Mattoccia, Luigi Di Stefano
- Abstract要約: そこで本研究では,高分解能で挑戦的なステレオ・データセット・フレーミング・屋内シーンについて,高密度かつ高精度な地上構造差を付加したアノテートを提示する。
私たちのデータセットには、いくつかの分光面と透明な面が存在する。
我々は64の異なるシーンで収集された合計419のサンプルを公開し、高密度な地道不一致で注釈付けした。
- 参考スコア(独自算出の注目度): 49.28588927121722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel high-resolution and challenging stereo dataset framing
indoor scenes annotated with dense and accurate ground-truth disparities.
Peculiar to our dataset is the presence of several specular and transparent
surfaces, i.e. the main causes of failures for state-of-the-art stereo
networks. Our acquisition pipeline leverages a novel deep space-time stereo
framework which allows for easy and accurate labeling with sub-pixel precision.
We release a total of 419 samples collected in 64 different scenes and
annotated with dense ground-truth disparities. Each sample include a
high-resolution pair (12 Mpx) as well as an unbalanced pair (Left: 12 Mpx,
Right: 1.1 Mpx). Additionally, we provide manually annotated material
segmentation masks and 15K unlabeled samples. We evaluate state-of-the-art deep
networks based on our dataset, highlighting their limitations in addressing the
open challenges in stereo and drawing hints for future research.
- Abstract(参考訳): 本稿では,室内シーンを高精細で高精度な地中差にアノテートした,新しい高分解能・難解なステレオデータセットを提案する。
私たちのデータセットには、いくつかの特異かつ透明な表面、すなわち最先端ステレオネットワークの障害の主な原因が存在する。
われわれの買収パイプラインは、新しい深部時空ステレオフレームワークを活用しており、ピクセル以下の精度で簡単に正確なラベル付けができる。
64の異なるシーンで合計419のサンプルを収集し,密接な地中差を付記した。
各試料には高分解能対(12 Mpx)と非平衡対(12 Mpx, Right: 1.1 Mpx)が含まれる。
さらに,手動でアノテートした材料セグメンテーションマスクと15Kの未ラベルサンプルも提供する。
我々は,我々のデータセットに基づいて最先端の深層ネットワークを評価し,ステレオのオープン課題への対処の限界と今後の研究へのヒントを強調した。
関連論文リスト
- Depth-aware Volume Attention for Texture-less Stereo Matching [67.46404479356896]
実用的な屋外シナリオにおけるテクスチャ劣化に対処する軽量なボリューム改善手法を提案する。
画像テクスチャの相対的階層を抽出し,地中深度マップによって教師される深度体積を導入する。
局所的な微細構造と文脈は、体積凝集時のあいまいさと冗長性を緩和するために強調される。
論文 参考訳(メタデータ) (2024-02-14T04:07:44Z) - High-Resolution Synthetic RGB-D Datasets for Monocular Depth Estimation [3.349875948009985]
我々は、GTA-V(Grand Theft Auto)から1920×1080の高解像度合成深度データセット(HRSD)を生成する。
実験と解析のために,提案した合成データセットに基づいて,最先端の変換器に基づくMDEアルゴリズムであるDPTアルゴリズムを訓練し,異なるシーンにおける深度マップの精度を9%向上させる。
論文 参考訳(メタデータ) (2023-05-02T19:03:08Z) - Booster: a Benchmark for Depth from Images of Specular and Transparent
Surfaces [49.44971010149331]
本研究では,高分解能で高精度かつ高密度な地下構造ラベルを含む新しいデータセットを提案する。
我々の買収パイプラインは、新しい時空ステレオフレームワークを活用している。
データセットは85の異なるシーンで収集された606のサンプルで構成されている。
論文 参考訳(メタデータ) (2023-01-19T18:59:28Z) - iNNformant: Boundary Samples as Telltale Watermarks [68.8204255655161]
4つの試験されたマイクロアーキテクチャのいずれかを識別できる境界サンプルの集合を生成することができることを示す。
これらのセットは70dBよりも悪いピーク信号-雑音比のサンプルを含まないように構築することができる。
論文 参考訳(メタデータ) (2021-06-14T11:18:32Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - LIGHTS: LIGHT Specularity Dataset for specular detection in Multi-view [12.612981566441908]
本研究では,新たな物理ベースレンダリングされたLIGHT Specularity(SLIGHT)データセットを提案する。
私たちのデータセットは、各シーンが複数のビューでレンダリングされる18の高品質の建築シーンで構成されています。
合計で2,603のビューがあり、1シーンあたり平均145のビューがあります。
論文 参考訳(メタデータ) (2021-01-26T13:26:49Z) - A Flow Base Bi-path Network for Cross-scene Video Crowd Understanding in
Aerial View [93.23947591795897]
本稿では,これらの課題に対処し,ドローンから収集した視覚的データから参加者を自動的に理解する。
クロスシーンテストで発生する背景雑音を軽減するために, 二重ストリーム群カウントモデルを提案する。
極暗環境下での集団密度推定問題に対処するために,ゲームグランドセフトオートV(GTAV)によって生成された合成データを導入する。
論文 参考訳(メタデータ) (2020-09-29T01:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。