論文の概要: A Survey on RGB-D Datasets
- arxiv url: http://arxiv.org/abs/2201.05761v1
- Date: Sat, 15 Jan 2022 05:35:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-22 15:04:47.822281
- Title: A Survey on RGB-D Datasets
- Title(参考訳): RGB-Dデータセットに関する調査
- Authors: Alexandre Lopes, Roberto Souza, Helio Pedrini
- Abstract要約: 本稿では,深度情報を含む画像データセットをレビューし,分類した。
アクセス可能なデータを含む203のデータセットを収集し、それらをシーン/オブジェクト、ボディ、医療の3つのカテゴリに分類しました。
- 参考スコア(独自算出の注目度): 69.73803123972297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: RGB-D data is essential for solving many problems in computer vision.
Hundreds of public RGB-D datasets containing various scenes, such as indoor,
outdoor, aerial, driving, and medical, have been proposed. These datasets are
useful for different applications and are fundamental for addressing classic
computer vision tasks, such as monocular depth estimation. This paper reviewed
and categorized image datasets that include depth information. We gathered 203
datasets that contain accessible data and grouped them into three categories:
scene/objects, body, and medical. We also provided an overview of the different
types of sensors, depth applications, and we examined trends and future
directions of the usage and creation of datasets containing depth data, and how
they can be applied to investigate the development of generalizable machine
learning models in the monocular depth estimation field.
- Abstract(参考訳): rgb-dデータはコンピュータビジョンの多くの問題を解決するために不可欠である。
屋内、屋外、航空、運転、医療などの様々な場面を含む一般向けRGB-Dデータセットが数百件提案されている。
これらのデータセットは異なるアプリケーションに有用であり、単眼深度推定のような古典的なコンピュータビジョンタスクに対処するための基礎となる。
本稿では,深度情報を含む画像データセットのレビューと分類を行った。
アクセス可能なデータを含む203のデータセットを収集し、シーン/オブジェクト、ボディ、医療の3つのカテゴリにグループ化しました。
また,様々な種類のセンサ,奥行き応用について概観し,奥行きデータを含むデータセットの利用と作成の動向と今後の方向性について検討し,単眼深度推定分野における一般化可能な機械学習モデルの開発にどのように適用できるかについて検討した。
関連論文リスト
- Space3D-Bench: Spatial 3D Question Answering Benchmark [49.259397521459114]
Space3D-Benchは、Replicaデータセットのシーンに関連する1000の一般的な空間的質問と回答の集合である。
本研究では,事前定義された接地真実解に基づいて,自然言語応答を評価評価するシステムを提案する。
最後に,基礎モデルの世界理解をリッチな文脈検索と統合したRAG3D-Chatというベースラインを導入する。
論文 参考訳(メタデータ) (2024-08-29T16:05:22Z) - SynDrone -- Multi-modal UAV Dataset for Urban Scenarios [11.338399194998933]
ピクセルレベルのアノテーションを持つ大規模な実際のデータセットの不足は、研究者にとって大きな課題となっている。
本研究では,複数の飛行高度で撮影された画像と3次元データを含むマルチモーダル合成データセットを提案する。
データセットは、UAVアプリケーションをターゲットにした新しいコンピュータビジョンメソッドの開発をサポートするために公開されます。
論文 参考訳(メタデータ) (2023-08-21T06:22:10Z) - IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。
インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。
我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文 参考訳(メタデータ) (2022-10-23T23:03:17Z) - Deep Depth Completion: A Survey [26.09557446012222]
我々は、読者が研究動向をよりよく把握し、現在の進歩を明確に理解するのに役立つ総合的な文献レビューを提供する。
ネットワークアーキテクチャ,損失関数,ベンチマークデータセット,学習戦略の設計面から,関連する研究について検討する。
室内および屋外のデータセットを含む,広く使用されている2つのベンチマークデータセットに対して,モデル性能の定量的比較を行った。
論文 参考訳(メタデータ) (2022-05-11T08:24:00Z) - Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。
スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。
14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文 参考訳(メタデータ) (2022-03-11T17:32:27Z) - Do Datasets Have Politics? Disciplinary Values in Computer Vision
Dataset Development [6.182409582844314]
約500のコンピュータビジョンデータセットのコーパスを収集し、そこから異なるビジョンタスクで114のデータセットパブリッシュをサンプリングしました。
我々は、コンピュータビジョンデータセットの著者が、ケアを犠牲にして効率をどのように評価するか、コンテキストを犠牲にして普遍性、データ作業を犠牲にしてモデルワークをいかに評価するかについて議論する。
私たちは、沈黙された値をデータセットの生成とキュレーションプロセスにどのように組み込むか、という提案で締めくくります。
論文 参考訳(メタデータ) (2021-08-09T19:07:58Z) - REGRAD: A Large-Scale Relational Grasp Dataset for Safe and
Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。
データセットは2D画像と3Dポイントクラウドの両方で収集されます。
ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文 参考訳(メタデータ) (2021-04-29T05:31:21Z) - Light Field Salient Object Detection: A Review and Benchmark [37.28938750278883]
本稿では,光電場SODの総合的なレビューとベンチマークを行う。
10の伝統的なモデル、7つのディープラーニングベースのモデル、1つの比較研究、1つの簡単なレビューがある。
広範に使用されている4つの光フィールドデータセット上で、9つの代表的な光フィールドSODモデルと、いくつかの最先端RGB-D SODモデルをベンチマークする。
論文 参考訳(メタデータ) (2020-10-10T10:30:40Z) - RGB-D Salient Object Detection: A Survey [195.83586883670358]
様々な観点からRGB-Dに基づくSODモデルを総合的に調査する。
また、このドメインからSODモデルと人気のあるベンチマークデータセットもレビューします。
今後の研究に向けたRGB-DベースのSODの課題と方向性について論じる。
論文 参考訳(メタデータ) (2020-08-01T10:01:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。