論文の概要: DIML/CVL RGB-D Dataset: 2M RGB-D Images of Natural Indoor and Outdoor
Scenes
- arxiv url: http://arxiv.org/abs/2110.11590v1
- Date: Fri, 22 Oct 2021 05:12:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-25 14:30:59.354818
- Title: DIML/CVL RGB-D Dataset: 2M RGB-D Images of Natural Indoor and Outdoor
Scenes
- Title(参考訳): DIML/CVL RGB-Dデータセット:2M RGB-Dによる自然室内・屋外シーンの画像
- Authors: Jaehoon Cho, Dongbo Min, Youngjung Kim, Kwanghoon Sohn
- Abstract要約: このデータセットは、2M色の画像と、様々な自然の屋内・屋外のシーンから対応する深度マップで構成されている。
屋内データセットはMicrosoft Kinect v2を使用して構築され、屋外データセットはステレオカメラを使用して構築された。
- 参考スコア(独自算出の注目度): 71.68217324952228
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This manual is intended to provide a detailed description of the DIML/CVL
RGB-D dataset. This dataset is comprised of 2M color images and their
corresponding depth maps from a great variety of natural indoor and outdoor
scenes. The indoor dataset was constructed using the Microsoft Kinect v2, while
the outdoor dataset was built using the stereo cameras (ZED stereo camera and
built-in stereo camera). Table I summarizes the details of our dataset,
including acquisition, processing, format, and toolbox. Refer to Section II and
III for more details.
- Abstract(参考訳): このマニュアルは、DIML/CVL RGB-Dデータセットの詳細な説明を提供する。
このデータセットは、2M色の画像と、様々な自然の屋内・屋外シーンの深度マップで構成されている。
屋内データセットはMicrosoft Kinect v2を使用して構築され、屋外データセットはステレオカメラ(ZEDステレオカメラと内蔵ステレオカメラ)を使用して構築された。
テーブルiは、買収、処理、フォーマット、ツールボックスを含むデータセットの詳細を要約します。
詳細は第2節および第3節を参照。
関連論文リスト
- Enhancing image captioning with depth information using a
Transformer-based framework [3.326320568999945]
本稿では,RGB画像と奥行き情報の統合がキャプションタスクを強化し,より優れた記述を生成することができるかを検討する。
3Dシーンの多文記述を生成するためのトランスフォーマーベースのエンコーダデコーダフレームワークを提案する。
実験はNYU-v2データセットとStanford画像パラグラフキャプションデータセットで実施されている。
論文 参考訳(メタデータ) (2023-07-24T17:31:51Z) - ARKitTrack: A New Diverse Dataset for Tracking Using Mobile RGB-D Data [75.73063721067608]
我々は,AppleのiPhoneおよびiPadに搭載されたコンシューマグレードのLiDARスキャナーによってキャプチャされた静的および動的シーンの両方を対象とした新しいRGB-D追跡データセットを提案する。
ARKitTrackには300のRGB-Dシーケンス、455のターゲット、229.7Kのビデオフレームが含まれている。
詳細な実験分析により,ARKitTrackデータセットがRGB-D追跡を著しく促進し,提案手法が芸術的状況と良好に比較できることが確認された。
論文 参考訳(メタデータ) (2023-03-24T09:51:13Z) - Scale Invariant Semantic Segmentation with RGB-D Fusion [12.650574326251023]
RGB-D画像を用いたスケール不変セマンティックセグメンテーションのためのニューラルネットワークアーキテクチャを提案する。
画素単位のセマンティックセグメンテーションのためのRGBデータに深度情報を組み込んで,屋外シーンにおける異なるスケールオブジェクトに対処する。
我々のモデルはコンパクトであり、他のRGBモデルにも容易に適用できる。
論文 参考訳(メタデータ) (2022-04-10T12:54:27Z) - Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。
スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。
14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文 参考訳(メタデータ) (2022-03-11T17:32:27Z) - A Survey on RGB-D Datasets [69.73803123972297]
本稿では,深度情報を含む画像データセットをレビューし,分類した。
アクセス可能なデータを含む203のデータセットを収集し、それらをシーン/オブジェクト、ボディ、医療の3つのカテゴリに分類しました。
論文 参考訳(メタデータ) (2022-01-15T05:35:19Z) - TIMo -- A Dataset for Indoor Building Monitoring with a Time-of-Flight
Camera [9.746370805708095]
タイム・オブ・フライ(ToF)カメラを用いた室内空間の映像監視用データセットTIMoについて述べる。
その結果生まれたディープビデオは、さまざまな事前定義されたアクションを実行する人々を特徴付けている。
対象とする2つのアプリケーションには、計数と異常検出を行う人物検出がある。
論文 参考訳(メタデータ) (2021-08-27T09:33:11Z) - Stereo Object Matching Network [78.35697025102334]
本稿では,画像からの2次元コンテキスト情報と3次元オブジェクトレベル情報の両方を利用するステレオオブジェクトマッチング手法を提案する。
コストボリューム空間における3次元オブジェクト性を扱うための新しい方法として, 選択的サンプリング (RoISelect) と 2D-3D 融合がある。
論文 参考訳(メタデータ) (2021-03-23T12:54:43Z) - DSEC: A Stereo Event Camera Dataset for Driving Scenarios [55.79329250951028]
本研究は,イベントカメラを用いた初の高分解能大規模ステレオデータセットを提案する。
データセットは、様々な照明条件で駆動により収集された53のシーケンスを含む。
イベントベースステレオアルゴリズムの開発と評価のための基礎的な真相の相違を提供する。
論文 参考訳(メタデータ) (2021-03-10T12:10:33Z) - SIDOD: A Synthetic Image Dataset for 3D Object Pose Recognition with
Distractors [10.546457120988494]
このデータセットには144kのステレオ画像ペアが含まれており、最大10個のオブジェクトと3つのフォトリアリスティック仮想環境の18のカメラ視点を合成的に組み合わせている。
ドメインのランダム化に対する我々のアプローチを説明し、データセットを作成した決定について考察する。
論文 参考訳(メタデータ) (2020-08-12T00:14:19Z) - A Multi-spectral Dataset for Evaluating Motion Estimation Systems [7.953825491774407]
本稿では,マルチスペクトル運動推定システムの性能評価のための新しいデータセットを提案する。
すべてのシーケンスはハンドヘルドマルチスペクトルデバイスから記録される。
深度画像はMicrosoft Kinect2でキャプチャされ、モダリティ間のステレオマッチングを学習するメリットがある。
論文 参考訳(メタデータ) (2020-07-01T17:11:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。