論文の概要: A High Resolution Multi-exposure Stereoscopic Image & Video Database of
Natural Scenes
- arxiv url: http://arxiv.org/abs/2206.11095v1
- Date: Wed, 22 Jun 2022 13:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 16:20:35.242254
- Title: A High Resolution Multi-exposure Stereoscopic Image & Video Database of
Natural Scenes
- Title(参考訳): 自然シーンの高分解能多露光ステレオ画像・映像データベース
- Authors: Rohit Choudhary and Mansi Sharma and Aditya Wadaskar
- Abstract要約: インド工科大学マドラス校内で収集した多目的マルチ露光データセットについて紹介する。
データセットはZEDカメラを使用してキャプチャされ、屋外と屋内の複雑なシーンを提供する。
提案されたデータセットは、研究コミュニティで公開されています。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Immersive displays such as VR headsets, AR glasses, Multiview displays, Free
point televisions have emerged as a new class of display technologies in recent
years, offering a better visual experience and viewer engagement as compared to
conventional displays. With the evolution of 3D video and display technologies,
the consumer market for High Dynamic Range (HDR) cameras and displays is
quickly growing. The lack of appropriate experimental data is a critical
hindrance for the development of primary research efforts in the field of 3D
HDR video technology. Also, the unavailability of sufficient real world
multi-exposure experimental dataset is a major bottleneck for HDR imaging
research, thereby limiting the quality of experience (QoE) for the viewers. In
this paper, we introduce a diversified stereoscopic multi-exposure dataset
captured within the campus of Indian Institute of Technology Madras, which is
home to a diverse flora and fauna. The dataset is captured using ZED
stereoscopic camera and provides intricate scenes of outdoor locations such as
gardens, roadside views, festival venues, buildings and indoor locations such
as academic and residential areas. The proposed dataset accommodates wide depth
range, complex depth structure, complicate object movement, illumination
variations, rich color dynamics, texture discrepancy in addition to significant
randomness introduced by moving camera and background motion. The proposed
dataset is made publicly available to the research community. Furthermore, the
procedure for capturing, aligning and calibrating multi-exposure stereo videos
and images is described in detail. Finally, we have discussed the progress,
challenges, potential use cases and future research opportunities with respect
to HDR imaging, depth estimation, consistent tone mapping and 3D HDR coding.
- Abstract(参考訳): 近年、VRヘッドセット、ARメガネ、マルチビューディスプレイ、フリーポイントテレビなどの没入型ディスプレイが新しいタイプのディスプレイ技術として登場し、従来のディスプレイに比べて視覚的体験と視聴者のエンゲージメントが向上している。
3Dビデオとディスプレイ技術の進化に伴い、ハイダイナミックレンジ(HDR)カメラとディスプレイの消費者市場は急速に成長している。
適切な実験データがないことは、3D HDRビデオ技術分野における主要な研究活動の進展にとって重要な障害である。
また、十分な実世界のマルチ露光実験データセットが利用できないことは、HDRイメージング研究の大きなボトルネックであり、視聴者の体験の質(QoE)を制限している。
本稿では,インド工科大学マドラス校内において,多様な植物相と動物相を呈する多種多様な立体視マルチ露光データセットについて紹介する。
データセットは、ZEDステレオカメラを用いて撮影され、庭園、道路沿いの景色、祭り会場、建物、学術・住宅地などの屋内場所などの複雑な屋外のシーンを提供する。
提案するデータセットは、広い深度範囲、複雑な深度構造、複雑な物体の動き、照明の変動、豊かな色力学、テクスチャのばらつき、そして、カメラの動きと背景の動きによってもたらされる重要なランダム性に適応する。
提案されたデータセットは研究コミュニティで公開されている。
さらに、マルチ露光ステレオビデオと画像をキャプチャ、アライメント、校正する手順について詳述する。
最後に,HDR画像,深度推定,一貫したトーンマッピング,3次元HDR符号化に関する進歩,課題,潜在的なユースケース,今後の研究機会について論じる。
関連論文リスト
- GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction [11.610543327501995]
High Dynamic Range(画像とビデオ)は幅広い用途がある。
High Dynamic Range(画像とビデオ)は幅広い用途がある。
低ダイナミックレンジ(Low Dynamic Range, LDR)から視覚的に正確なHDR画像を再構成する難しい作業は、視覚研究コミュニティで注目を集めている。
論文 参考訳(メタデータ) (2024-03-26T16:24:42Z) - Den-SOFT: Dense Space-Oriented Light Field DataseT for 6-DOF Immersive Experience [28.651514326042648]
我々は,移動式マルチカメラ大空間高密度光場キャプチャシステムを構築した。
本研究の目的は,一般的な3次元シーン再構築アルゴリズムの開発に貢献することである。
収集されたデータセットは、既存のデータセットよりもはるかに密度が高い。
論文 参考訳(メタデータ) (2024-03-15T02:39:44Z) - NPF-200: A Multi-Modal Eye Fixation Dataset and Method for
Non-Photorealistic Videos [51.409547544747284]
NPF-200は、視線を固定した純粋にフォトリアリスティックでないビデオの大規模なマルチモーダルデータセットである。
私たちは一連の分析を行い、このタスクについてより深い洞察を得ます。
NPSNetと呼ばれる広帯域周波数対応マルチモーダル非フォトリアリスティックサリエンシ検出モデルを提案する。
論文 参考訳(メタデータ) (2023-08-23T14:25:22Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks [55.81577205593956]
イベントカメラはバイオインスパイアされたセンサーで、ピクセルごとの強度の変化を非同期に捉える。
深層学習(DL)はこの新興分野に導入され、その可能性のマイニングに活発な研究努力にインスピレーションを与えている。
論文 参考訳(メタデータ) (2023-02-17T14:19:28Z) - 3D reconstruction from spherical images: A review of techniques,
applications, and prospects [2.6432771146480283]
3次元再構成は、現代のフォトグラムシステムにおいてますます重要な役割を担っている。
プロ用および消費者向けの球面カメラの急速な進化と広範囲な利用により、球面画像は都市と屋内のシーンの3Dモデリングに大きな可能性を示している。
本研究は,データ取得,特徴検出とマッチング,画像配向,密マッチングの観点から,球面画像の3次元再構成技術の現状を詳細に調査する。
論文 参考訳(メタデータ) (2023-02-09T08:45:27Z) - Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。
スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。
14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文 参考訳(メタデータ) (2022-03-11T17:32:27Z) - BungeeNeRF: Progressive Neural Radiance Field for Extreme Multi-scale
Scene Rendering [145.95688637309746]
本稿では,大々的に変化するスケールにわたる詳細レンダリングを実現するプログレッシブ・ニューラル放射場である BungeeNeRF を紹介する。
多様なマルチスケールシーンをモデル化する上での BungeeNeRF の優位性を示す。
論文 参考訳(メタデータ) (2021-12-10T13:16:21Z) - Urban Radiance Fields [77.43604458481637]
本研究では,都市屋外環境における世界地図作成によく利用されるスキャニングプラットフォームによって収集されたデータから3次元再構成と新しいビュー合成を行う。
提案手法は、制御された環境下での小さなシーンのための現実的な新しい画像の合成を実証したニューラルラジアンス場を拡張している。
これら3つのエクステンションはそれぞれ、ストリートビューデータの実験において、大幅なパフォーマンス改善を提供する。
論文 参考訳(メタデータ) (2021-11-29T15:58:16Z) - Translate to Adapt: RGB-D Scene Recognition across Domains [18.40373730109694]
本研究では,マルチモーダルシーン認識データセット内に,潜在的に深刻なドメインシフト問題が存在することを注目する。
本稿では,異なるカメラ領域にまたがって適応可能な自己教師付きモダリティ間翻訳法を提案する。
論文 参考訳(メタデータ) (2021-03-26T18:20:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。