Fugu-MT 論文翻訳(概要): Places in the Wild: A Large, High-Resolution RAW Photograph Dataset for Ecologically Valid Vision Research

論文の概要: Places in the Wild: A Large, High-Resolution RAW Photograph Dataset for Ecologically Valid Vision Research

arxiv url: http://arxiv.org/abs/2606.02481v1
Date: Mon, 01 Jun 2026 16:51:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-02 21:34:32.511693
Title: Places in the Wild: A Large, High-Resolution RAW Photograph Dataset for Ecologically Valid Vision Research
Title（参考訳）: 野生の場所:生態学的に有効な視覚研究のための大規模高解像度RAW写真データセット
Authors: Michelle R. Greene,
Abstract要約: Places in the Wild』は、67,574枚の高解像度写真を、260の基本的なシーンカテゴリにまたがる810の物理的な場所から収集したデータセットである。 45メガピクセルのキヤノンEOS R5はパノラマ三脚に搭載され、72枚の画像を5度の水平間隔で撮影し、12枚の画像を様々な高度で撮影した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large image datasets have accelerated progress in cognitive neuroscience and computer vision. However, most datasets are low-resolution, internet-sourced JPEGs with unknown capture conditions and limited spatial context. Places in the Wild is a dataset of 67,574 high-resolution photographs collected in situ across 810 physical locations spanning 260 basic-level scene categories, including indoor, urban, and natural environments. At each location, a 45-megapixel Canon EOS R5 mounted on a panoramic tripod captured 72 images at 5-degree horizontal intervals plus 12 images at varying elevations, yielding dense 360-degree viewpoint sampling. All images were recorded simultaneously as 14-bit RAW (CR3) files and compressed JPEGs, preserving sensor-level detail for analyses of luminance, contrast, color, and other image statistics. The dataset is accompanied by complete EXIF metadata and a suite of image-quality metrics. Places in the Wild supports research on viewpoint-dependent recognition in humans and models, training and evaluation of scene-understanding systems under realistic conditions, characterization of natural scene statistics, and experiments requiring near-full-field visual displays.
Abstract（参考訳）: 画像データセットは認知神経科学とコンピュータビジョンの進歩を加速している。しかし、ほとんどのデータセットは低解像度で、未知のキャプチャ条件と限られた空間コンテキストを持つインターネットソースJPEGである。 Places in the Wildは、屋内、都市、自然環境を含む260の基本的なシーンのカテゴリにまたがる810の物理的場所にわたって67,574枚の高解像度写真を収集したデータセットである。 45メガピクセルのキヤノンEOS R5はパノラマ三脚に搭載され、72枚の画像を5度の水平間隔で撮影し、12枚の画像を様々な高度で撮影した。全ての画像は、14ビットRAW(CR3)ファイルと圧縮JPEGとして同時に記録され、輝度、コントラスト、色、その他の画像統計の分析のためのセンサーレベルの詳細を保存する。データセットには、完全なEXIFメタデータと、画像品質メトリクスのスイートが付属している。野生の場所は、人間やモデルにおける視点に依存した認識の研究、現実的な条件下でのシーン理解システムの訓練と評価、自然のシーン統計の特徴づけ、およびほぼフルフィールドの視覚ディスプレイを必要とする実験を支援している。

関連論文リスト

RAWDet-7: A Multi-Scenario Benchmark for Object Detection and Description on Quantized RAW Images [28.105402889173032]
RAWDet-7は25kのトレーニングと7.6kのテストRAW画像の大規模なデータセットで、様々なカメラ、照明条件、環境にまたがって収集される。我々は、RAW画像処理と低ビット量子化によるオブジェクトレベルの情報保存の容易化を目的として、対応する高解像度sRGB画像から導出されたオブジェクトレベルの記述を提供する。
論文参考訳（メタデータ） (2026-02-03T17:22:45Z)
LuxDiT: Lighting Estimation with Video Diffusion Transformer [66.60450792095901]
単一の画像やビデオからシーンライティングを推定することは、コンピュータビジョンとグラフィックスにおいて長年の課題である。本稿では,映像拡散変換器を微調整し,視覚入力を前提としたHDR環境マップを生成するLuxDiTを提案する。
論文参考訳（メタデータ） (2025-09-03T19:59:20Z)
360 in the Wild: Dataset for Depth Prediction and View Synthesis [66.58513725342125]
大規模な360$circ$ビデオデータセットを野放しに導入する。このデータセットはインターネットから慎重に取り除かれ、世界中で様々な場所から収集されている。データセットを構成する25K画像のそれぞれに、それぞれのカメラのポーズと深さマップが提供される。
論文参考訳（メタデータ） (2024-06-27T05:26:38Z)
6D Camera Relocalization in Visually Ambiguous Extreme Environments [79.68352435957266]
本研究では,深海や地球外地形などの極端な環境下で得られた画像の列から,カメラのポーズを確実に推定する手法を提案する。本手法は,室内ベンチマーク (7-Scenes データセット) における最先端手法と同等の性能を20%のトレーニングデータで達成する。
論文参考訳（メタデータ） (2022-07-13T16:40:02Z)
A Multi-purpose Real Haze Benchmark with Quantifiable Haze Levels and Ground Truth [61.90504318229845]
本稿では,ハズフリー画像とその場でのハズ密度測定を併用した,最初の実画像ベンチマークデータセットを提案する。このデータセットはコントロールされた環境で生成され、プロの煙発生装置がシーン全体を覆っている。このデータセットのサブセットは、CVPR UG2 2022 チャレンジの Haze Track における Object Detection に使用されている。
論文参考訳（メタデータ） (2022-06-13T19:14:06Z)
Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。 14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文参考訳（メタデータ） (2022-03-11T17:32:27Z)
OOWL500: Overcoming Dataset Collection Bias in the Wild [45.494056340200956]
オンラインで収集された画像データセットは、偏見のあるオブジェクト認識を生成できるという仮説が研究されている。新たな"in the lab"データ収集インフラストラクチャが提案されている。安価で容易に複製できる性質は、ビジョンコミュニティによるスケーラブルなデータ収集の取り組みにつながる可能性もあります。
論文参考訳（メタデータ） (2021-08-24T23:22:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。