論文の概要: OLATverse: A Large-scale Real-world Object Dataset with Precise Lighting Control
- arxiv url: http://arxiv.org/abs/2511.02483v1
- Date: Tue, 04 Nov 2025 11:13:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:05.967353
- Title: OLATverse: A Large-scale Real-world Object Dataset with Precise Lighting Control
- Title(参考訳): OLATverse: 精密照明制御を備えた大規模実世界のオブジェクトデータセット
- Authors: Xilong Zhou, Jianchun Chen, Pramod Rao, Timo Teufel, Linjie Lyu, Tigran Minasian, Oleksandr Sotnychenko, Xiaoxiao Long, Marc Habermann, Christian Theobalt,
- Abstract要約: OLATverseは、765の現実世界のオブジェクトの約9Mの画像からなる大規模なデータセットである。
それぞれの物体は35個のDSLRカメラと331個の個別に制御された光源で撮影され、様々な照明条件のシミュレーションを可能にする。
我々は、逆レンダリングと正規推定のための最初の総合的な実世界のオブジェクト中心ベンチマークを構築し、広範囲な評価セットを構築した。
- 参考スコア(独自算出の注目度): 65.57356151743936
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce OLATverse, a large-scale dataset comprising around 9M images of 765 real-world objects, captured from multiple viewpoints under a diverse set of precisely controlled lighting conditions. While recent advances in object-centric inverse rendering, novel view synthesis and relighting have shown promising results, most techniques still heavily rely on the synthetic datasets for training and small-scale real-world datasets for benchmarking, which limits their realism and generalization. To address this gap, OLATverse offers two key advantages over existing datasets: large-scale coverage of real objects and high-fidelity appearance under precisely controlled illuminations. Specifically, OLATverse contains 765 common and uncommon real-world objects, spanning a wide range of material categories. Each object is captured using 35 DSLR cameras and 331 individually controlled light sources, enabling the simulation of diverse illumination conditions. In addition, for each object, we provide well-calibrated camera parameters, accurate object masks, photometric surface normals, and diffuse albedo as auxiliary resources. We also construct an extensive evaluation set, establishing the first comprehensive real-world object-centric benchmark for inverse rendering and normal estimation. We believe that OLATverse represents a pivotal step toward integrating the next generation of inverse rendering and relighting methods with real-world data. The full dataset, along with all post-processing workflows, will be publicly released at https://vcai.mpi-inf.mpg.de/projects/OLATverse/.
- Abstract(参考訳): 765個の現実世界の物体の約9M画像からなる大規模データセットOLATverseを導入し、様々な視点から正確に制御された照明条件下で捉えた。
オブジェクト中心の逆レンダリング、新しいビュー合成、リライティングの最近の進歩は有望な結果を示しているが、ほとんどの技術は、トレーニングのための合成データセットとベンチマークのための小規模な実世界のデータセットに大きく依存している。
このギャップに対処するため、OLATverseは既存のデータセットに対して2つの大きな利点を提供している。
具体的には、OLATverseには、765の一般的で珍しい現実世界のオブジェクトが含まれており、幅広い素材カテゴリーにまたがっている。
それぞれの物体は35個のDSLRカメラと331個の個別に制御された光源で撮影され、様々な照明条件のシミュレーションを可能にする。
さらに、各対象に対して、よく校正されたカメラパラメータ、正確な物体マスク、測光面正規化、拡散アルベドを補助資源として提供する。
我々はまた、逆レンダリングと正規推定のための最初の総合的な実世界のオブジェクト中心ベンチマークを構築し、広範囲な評価セットを構築した。
OLATverseは,次世代の逆レンダリングとリライト手法を実世界のデータと統合するための重要なステップであると考えている。
完全なデータセットとすべての後処理ワークフローはhttps://vcai.mpi-inf.mpg.de/projects/OLATverse/で公開される。
関連論文リスト
- GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring [50.72230109855628]
本稿では,新しい手法を用いて合成されたリアルなぼやけた画像のデータセットであるGS-Blurを提案する。
まず,3Dガウス・スプレイティング(3DGS)を用いて多視点画像から3Dシーンを再構成し,ランダムに生成された運動軌跡に沿ってカメラビューを移動させてぼやけた画像を描画する。
GS-Blurの再構築に様々なカメラトラジェクトリを採用することで、我々のデータセットは現実的で多様な種類のぼかしを含み、現実世界のぼかしをうまく一般化する大規模なデータセットを提供する。
論文 参考訳(メタデータ) (2024-10-31T06:17:16Z) - OpenIllumination: A Multi-Illumination Dataset for Inverse Rendering
Evaluation on Real Objects [56.065616159398324]
我々は,64個のオブジェクトの108K画像を含む実世界のデータセットであるOpenIlluminationを紹介した。
データセットの各画像に対して、正確なカメラパラメータ、照明場真理、前景セグメンテーションマスクを提供する。
論文 参考訳(メタデータ) (2023-09-14T17:59:53Z) - TransCG: A Large-Scale Real-World Dataset for Transparent Object Depth
Completion and Grasping [46.6058840385155]
我々は、透明な物体深度を補完する大規模な実世界のデータセットをコントリビュートする。
データセットには、130の異なるシーンから57,715枚のRGB-D画像が含まれている。
本稿では,RGB画像と不正確な深度マップを入力とし,精細化された深度マップを出力するエンド・ツー・エンドの深度補完ネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-17T06:50:20Z) - LUCES: A Dataset for Near-Field Point Light Source Photometric Stereo [30.31403197697561]
LUCESは, 様々な素材の14個のオブジェクトからなる, 近距離Ld点光のための最初の実世界のデータセットである。
52個のLEDを計る装置は、カメラから10から30cm離れた位置にある各物体に点灯するように設計されている。
提案するデータセットにおける最新の近接場測光ステレオアルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-04-27T12:30:42Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。