論文の概要: 3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects
- arxiv url: http://arxiv.org/abs/2605.10204v1
- Date: Mon, 11 May 2026 08:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.666929
- Title: 3DReflecNet: A Large-Scale Dataset for 3D Reconstruction of Reflective, Transparent, and Low-Texture Objects
- Title(参考訳): 3DReflecNet: 反射・透明・低テクスチャオブジェクトの3次元再構成のための大規模データセット
- Authors: Zhicheng Liang, Haoyi Yu, Boyan Li, Dayou Zhang, Zijian Cao, Tianyi Gong, Junhua Liu, Shuguang Cui, Fangxin Wang,
- Abstract要約: 3DReflecNetは22TBを超える大規模ハイブリッドデータセットである。
このデータセットは、様々な材料、複雑な照明条件、幅広い幾何学的形態にまたがる。
我々は、画像マッチング、構造移動、新しいビュー合成、削除、リライティングの5つのコアタスクのベンチマークを設計する。
- 参考スコア(独自算出の注目度): 41.25903201175962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 3D reconstruction of objects with reflective, transparent, or low-texture surfaces still remains notoriously challenging. Such materials often violate key assumptions in multi-view reconstruction pipelines, such as photometric consistency and the availability on distinct geometric texture cues. Existing datasets primarily focus on diffuse, textured objects, and therefore provide limited insight into performance under real-world material complexities. We introduce 3DReflecNet, a large-scale hybrid dataset exceeding 22 TB that is specifically designed to benchmark and advance 3D vision methods for these challenging materials. 3DReflecNet combines two types of data: over 120,000 synthetic instances generated via physically-based rendering of more than 12,000 shapes, and over 1,000 real-world objects captured using consumer devices. Together, these data consist of more than 7 million multi-view frames. The dataset spans diverse materials, complex lighting conditions, and a wide range of geometric forms, including shapes generated from both real and LLM-synthesized 2D images using diffusion-based pipelines. To support robust evaluation, we design benchmarks for five core tasks: image matching, structure-from-motion, novel view synthesis, reflection removal, and relighting. Extensive experiments demonstrate that state-of-the-art methods struggle to maintain accuracy across these settings, highlighting the need for more resilient 3D vision models.
- Abstract(参考訳): 反射面、透明面、低テクスチャ面を持つ物体の正確な3D再構成はいまだに難しい。
このような材料は、光度整合性や異なるテクスチャキューの可用性など、多視点再構成パイプラインにおける重要な前提に反することが多い。
既存のデータセットは、主に拡散、テクスチャ化されたオブジェクトに焦点を当てているため、現実の物質複合体下でのパフォーマンスに関する限られた洞察を提供する。
本稿では,22TBを超える大規模ハイブリッドデータセットである3DReflecNetを紹介する。
3DReflecNetでは,12,000以上の形状の物理ベースのレンダリングによって生成された12万以上の合成インスタンスと,コンシューマデバイスを使用してキャプチャされた1,000以上の現実世界オブジェクトという,2種類のデータを組み合わせています。
これらのデータは、700万以上のマルチビューフレームで構成されている。
データセットは多種多様な材料、複雑な照明条件、および拡散に基づくパイプラインを用いて実像とLLM合成された2D画像から生成される形状を含む幅広い幾何学的形状にまたがる。
頑健な評価を支援するため、画像マッチング、構造移動、新しいビュー合成、リフレクション除去、リライティングの5つのコアタスクのベンチマークを設計する。
大規模な実験は、最先端の手法がこれらの設定の精度を維持するのに苦労していることを示し、より回復力のある3Dビジョンモデルの必要性を強調している。
関連論文リスト
- ICTPolarReal: A Polarized Reflection and Material Dataset of Real World Objects [11.716946263732746]
実世界の物体の大規模偏光反射と物質データセットを8カメラ、346光の光ステージで撮影する。
我々のデータセットは、マルチビュー、マルチイルミネーション、偏光、反射率分離、物質特性収率1.2M以上の5つの取得次元の218の日常オブジェクトにまたがっている。
このデータセットを用いて、内在的分解、リライティング、スパースビュー3D再構成における最先端の逆レンダリングモデルと前方レンダリングモデルを訓練し、評価する。
論文 参考訳(メタデータ) (2026-03-26T01:01:18Z) - LARM: A Large Articulated-Object Reconstruction Model [29.66486888001511]
LARMは、スパースビュー画像から3Dの明瞭なオブジェクトを再構成する統合フィードフォワードフレームワークである。
LARMは、ディープマップやパートマスクなどの補助出力を生成し、明示的な3Dメッシュ抽出と関節推定を容易にする。
我々のパイプラインは、密集した監視の必要性を排除し、多様な対象カテゴリにわたる高忠実度再構築をサポートする。
論文 参考訳(メタデータ) (2025-11-14T18:55:27Z) - IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations [64.07859467542664]
画像から幾何学的および物質的情報をキャプチャすることは、コンピュータビジョンとグラフィックスの基本的な課題である。
従来の最適化に基づく手法では、密集した多視点入力から幾何学、材料特性、環境照明を再構築するために数時間の計算時間を必要とすることが多い。
IDArbは、様々な照明条件下で、任意の画像に対して本質的な分解を行うために設計された拡散モデルである。
論文 参考訳(メタデータ) (2024-12-16T18:52:56Z) - OpenMaterial: A Large-scale Dataset of Complex Materials for 3D Reconstruction [55.052637670485716]
材料認識型3D再構成のための大規模半合成データセットであるOpenMaterialを紹介する。
導体、誘電体、プラスチックを含む295の異なる材料にまたがる1,001の物体と、その粗い変種が含まれ、714の異なる照明条件下で捕獲される。
マルチビュー画像、3D形状モデル、カメラポーズ、深度マップ、およびオブジェクトマスクを提供し、挑戦的な材料上で3D再構成を評価するための最初の広範囲なベンチマークを確立する。
論文 参考訳(メタデータ) (2024-06-13T07:46:17Z) - Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。
提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-03-21T17:59:59Z) - Multi-View Neural Surface Reconstruction with Structured Light [7.709526244898887]
微分可能レンダリング(DR)に基づく3次元オブジェクト再構成はコンピュータビジョンにおいて活発な研究課題である。
DRに基づく多視点3Dオブジェクト再構成において,構造化光(SL)を用いたアクティブセンシングを導入し,任意のシーンやカメラポーズの未知の形状と外観を学習する。
本手法は, テクスチャレス領域における高い再現精度を実現し, カメラポーズキャリブレーションの労力を削減する。
論文 参考訳(メタデータ) (2022-11-22T03:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。