論文の概要: VolHuMe: a High-Resolution Large Scale Dataset of Volumetric Human Meshes
- arxiv url: http://arxiv.org/abs/2606.23062v1
- Date: Mon, 22 Jun 2026 09:13:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-26 21:21:07.564049
- Title: VolHuMe: a High-Resolution Large Scale Dataset of Volumetric Human Meshes
- Title(参考訳): VolHuMe: ボリューム人間メッシュの高解像度大規模データセット
- Authors: Giulia Martinelli, Niccolò Bisagno, Nicola Garau, Esa Rahtu, Nicola Conci,
- Abstract要約: VolHuMeは、最先端のボリュームスタジオで撮影された高品質な4Dスキャンのデータセットだ。
われわれはVolHuMeを3次元および4次元の人間の再建作業における最先端の手法でベンチマークした。
- 参考スコア(独自算出の注目度): 21.33426009240549
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce VolHuMe, a dataset of high-quality 4D human scans captured with a state-of-the-art volumetric studio using 64 RGB and 32 depth cameras. VolHuMe contains individual captures of 104 subjects and provides extensive ground truth, including SMPL-X, high-resolution meshes, multi-view RGB/depth images, rigged meshes, point clouds, garment segmentation, and detailed hand and facial geometry. Unlike prior datasets that primarily rely on full-body imagery, VolHuMe uses a close-range, high-resolution capture setup that preserves fine-grained body-part details, improving geometric fidelity and texture resolution. We benchmark VolHuMe on state-of-the-art methods across 3D and 4D human reconstruction tasks, showcasing the dataset's quality and exposing the limitations of current evaluation testbeds.
- Abstract(参考訳): 我々は64RGBと32深度カメラを使用して、最先端のボリュームスタジオでキャプチャされた高品質な4DスキャンのデータセットであるVolHuMeを紹介した。
VolHuMeには104の被写体の個々のキャプチャが含まれており、SMPL-X、高解像度メッシュ、マルチビューRGB/深度画像、リップメッシュ、点雲、衣服のセグメンテーション、詳細な手と顔の形状など、幅広い真実を提供する。
フルボディの画像に主に依存する以前のデータセットとは異なり、VolHuMeは、細かなボディ部分の詳細を保存し、幾何学的忠実度とテクスチャの解像度を向上させる、近接して高解像度のキャプチャー設定を使用する。
われわれは、VolHuMeを3Dおよび4Dの人間再構成タスクにまたがる最先端の手法でベンチマークし、データセットの品質を示し、現在の評価テストベッドの限界を明らかにする。
関連論文リスト
- RealX3D: A Physically-Degraded 3D Benchmark for Multi-view Visual Restoration and Reconstruction [51.07270086169647]
RealX3Dグループは、照明、散乱、ぼかしを含む4つのファミリーに腐敗し、それぞれを複数の重度レベルで捕獲する。
それぞれのシーンには高解像度キャプチャ、RAW画像、高密度レーザースキャンが含まれており、そこから世界規模のメッシュとメートル法深度を導き出す。
論文 参考訳(メタデータ) (2025-12-29T12:57:19Z) - Methods for evaluating the resolution of 3D data derived from satellite images [0.8166823398204148]
我々は,点雲,デジタル表面モデル,および3次元メッシュモデルの分解能を評価する方法を検討する。
本稿では,高分解能基準ライダーに基づく自動評価を可能にする3次元計測ツールについて述べる。
論文 参考訳(メタデータ) (2025-06-13T15:27:29Z) - Shape2.5D: A Dataset of Texture-less Surfaces for Depth and Normals Estimation [12.757150641117077]
シェープ2.5Dは、このギャップに対処するために設計された、新しい大規模データセットである。
提案するデータセットは、3Dモデリングソフトウェアでレンダリングされた合成画像を含む。
また、深度カメラで撮影される4,672フレームからなる現実世界のサブセットも含まれている。
論文 参考訳(メタデータ) (2024-06-22T12:24:49Z) - Zero-Shot Multi-Object Scene Completion [59.325611678171974]
1枚のRGB-D画像から複雑なシーンにおける複数の見えない物体の完全な形状を復元する3Dシーン補完法を提案する。
提案手法は, 合成および実世界の両方のデータセットにおいて, 現在の最先端技術よりも優れている。
論文 参考訳(メタデータ) (2024-03-21T17:59:59Z) - ANIM: Accurate Neural Implicit Model for Human Reconstruction from a single RGB-D image [40.03212588672639]
ANIMは単視点RGB-D画像から任意の3次元形状を前例のない精度で再構成する新しい手法である。
我々のモデルは、深度情報を活用するためにピクセル整列とボクセル整列の両方の機能から幾何学的詳細を学習する。
実験によると、ANIMはRGB、表面正規、ポイントクラウド、RGB-Dデータを入力として使用する最先端の作業よりも優れている。
論文 参考訳(メタデータ) (2024-03-15T14:45:38Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Multi-sensor large-scale dataset for multi-view 3D reconstruction [63.59401680137808]
マルチビュー3次元表面再構成のための新しいマルチセンサデータセットを提案する。
スマートフォン、Intel RealSense、Microsoft Kinect、産業用カメラ、構造化光スキャナーなどだ。
14の照明条件下で100方向から取得した107の異なるシーンの約1.4万枚の画像を提供する。
論文 参考訳(メタデータ) (2022-03-11T17:32:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。