論文の概要: High-Resolution Volumetric Reconstruction for Clothed Humans
- arxiv url: http://arxiv.org/abs/2307.13282v1
- Date: Tue, 25 Jul 2023 06:37:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 18:03:09.009150
- Title: High-Resolution Volumetric Reconstruction for Clothed Humans
- Title(参考訳): 衣服用ヒトの高分解能ボリュームリコンストラクション
- Authors: Sicong Tang, Guangyuan Wang, Qing Ran, Lingzhi Li, Li Shen and Ping
Tan
- Abstract要約: 本稿では,1~6RGB画像のスパース集合から,衣服の人間を再構築する新しい手法を提案する。
提案手法は,P2S法の平均点通過精度を50%以上削減し,約2mmの精度を512容積分解能で達成する。
- 参考スコア(独自算出の注目度): 27.900514732877827
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel method for reconstructing clothed humans from a sparse set
of, e.g., 1 to 6 RGB images. Despite impressive results from recent works
employing deep implicit representation, we revisit the volumetric approach and
demonstrate that better performance can be achieved with proper system design.
The volumetric representation offers significant advantages in leveraging 3D
spatial context through 3D convolutions, and the notorious quantization error
is largely negligible with a reasonably large yet affordable volume resolution,
e.g., 512. To handle memory and computation costs, we propose a sophisticated
coarse-to-fine strategy with voxel culling and subspace sparse convolution. Our
method starts with a discretized visual hull to compute a coarse shape and then
focuses on a narrow band nearby the coarse shape for refinement. Once the shape
is reconstructed, we adopt an image-based rendering approach, which computes
the colors of surface points by blending input images with learned weights.
Extensive experimental results show that our method significantly reduces the
mean point-to-surface (P2S) precision of state-of-the-art methods by more than
50% to achieve approximately 2mm accuracy with a 512 volume resolution.
Additionally, images rendered from our textured model achieve a higher peak
signal-to-noise ratio (PSNR) compared to state-of-the-art methods.
- Abstract(参考訳): 本稿では,1~6RGB画像のスパース集合から,衣服の人間を再構築する新しい手法を提案する。
暗黙的表現を用いた最近の研究の印象的な結果にもかかわらず、我々はボリュームアプローチを再考し、適切なシステム設計によってより良い性能が達成できることを実証する。
体積表現は3次元畳み込みによる3次元空間的文脈の活用において大きな利点を与え、悪名高い量子化誤差は、かなり大きくて手頃なボリューム解像度(例えば512)で無視できる。
メモリと計算コストに対処するため,ボクセルカリングと部分空間スパース畳み込みを用いた粗大化戦略を提案する。
本手法は, 粗い形状を計算し, 粗い形状に近い狭い帯に焦点を合わせるために, 離散化された視覚的包絡から開始する。
形状を再構成すると、入力画像と学習重みをブレンドして表面点の色を計算するイメージベースレンダリング手法を採用する。
広範な実験結果から,最先端法の平均点対面精度(p2s)を50%以上低減し,約2mmの精度を512ボリュームの解像度で達成できた。
さらに,テクスチャモデルから描画した画像は,最先端手法と比較して高いピーク信号-雑音比(PSNR)が得られる。
関連論文リスト
- Matching Free Depth Recovery from Structured Light [28.865683021793625]
構造化光システムにより撮像された画像から深度を推定するための新しい手法を提案する。
本手法では,密度ボクセル格子を用いてシーン形状を表現し,自己教師付き可変ボリュームレンダリングを用いて学習する。
論文 参考訳(メタデータ) (2025-01-13T08:03:49Z) - Q-SLAM: Quadric Representations for Monocular SLAM [85.82697759049388]
四角形のレンズを通して体積表現を再現する。
我々は、RGB入力からノイズの深い深さ推定を正すために二次仮定を用いる。
本研究では,新たな二次分割変換器を導入し,二次情報を集約する。
論文 参考訳(メタデータ) (2024-03-12T23:27:30Z) - Depth-Regularized Optimization for 3D Gaussian Splatting in Few-Shot
Images [47.14713579719103]
オーバーフィッティングを緩和するための幾何ガイドとして,密集深度マップを導入する。
調整された深度は3Dガウススプラッティングのカラーベース最適化に有効である。
提案手法は,NeRF-LLFFデータセット上で,少ない画像数で検証する。
論文 参考訳(メタデータ) (2023-11-22T13:53:04Z) - Anti-Aliased Neural Implicit Surfaces with Encoding Level of Detail [54.03399077258403]
本稿では,高頻度幾何細部リカバリとアンチエイリアス化された新しいビューレンダリングのための効率的なニューラル表現であるLoD-NeuSを提案する。
我々の表現は、光線に沿った円錐状のフラストラム内の多面体化から空間特徴を集約する。
論文 参考訳(メタデータ) (2023-09-19T05:44:00Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - ARF: Artistic Radiance Fields [63.79314417413371]
本稿では,任意のスタイル画像の芸術的特徴を3Dシーンに転送する方法を提案する。
点雲やメッシュ上で3次元スタイリングを行う従来の手法は、幾何的再構成誤差に敏感である。
より頑健なラディアンス場表現の体系化を提案する。
論文 参考訳(メタデータ) (2022-06-13T17:55:31Z) - Efficient Textured Mesh Recovery from Multiple Views with Differentiable
Rendering [8.264851594332677]
マルチビュー画像からテクスチャメッシュを復元する手法を提案する。
学習ベース多視点ステレオアルゴリズムにより予測される深度との差を最小化することにより形状形状を最適化する。
形状や色に対する暗黙的なニューラル表現とは対照的に,物体の光と反射を共同で推定する物理ベース逆レンダリング方式を導入する。
論文 参考訳(メタデータ) (2022-05-25T03:33:55Z) - PixelPyramids: Exact Inference Models from Lossless Image Pyramids [58.949070311990916]
Pixel-Pyramidsは、画像画素の関節分布を符号化するスケール特異的表現を用いたブロック自動回帰手法である。
様々な画像データセット、特に高解像度データに対する密度推定の最先端結果が得られる。
CelebA-HQ 1024 x 1024 では,フローベースモデルの並列化よりもサンプリング速度が優れているにもかかわらず,密度推定値がベースラインの 44% に向上することが観察された。
論文 参考訳(メタデータ) (2021-10-17T10:47:29Z) - DWDN: Deep Wiener Deconvolution Network for Non-Blind Image Deblurring [66.91879314310842]
本稿では,古典的なWienerデコンボリューションフレームワークを学習深い特徴と統合することにより,特徴空間における明示的なデコンボリューションプロセスを提案する。
マルチスケールのカスケード機能改善モジュールは、分離された深い特徴から退色画像を予測する。
提案したDeep Wienerデコンボリューションネットワークは,目に見える成果物が少なく,かつ,最先端の非盲点画像デコンボリューション手法を広いマージンで定量的に上回っていることを示す。
論文 参考訳(メタデータ) (2021-03-18T00:38:11Z) - Real-time Dense Reconstruction of Tissue Surface from Stereo Optical
Video [10.181846237133167]
立体光学ビデオから組織表面の高密度3次元モデル(3次元)をリアルタイムに再構成する手法を提案する。
まずステレオマッチングを用いてビデオフレームから3D情報を抽出し,再構成した3Dモデルをモザイクする。
2mm未満の精度で高分解能テクスチャを有する復元3Dモデルについて, 生体内および生体内データによる実験結果を得た。
論文 参考訳(メタデータ) (2020-07-16T19:14:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。