論文の概要: RigPAPR: Rig-Based Animation of Static Neural Point Clouds from a Fixed-Viewpoint Video
- arxiv url: http://arxiv.org/abs/2606.06685v1
- Date: Thu, 04 Jun 2026 19:59:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.427677
- Title: RigPAPR: Rig-Based Animation of Static Neural Point Clouds from a Fixed-Viewpoint Video
- Title(参考訳): RigPAPR: 固定視点ビデオからの静的神経点雲のリグベースアニメーション
- Authors: Shichong Peng, Yanshu Zhang, Ke Li,
- Abstract要約: 静的なPAPRクラウドを自動リグし、単一の固定視点ビデオから直接LBSで駆動するRigPAPRを提案する。
合成被験者では,RigPAPRが指導的視点において最強のベースラインと一致する。
- 参考スコア(独自算出の注目度): 12.597520390112741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Static neural point reconstructions capture a subject at high fidelity from posed images. Given such a reconstruction, we aim to animate it to follow a monocular fixed-viewpoint driving video of the subject, whether captured or produced by image-to-video (I2V) generation, and to recover a rigged, re-posable 3D asset. Existing methods deform Gaussian splats through direct linear blend skinning (LBS) or mesh proxies, both of which are prone to joint-boundary artifacts under articulation, even with per-primitive corrections. We trace the artifact to the representation: each splat carries an individual shape calibrated in the canonical pose to tile with its neighbours. Under rigid LBS, each splat moves with its bone but cannot bend, so the canonical tiling breaks at joint boundaries into gaps and spikes. Proximity attention point rendering (PAPR) instead carries no per-primitive shape; each pixel is recomposed at render time from the deformed primitives' positions, so the surface re-forms naturally with the articulation. We present RigPAPR, which auto-rigs a static PAPR cloud and drives it under direct LBS from a single fixed-viewpoint video, without mesh proxy, pose-dependent correction, or category template. On synthetic subjects, RigPAPR matches the strongest baseline at the supervised view and exceeds mesh-based and Gaussian-splatting baselines at novel views by 3+dB PSNR, with cleaner joint-boundary renderings of both synthetic and real subjects.
- Abstract(参考訳): 静的な神経点再構成は、ポーズ画像から被写体を高い忠実度で捉えます。
このような再構成を前提として,画像対ビデオ(I2V)世代が捉えた,あるいは生成したモノラルな固定視点駆動映像をアニメーション化し,再現可能な3Dアセットを復元することを目的としている。
既存の方法では、直線形ブレンドスキン(英語版)(LBS)またはメッシュプロキシ(英語版)によってガウススプラットを変形させるが、どちらも音節下における結合境界アーティファクトに傾向があり、原始的な補正が可能である。
それぞれのスプラットは、隣人と一緒にタイルを作るための標準のポーズで調整された個々の形状を持っています。
硬いLBSの下では、各スプラットはその骨で動くが曲がらないので、標準のタイリングは関節の境界で隙間とスパイクに割れる。
プロクシミティ・アテンション・ポイント・レンダリング(PAPR)はプリミティブ・プリミティブの位置から各ピクセルがレンダリング時に再合成されるので、表面は関節で自然に変形する。
静的なPAPRクラウドを自動リグして,メッシュプロキシやポーズ依存補正,カテゴリテンプレートを使わずに,単一の固定視点ビデオから直接LBSで駆動するRigPAPRを提案する。
合成対象において,RigPAPRは教師付き視点において最強のベースラインと一致し,メッシュベースおよびガウススプラッティングベースラインを3dBPSNRで上回り,合成対象と実対象の両方のよりクリーンな結合境界レンダリングを行う。
関連論文リスト
- SCAPO: Self-Supervised Category-Level Articulated Pose Estimation from a Single 3D Observation [54.98864436812187]
本稿では,1つのRGB-D観測から標準幾何,剛部分セグメンテーション,関節ピボット,軸,調音状態を推定する自己教師型フレームワークを提案する。
合成および実調音オブジェクトデータセットの実験により、SCAPOは、一貫した部分構造と正確な調音パラメータを復元し、全ての自監督ベースラインを上回ります。
論文 参考訳(メタデータ) (2026-06-01T09:04:49Z) - TriSplat: Simulation-Ready Feed-Forward 3D Scene Reconstruction [65.03268438396556]
TriSplatは、向き付けられた三角形のプリミティブを持つシーンを表すフィードフォワード再構築ネットワークである。
シミュレーション可能なメッシュシーンを1つのフォワードパスからエクスポートする。
RealEstate10K と DL3DV の実験により、この表現はガウスのフィードフォワードベースラインよりも幾何に忠実な再構成を生成することが示された。
論文 参考訳(メタデータ) (2026-05-25T17:59:53Z) - VidSplat: Gaussian Splatting Reconstruction with Geometry-Guided Video Diffusion Priors [79.88300861391114]
VidSplatは、トレーニング不要な生成的再構築フレームワークである。
生成と再構築の効果的な統合を可能にする2つの重要な課題に取り組む。
広範に使用されているベンチマーク実験は、スパースビューのシーン再構成における優れた性能を示している。
論文 参考訳(メタデータ) (2026-05-12T02:20:31Z) - ViPS: Video-informed Pose Spaces for Auto-Rigged Meshes [55.32681167870698]
Video-informed Pose Spaces (ViPS)は、自動リップメッシュのための有効な調律の潜時分布を検出するフィードフォワードフレームワークである。
ViPSは生成ビデオの先行値を所定のリグパラメータ化上の普遍分布に転送する。
評価の結果,VPSは,合成アーティストが作成した4Dデータに基づいて訓練した最先端の手法の性能と,妥当性と多様性の両面で一致していることがわかった。
論文 参考訳(メタデータ) (2026-04-19T21:21:11Z) - HBSplat: Robust Sparse-View Gaussian Reconstruction with Hybrid-Loss Guided Depth and Bidirectional Warping [11.035994094874141]
HBSplatは、堅牢な構造的キュー、仮想ビュー制約、隠蔽された領域補完をシームレスに統合するフレームワークである。
HBSplatは21.13dBのPSNRと0.189LPIPSを達成し、リアルタイム推論を維持している。
論文 参考訳(メタデータ) (2025-09-29T15:03:31Z) - MonoPartNeRF:Human Reconstruction from Monocular Video via Part-Based Neural Radiance Fields [12.791949210170124]
単分子動的人間のレンダリングのための新しいフレームワークMonoPartNeRFを提案する。
部分ベースのレンダリングパラダイムは、人間のセグメンテーションによってガイドされ、構造的な複雑さに基づいた柔軟なパラメータ割り当てを可能にする。
本研究では,グローバルなポーズベクトルを身体領域に基づく局所的な関節埋め込みに分解する部分的ポーズ埋め込み機構を提案する。
論文 参考訳(メタデータ) (2025-08-12T09:55:21Z) - SparseFusion: Dynamic Human Avatar Modeling from Sparse RGBD Images [49.52782544649703]
本稿では,RGBDフレームのスパース集合に基づく3次元人体形状の再構築手法を提案する。
主な課題は、これらのスパースフレームを標準的な3Dモデルにしっかりと融合させる方法だ。
私たちのフレームワークは柔軟で、潜在的なアプリケーションは形状の再構築を超えています。
論文 参考訳(メタデータ) (2020-06-05T18:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。