論文の概要: Vista4D: Video Reshooting with 4D Point Clouds
- arxiv url: http://arxiv.org/abs/2604.21915v1
- Date: Thu, 23 Apr 2026 17:57:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.816519
- Title: Vista4D: Video Reshooting with 4D Point Clouds
- Title(参考訳): Vista4D: 4Dポイントクラウドを使ったビデオリシューティング
- Authors: Kuan Heng Lin, Zhizheng Liu, Pablo Salamanca, Yash Kant, Ryan Burgert, Yuancheng Xu, Koichi Namekata, Yiwei Zhao, Bolei Zhou, Micah Goldblum, Paul Debevec, Ning Yu,
- Abstract要約: Vista4Dは、入力されたビデオとターゲットカメラを4Dポイントクラウドにグラウンドするビデオリシューティングフレームワークである。
現状のベースラインと比較して、4Dの一貫性、カメラ制御、視覚的品質が改善された。
本手法は,動的シーン展開や4次元シーン再構成といった実世界の応用に一般化する。
- 参考スコア(独自算出の注目度): 60.22650781486302
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Vista4D, a robust and flexible video reshooting framework that grounds the input video and target cameras in a 4D point cloud. Specifically, given an input video, our method re-synthesizes the scene with the same dynamics from a different camera trajectory and viewpoint. Existing video reshooting methods often struggle with depth estimation artifacts of real-world dynamic videos, while also failing to preserve content appearance and failing to maintain precise camera control for challenging new trajectories. We build a 4D-grounded point cloud representation with static pixel segmentation and 4D reconstruction to explicitly preserve seen content and provide rich camera signals, and we train with reconstructed multiview dynamic data for robustness against point cloud artifacts during real-world inference. Our results demonstrate improved 4D consistency, camera control, and visual quality compared to state-of-the-art baselines under a variety of videos and camera paths. Moreover, our method generalizes to real-world applications such as dynamic scene expansion and 4D scene recomposition. See our project page for results, code, and models: https://eyeline-labs.github.io/Vista4D
- Abstract(参考訳): 入力ビデオとターゲットカメラを4Dポイントのクラウドに接地する、堅牢で柔軟なビデオリシューティングフレームワークであるVista4Dを紹介する。
具体的には、入力映像が与えられた場合、異なるカメラの軌跡と視点から同じダイナミックスでシーンを再合成する。
既存のビデオ再撮影手法は、実世界のダイナミックビデオの深さ推定アーチファクトに苦労するが、コンテンツの外観を保たず、新しいトラジェクトリに挑戦するための正確なカメラ制御の維持に失敗する。
静的なピクセルセグメンテーションと4D再構成を併用した4Dグラウンドのポイントクラウド表現を構築し,目に見えるコンテンツを明示的に保存し,リッチなカメラ信号を提供する。
その結果、様々なビデオやカメラパスにおける最先端のベースラインと比較して、4Dの一貫性、カメラ制御、視覚的品質が改善された。
さらに,本手法は動的シーン展開や4次元シーン再構成といった実世界の応用に一般化する。
結果、コード、モデルについては、プロジェクトページを参照してください。
関連論文リスト
- 4C4D: 4 Camera 4D Gaussian Splatting [56.926598190499156]
本稿では,4台のポータブルカメラで撮影した映像から4Dダイナミックなシーンを復元する課題に取り組む。
我々は,高忠実度4Dガウシアン・スプラッティングを実現する新しいフレームワークであるtextbf4C4Dを提案する。
論文 参考訳(メタデータ) (2026-04-05T11:09:23Z) - SEE4D: Pose-Free 4D Generation via Auto-Regressive Video Inpainting [83.5106058182799]
SEE4Dは, カジュアルビデオから4次元世界モデリングを行うための, ポーズのないトラジェクトリ・ツー・カメラ・フレームワークである。
モデル内のビュー条件ビデオは、現実的に合成された画像を認知する前に、ロバストな幾何学を学ぶために訓練される。
クロスビュービデオ生成とスパース再構成のベンチマークでSee4Dを検証した。
論文 参考訳(メタデータ) (2025-10-30T17:59:39Z) - C4D: 4D Made from 3D through Dual Correspondences [77.04731692213663]
時間的対応を利用して既存の3次元再構成を4Dに拡張するフレームワークであるC4Dを紹介する。
C4Dは、短期光学フローと長期点追跡の2種類の対応をキャプチャする。
我々は、追加の移動情報を提供する動的認識ポイントトラッカーを訓練する。
論文 参考訳(メタデータ) (2025-10-16T17:59:06Z) - GFlow: Recovering 4D World from Monocular Video [58.63051670458107]
GFlowは、空間と時間の3Dガウスのフローとして、4Dシーンにビデオを持ち上げるフレームワークである。
GFlowはビデオを静止部分と可動部分に分割し、最適化されたカメラポーズと3Dガウス点のダイナミックスを交互に切り替える。
GFlowは、フレームごとにカメラのポーズを推定し、カメラのポーズを変更することによって、新しいビューの合成を可能にする。
論文 参考訳(メタデータ) (2024-05-28T17:59:22Z) - DreamScene4D: Dynamic Multi-Object Scene Generation from Monocular Videos [21.93514516437402]
本稿では,新しいビュー合成によるモノクロ映像から複数の物体の3次元動的シーンを生成するための最初のアプローチであるDreamScene4Dを紹介する。
私たちの重要な洞察は、ビデオシーンを背景とオブジェクトトラックに分解する"分解分解"アプローチです。
DAVIS, Kubric, 自撮りビデオについて, 定量的比較とユーザ嗜好調査を行った。
論文 参考訳(メタデータ) (2024-05-03T17:55:34Z) - Make-It-4D: Synthesizing a Consistent Long-Term Dynamic Scene Video from
a Single Image [59.18564636990079]
本研究では,1枚の画像のみから長期ダイナミック映像を合成する問題について検討する。
既存の方法は、一貫性のない永遠の視点を幻覚させるか、長いカメラの軌跡に苦しむかのいずれかである。
一つの画像から一貫した長期動画像を生成する新しい方法であるMake-It-4Dを提案する。
論文 参考訳(メタデータ) (2023-08-20T12:53:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。