Fugu-MT 論文翻訳(概要): VS3R: Robust Full-frame Video Stabilization via Deep 3D Reconstruction

論文の概要: VS3R: Robust Full-frame Video Stabilization via Deep 3D Reconstruction

arxiv url: http://arxiv.org/abs/2603.05851v1
Date: Fri, 06 Mar 2026 03:15:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-09 13:17:44.978657
Title: VS3R: Robust Full-frame Video Stabilization via Deep 3D Reconstruction
Title（参考訳）: VS3R:Deep 3Dレコンストラクションによるロバストフルフレームビデオ安定化
Authors: Muhua Zhu, Xinhao Jin, Yu Zhang, Yifei Xue, Tie Ji, Yizhen Lao,
Abstract要約: フィードフォワード3次元再構成と生成ビデオ拡散を相乗化するためのフレームワークであるVS3Rを提案する。私たちのパイプラインは、すべてのシナリオの信頼性を確保するために、カメラパラメータ、深さ、マスクを共同で見積もっています。 Dual-Stream Video Diffusion Modelは、隠蔽された領域を復元し、セマンティックアンカーと構造的なガイダンスを相乗してアーティファクトを修正します。
参考スコア（独自算出の注目度）: 8.43362854806854
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video stabilization aims to mitigate camera shake but faces a fundamental trade-off between geometric robustness and full-frame consistency. While 2D methods suffer from aggressive cropping, 3D techniques are often undermined by fragile optimization pipelines that fail under extreme motions. To bridge this gap, we propose VS3R, a framework that synergizes feed-forward 3D reconstruction with generative video diffusion. Our pipeline jointly estimates camera parameters, depth, and masks to ensure all-scenario reliability, and introduces a Hybrid Stabilized Rendering module that fuses semantic and geometric cues for dynamic consistency. Finally, a Dual-Stream Video Diffusion Model restores disoccluded regions and rectifies artifacts by synergizing structural guidance with semantic anchors. Collectively, VS3R achieves high-fidelity, full-frame stabilization across diverse camera models and significantly outperforms state-of-the-art methods in robustness and visual quality.
Abstract（参考訳）: ビデオの安定化は、カメラの揺れを軽減することを目的としているが、幾何学的堅牢性とフルフレームの一貫性の基本的なトレードオフに直面している。 2D法は攻撃的な収穫に苦しむが、3D法は極端運動で失敗する脆弱な最適化パイプラインによって損なわれることが多い。このギャップを埋めるために、生成ビデオ拡散とフィードフォワード3D再構成を相乗化するためのフレームワークであるVS3Rを提案する。我々のパイプラインは、カメラパラメータ、深さ、マスクを共同で推定し、すべてのシナリオの信頼性を確保し、動的一貫性のために意味的および幾何学的手がかりを融合するハイブリッド安定化レンダリングモジュールを導入します。最後に、Dual-Stream Video Diffusion Modelは、隠蔽された領域を復元し、セマンティックアンカーと構造的なガイダンスを相乗してアーティファクトを修正します。まとめると、VS3Rは様々なカメラモデルにまたがる高忠実でフルフレームの安定化を実現し、堅牢性と視覚的品質において最先端の手法を大幅に上回っている。

論文の概要: VS3R: Robust Full-frame Video Stabilization via Deep 3D Reconstruction

関連論文リスト