論文の概要: DeblurNVS: Geometric Latent Diffusion for Novel View Synthesis from Sparse Motion-Blurred Images
- arxiv url: http://arxiv.org/abs/2606.01315v1
- Date: Sun, 31 May 2026 16:04:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.578531
- Title: DeblurNVS: Geometric Latent Diffusion for Novel View Synthesis from Sparse Motion-Blurred Images
- Title(参考訳): DeblurNVS:Sparse Motion-Blurred画像からの新しいビュー合成のための幾何学的潜在拡散
- Authors: Changyue Shi, Wangbo Yu, Chaoran Feng, Li Yuan,
- Abstract要約: 新しいビュー合成(NVS)はコンピュータビジョンとグラフィックスの基本的な問題である。
ニューラルレイディアンスフィールド(NeRF),3次元ガウススプラッティング(3DGS)および生成ビュー合成の進歩により,その品質が大幅に向上した。
スパース・モーション・ブルード画像から直接高忠実度ノベルビューを実現するための新しいフレームワークであるDeNVSを提案する。
- 参考スコア(独自算出の注目度): 22.61939963916488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Novel view synthesis (NVS) is a fundamental problem in computer vision and graphics. Recent advances in neural radiance fields (NeRF), 3D Gaussian Splatting (3DGS), and generative view synthesis have substantially improved its quality. Yet most methods still rely on clean observations, where image structures and cross-view geometric cues are well preserved. Motion blur breaks this assumption by corrupting local details and weakening multi-view correspondences. Such blur commonly arises from camera shake, scene motion, or finite exposure in practical capture. Blur-aware NVS methods address this degradation by modeling image formation, but their reliance on costly per-scene optimization limits efficient and generalizable sparse-view synthesis. To address this, we propose DeblurNVS, a novel framework for synthesizing high-fidelity novel views directly from sparse motion-blurred images, without requiring per-scene optimization. DeblurNVS restores the intermediate geometric representations needed for multi-view reasoning, enabling blurred inputs to recover reliable structure and correspondence cues. The restored representations are then combined with target camera information to synthesize the target-view representation and reconstruct a sharp RGB novel view. To enable the large-scale training, we construct a motion-blurred NVS dataset from DL3DV-10K using interpolation-based finite-exposure blur synthesis. Extensive experiments demonstrate that DeblurNVS outperforms existing baselines on synthetic motion-blur benchmarks and generalizes to real motion-blurred scenes, producing perceptually sharper and structurally more stable novel views while avoiding costly per-scene optimization. Project page: https://github.com/PKU-YuanGroup/DeblurNVS.
- Abstract(参考訳): 新しいビュー合成(NVS)はコンピュータビジョンとグラフィックスの基本的な問題である。
ニューラルレイディアンスフィールド(NeRF),3次元ガウススプラッティング(3DGS)および生成ビュー合成の進歩により,その品質が大幅に向上した。
しかし、ほとんどの手法は、画像構造や断面幾何学的手がかりがよく保存されているクリーンな観察に依存している。
動きのぼかしはこの仮定を破り、局所的な詳細を破損させ、多視点対応を弱める。
このようなぼやけは、カメラの揺れ、シーンの動き、あるいは実用的なキャプチャにおける有限露出から生じることが多い。
Blur-aware NVS法は画像形成をモデル化することでこの劣化に対処するが、コストのかかるシーンごとの最適化に依存するため、効率的で一般化可能なスパースビュー合成が可能である。
そこで本稿では, シーンごとの最適化を必要とせず, スパース映像から直接高忠実度新規ビューを合成する新しいフレームワークであるDeblurNVSを提案する。
DeblurNVSは、マルチビュー推論に必要な中間幾何学的表現を復元し、ぼやけた入力で信頼性の高い構造と対応の手がかりを復元する。
復元された表現は、ターゲットカメラ情報と組み合わせて、ターゲットビュー表現を合成し、シャープなRGBノベルビューを再構成する。
大規模トレーニングを実現するために,補間に基づく有限露光ブラー合成を用いて,DL3DV-10Kから動きブルーのNVSデータセットを構築する。
大規模な実験により、DeblurNVSは、合成モーションブルーのベンチマークで既存のベースラインを上回り、実際のモーションブルーのシーンに一般化し、コストの高いシーンごとの最適化を回避しつつ、知覚的にシャープで構造的により安定した新しいビューを生み出すことが示されている。
プロジェクトページ:https://github.com/PKU-YuanGroup/DeblurNVS
関連論文リスト
- VidSplat: Gaussian Splatting Reconstruction with Geometry-Guided Video Diffusion Priors [79.88300861391114]
VidSplatは、トレーニング不要な生成的再構築フレームワークである。
生成と再構築の効果的な統合を可能にする2つの重要な課題に取り組む。
広範に使用されているベンチマーク実験は、スパースビューのシーン再構成における優れた性能を示している。
論文 参考訳(メタデータ) (2026-05-12T02:20:31Z) - Breaking the Vicious Cycle: Coherent 3D Gaussian Splatting from Sparse and Motion-Blurred Views [40.70901994944635]
スパース画像とぼやけた画像から高忠実度3D再構成を行うフレームワークであるCoherentGSを紹介する。
我々の重要な洞察は、これらの複合劣化に二元的戦略を用いて対処することである。
CoherentGSは既存のメソッドを著しく上回り、この挑戦的なタスクのために新しい最先端のタスクを設定している。
論文 参考訳(メタデータ) (2025-12-11T07:36:35Z) - Enhancing Novel View Synthesis from extremely sparse views with SfM-free 3D Gaussian Splatting Framework [14.927184256861807]
本稿では,SfMフリーな3DGSを用いたカメラのポーズを推定し,非常にスムーズな視点から3Dシーンを再構成する手法を提案する。
提案手法は,PSNRの高度2.75dB改善を極端に軽視条件下で達成し,他の最先端3DGS法よりも優れていた。
論文 参考訳(メタデータ) (2025-08-21T11:25:24Z) - ACT-R: Adaptive Camera Trajectories for Single View 3D Reconstruction [16.03389355810877]
多視点合成に適応的な視点計画法を導入する。
我々は3次元コヒーレンスを高めるために時間的一貫性を活用して一連のビューを生成する。
論文 参考訳(メタデータ) (2025-05-13T05:31:59Z) - ExScene: Free-View 3D Scene Reconstruction with Gaussian Splatting from a Single Image [4.366356163044466]
既存の方法は、単一視点からの視野が狭い低一貫性の3Dシーンを再構成するためにしばしば制限される。
任意の単視点画像から没入型3Dシーンを再構成する2段階パイプラインであるExSceneを提案する。
ExSceneは単一ビュー入力のみを使用して一貫した没入的なシーン再構築を実現する。
論文 参考訳(メタデータ) (2025-03-31T09:33:22Z) - D-NPC: Dynamic Neural Point Clouds for Non-Rigid View Synthesis from Monocular Video [53.83936023443193]
本稿では,スマートフォンのキャプチャなどのモノクロ映像から動的に新しいビューを合成する手法を導入することにより,この分野に貢献する。
我々のアプローチは、局所的な幾何学と外観を別個のハッシュエンコードされたニューラル特徴グリッドにエンコードする暗黙の時間条件のポイントクラウドである、$textitdynamic Neural point cloudとして表現されている。
論文 参考訳(メタデータ) (2024-06-14T14:35:44Z) - Hybrid Neural Rendering for Large-Scale Scenes with Motion Blur [68.24599239479326]
画像ベース表現とニューラル3D表現を結合して高品質なビュー一貫性のある画像をレンダリングするハイブリッドなニューラルレンダリングモデルを開発した。
我々のモデルは、新しいビュー合成のための最先端のポイントベース手法を超越している。
論文 参考訳(メタデータ) (2023-04-25T08:36:33Z) - Learning Dynamic View Synthesis With Few RGBD Cameras [60.36357774688289]
本稿では,RGBDカメラを用いて動的屋内シーンのフリー視点映像を合成することを提案する。
我々は、RGBDフレームから点雲を生成し、それをニューラル機能を介して、自由視点ビデオにレンダリングする。
そこで本研究では,未完成の深度を適応的に塗布して新規なビューを描画する,シンプルなRegional Depth-Inpaintingモジュールを提案する。
論文 参考訳(メタデータ) (2022-04-22T03:17:35Z) - ProbNVS: Fast Novel View Synthesis with Learned Probability-Guided
Sampling [42.37704606186928]
本稿では,MVSの事前学習に基づいて,新しいビュー合成フレームワークを構築することを提案する。
本手法は,最先端のベースラインに比べて15~40倍高速なレンダリングを実現する。
論文 参考訳(メタデータ) (2022-04-07T14:45:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。