論文の概要: UHD-GPGNet: UHD Video Denoising via Gaussian-Process-Guided Local Spatio-Temporal Modeling
- arxiv url: http://arxiv.org/abs/2604.11014v1
- Date: Mon, 13 Apr 2026 05:27:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.345661
- Title: UHD-GPGNet: UHD Video Denoising via Gaussian-Process-Guided Local Spatio-Temporal Modeling
- Title(参考訳): UHD-GPGNet:ガウス型局所時空間モデリングによるUHDビデオデノーミング
- Authors: Weiyuan He, Chen Wu, Pengwen Dai, Wei Wang, Dianjie Lu, Guijuan Zhang, Linwei Fan, Yongzhen Wang, Zhuoran Zheng,
- Abstract要約: プロセス誘導型局所時間認知フレームワークを提案する。
構造カラー協調再建ヘッドデテール, クロマ, 高周波補正
実世界のスマートフォンで撮影された4Kビデオでは、合成記述子で完全に訓練されたモデルが、本物のセンサーノイズに一般化されていることが確認されている。
- 参考スコア(独自算出の注目度): 23.717691801109638
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ultra-high-definition (UHD) video denoising requires simultaneously suppressing complex spatio-temporal degradations, preserving fine textures and chromatic stability, and maintaining efficient full-resolution 4K deployment. In this paper, we propose UHD-GPGNet, a Gaussian-process-guided local spatio-temporal denoising framework that addresses these requirements jointly. Rather than relying on implicit feature learning alone, the method estimates sparse GP posterior statistics over compact spatio-temporal descriptors to explicitly characterize local degradation response and uncertainty, which then guide adaptive temporal-detail fusion. A structure-color collaborative reconstruction head decouples luminance, chroma, and high-frequency correction, while a heteroscedastic objective and overlap-tiled inference further stabilize optimization and enable memory-bounded 4K deployment. Experiments on UVG and RealisVideo-4K show that UHD-GPGNet achieves competitive restoration fidelity with substantially fewer parameters than existing methods, enables real-time full-resolution 4K inference with significant speedup over the closest quality competitor, and maintains robust performance across a multi-level mixed-degradation schedule.A real-world study on phone-captured 4K video further confirms that the model, trained entirely on synthetic degradation, generalizes to unseen real sensor noise and improves downstream object detection under challenging conditions.
- Abstract(参考訳): 超高精細(UHD)ビデオデノナイジングは、複雑な時空間劣化を同時に抑制し、微細なテクスチャと彩色安定性を保ち、効率的なフル解像度4K展開を維持する必要がある。
本稿では,これらの要件に共同で対処するガウス処理による局所時空間記述フレームワークであるUHD-GPGNetを提案する。
この手法は、暗黙的な特徴学習のみに頼るのではなく、コンパクトな時空間記述子よりも少ないGP後続統計を推定し、局所的な劣化応答と不確実性を明示的に特徴付け、適応的時空間融合を導く。
構造カラー協調再構成ヘッドは輝度、クロマ、高周波補正を分離する一方、ヘテロセダスティックな目的と重み付け型推論は最適化をさらに安定化し、メモリバウンド4K展開を可能にする。
UVGとRealisVideo-4Kの実験では、UHD-GPGNetは既存の手法に比べてかなり少ないパラメータで競争力のある復元忠実性を実現し、リアルタイムのフルレゾリューション4K推論を可能にし、最も近い品質競争相手よりも大幅にスピードアップし、マルチレベルの混合劣化スケジュールにわたって堅牢な性能を維持している。
関連論文リスト
- RetimeGS: Continuous-Time Reconstruction of 4D Gaussian Splatting [9.254380348086135]
テンポラリリタイピングは、スローモーション再生、テンポラリ編集、ポストプロダクションといったアプリケーションには不可欠である。
既存の4D Gaussian Splatting (4DGS) メソッドは、離散フレームのインデックスに過度に適合するが、連続時間フレームの表現に苦慮し、タイムスタンプ間の補間時にゴーストアーティファクトに繋がる。
本稿では,3次元ガウスの時間的挙動を明確に定義し,時間的エイリアスを実現するシンプルな4DGS表現であるRetimeGSを提案する。
論文 参考訳(メタデータ) (2026-03-14T06:26:27Z) - D$^2$-VR: Degradation-Robust and Distilled Video Restoration with Synergistic Optimization Strategy [7.553742541566094]
時間的アライメントと拡散前処理の統合は ビデオ復元の 変革的パラダイムとして現れました 素晴らしい知覚の質を提供しています
単一画像拡散に基づく低ステップ推論によるビデオ再生フレームワークである textbfD$2$-VR を提案する。
論文 参考訳(メタデータ) (2026-02-09T08:52:51Z) - Rethinking Diffusion Model-Based Video Super-Resolution: Leveraging Dense Guidance from Aligned Features [51.5076190312734]
ビデオ超解法アプローチは、エラーの蓄積、空間的アーティファクト、知覚的品質と忠実さのトレードオフに悩まされる。
ビデオ超解像(DGAF-VSR)に適した特徴を持つ新しい誘導拡散モデルを提案する。
合成および実世界のデータセットの実験では、DGAF-VSRがVSRの重要な側面において最先端の手法を超越していることが示されている。
論文 参考訳(メタデータ) (2025-11-21T03:40:45Z) - Dynamic Gaussian Scene Reconstruction from Unsynchronized Videos [31.54046494140498]
マルチビュー映像再構成はコンピュータビジョンにおいて重要な役割を担い、映画製作、バーチャルリアリティー、モーション分析に応用できる。
同期のないマルチビュービデオから高品質な4DGS再構成を実現するための新しい時間的アライメント戦略を提案する。
論文 参考訳(メタデータ) (2025-11-14T11:20:43Z) - Scale-DiT: Ultra-High-Resolution Image Generation with Hierarchical Local Attention [50.391914489898774]
Scale-DiTは、階層的な局所的注意を低解像度のグローバルガイダンスで導入する新しい拡散フレームワークである。
軽量なLoRA適応は、デノナイズ中のグローバルパスとローカルパスをブリッジし、構造と詳細の整合性を確保する。
実験によると、Scale-DiTは2ドル以上の高速な推論とメモリ使用量の削減を実現している。
論文 参考訳(メタデータ) (2025-10-18T03:15:26Z) - Towards Robust and Generalizable Continuous Space-Time Video Super-Resolution with Events [71.2439653098351]
連続時空ビデオスーパーSTVSRは、高解像度で高フレームのビデオを任意の時間スケールで再構成する能力への関心が高まっている。
EvEnhancerは、イベントストリームにカプセル化された高時間および高ダイナミックレンジのユニークな特性を結合する新しいアプローチである。
提案手法は,OODスケールでの一般化性を維持しつつ,合成および実世界の両方のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2025-10-04T15:23:07Z) - 4DGCPro: Efficient Hierarchical 4D Gaussian Compression for Progressive Volumetric Video Streaming [52.76837132019501]
本稿では,新しい階層型4D圧縮フレームワークである4DGCProを紹介する。
4DGCProは、プログレッシブボリュームビデオストリーミングによるリアルタイムモバイルデコーディングと高品質なレンダリングを容易にする。
エンドツーエンドのエントロピー最適化トレーニングスキームを提案する。
論文 参考訳(メタデータ) (2025-09-22T08:38:17Z) - VDEGaussian: Video Diffusion Enhanced 4D Gaussian Splatting for Dynamic Urban Scenes Modeling [68.65587507038539]
本稿では,動的都市景観モデリングのための拡散強調4次元ガウス平滑化フレームワークを提案する。
我々の重要な洞察は、テスト時間に適応したビデオ拡散モデルから頑健で時間的に一貫した事前情報を抽出することである。
提案手法は, 高速移動物体の動的モデリングを著しく向上させ, 2dBのPSNRゲインを近似的に達成する。
論文 参考訳(メタデータ) (2025-08-04T07:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。