論文の概要: GS-STVSR: Ultra-Efficient Continuous Spatio-Temporal Video Super-Resolution via 2D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2604.18047v1
- Date: Mon, 20 Apr 2026 10:11:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.804059
- Title: GS-STVSR: Ultra-Efficient Continuous Spatio-Temporal Video Super-Resolution via 2D Gaussian Splatting
- Title(参考訳): GS-STVSR:2Dガウス法による超高効率連続時空間ビデオ超解像
- Authors: Mingyu Shi, Xin Di, Long Peng, Boxiang Cao, Anran Wu, Zhanfeng Feng, Jiaming Guo, Renjing Pei, Xueyang Fu, Yang Cao, Zhengjun Zha,
- Abstract要約: Continuous Video Super-Resolution (C-STVSR) は、任意のスケールファクタによる動画の空間的・フレーム的レートの同時向上を目的としている。
2次元ガウシアンティング(2D-GS)に基づく超効率的なC-STVSRフレームワークであるGS-STVSRを提案する。
GS-STVSRは,すべてのベンチマークにおいて最先端の品質を実現していることを示す。
- 参考スコア(独自算出の注目度): 71.12303582606019
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Continuous Spatio-Temporal Video Super-Resolution (C-STVSR) aims to simultaneously enhance the spatial resolution and frame rate of videos by arbitrary scale factors, offering greater flexibility than fixed-scale methods that are constrained by predefined upsampling ratios. In recent years, methods based on Implicit Neural Representations (INR) have made significant progress in C-STVSR by learning continuous mappings from spatio-temporal coordinates to pixel values. However, these methods fundamentally rely on dense pixel-wise grid queries, causing computational cost to scale linearly with the number of interpolated frames and severely limiting inference efficiency. We propose GS-STVSR, an ultra-efficient C-STVSR framework based on 2D Gaussian Splatting (2D-GS) that drives the spatiotemporal evolution of Gaussian kernels through continuous motion modeling, bypassing dense grid queries entirely. We exploit the strong temporal stability of covariance parameters for lightweight intermediate fitting, design an optical flow-guided motion module to derive Gaussian position and color at arbitrary time steps, introduce a Covariance resampling alignment module to prevent covariance drift, and propose an adaptive offset window for large-scale motion. Extensive experiments on Vid4, GoPro, and Adobe240 show that GS-STVSR achieves state-of-the-art quality across all benchmarks. Moreover, its inference time remains nearly constant at conventional temporal scales (X2--X8) and delivers over X3 speedup at extreme scales X32, demonstrating strong practical applicability.
- Abstract(参考訳): 連続時空間ビデオ超解法(Continuous Spatio-Temporal Video Super-Resolution, C-STVSR)は、ビデオの空間分解能とフレームレートを任意のスケールファクターで同時に向上することを目的としており、事前定義されたアップサンプリング比によって制約される固定スケール法よりも高い柔軟性を提供する。
近年, Inlicit Neural Representations (INR) に基づく手法は, 時空間座標から画素値への連続写像を学習することによってC-STVSRにおいて大きな進歩を遂げている。
しかし、これらの手法は基本的に高密度のピクセルワイドグリッドクエリに依存しており、計算コストは補間フレームの数と線形にスケールし、推論効率を著しく制限する。
2D-GSをベースとした超効率的なC-STVSRフレームワークであるGS-STVSRを提案する。
我々は、軽量中間嵌合における共分散パラメータの強い時間的安定性を活用し、ガウスの位置と色を任意の時間ステップで導くための光フロー誘導運動モジュールを設計し、共分散ドリフトを防止するための共分散再サンプリングアライメントモジュールを導入し、大規模運動のための適応オフセットウィンドウを提案する。
Vid4、GoPro、Adobe240の大規模な実験によると、GS-STVSRはすべてのベンチマークで最先端の品質を実現している。
さらに、その推定時間は従来の時間スケール(X2--X8)でほぼ一定であり、極端スケールのX32でX3スピードアップを達成し、強力な実用性を示す。
関連論文リスト
- GATS: Gaussian Aware Temporal Scaling Transformer for Invariant 4D Spatio-Temporal Point Cloud Representation [4.686110187936828]
本稿では,分散的不整合と時間的整合性の両方を明確に解消する,新しい二重不変フレームワークである textbfGaussian Aware Temporal Scaling (GATS) を提案する。
MSR-Action3D(textbf+6.62%の精度)、NTU RGBD(textbf+1.4%の精度)、Synthia4D(textbf+1.8% mIoU)のベンチマーク実験は、大きな性能向上を示した。
論文 参考訳(メタデータ) (2026-03-17T06:18:27Z) - Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting [79.37674445572462]
時系列予測(TSF)は、周期内変動と周期間トレンドの複雑な絡み合いのため、依然として困難な問題である。
形状変化テンソルを静止画像として扱うと、トポロジカルミスマッチが発生する。
均一な固定サイズの表現に依存することは、モデリング能力を非効率に割り当てる。
TimeGSは、予測パラダイムをレグレッションから2D生成レンダリングに根本的にシフトする、新しいフレームワークである。
論文 参考訳(メタデータ) (2026-02-10T14:13:36Z) - BasicAVSR: Arbitrary-Scale Video Super-Resolution via Image Priors and Enhanced Motion Compensation [70.27358326228399]
任意スケールビデオ超解像(AVSR)のためのベーシックAVSRを提案する。
AVSRは、ビデオフレームの解像度、潜在的に様々なスケーリング要素を強化することを目的としている。
超高分解能, 一般化能力, 推論速度の点で, BasicAVSR は既存手法よりも優れていた。
論文 参考訳(メタデータ) (2025-10-30T05:08:45Z) - Towards Robust and Generalizable Continuous Space-Time Video Super-Resolution with Events [71.2439653098351]
連続時空ビデオスーパーSTVSRは、高解像度で高フレームのビデオを任意の時間スケールで再構成する能力への関心が高まっている。
EvEnhancerは、イベントストリームにカプセル化された高時間および高ダイナミックレンジのユニークな特性を結合する新しいアプローチである。
提案手法は,OODスケールでの一般化性を維持しつつ,合成および実世界の両方のデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2025-10-04T15:23:07Z) - Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。
本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-09T13:43:57Z) - Continuous Space-Time Video Super-Resolution Utilizing Long-Range
Temporal Information [48.20843501171717]
本稿では,任意のフレームレートと空間解像度に変換可能な連続ST-VSR(CSTVSR)手法を提案する。
本稿では,提案アルゴリズムの柔軟性が向上し,各種データセットの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-02-26T08:02:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。