論文の概要: Wavelet-Space Super-Resolution for Real-Time Rendering
- arxiv url: http://arxiv.org/abs/2508.16024v1
- Date: Fri, 22 Aug 2025 01:01:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.215734
- Title: Wavelet-Space Super-Resolution for Real-Time Rendering
- Title(参考訳): 実時間レンダリングのためのウェーブレット空間超解法
- Authors: Prateek Poudel, Prashant Aryal, Kirtan Kunwar, Navin Nepal, Dinesh Bania Kshatri,
- Abstract要約: 再建前の低周波及び高周波の詳細を分離するウェーブレット領域表現を導入する。
SWTの導入はPSNRを最大1.5dB改善し,LPIPSを平均17%削減することを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate the use of wavelet-space feature decomposition in neural super-resolution for rendering pipelines. Building on the DFASR framework, we introduce a wavelet-domain representation that separates low- and high-frequency details before reconstruction, enabling the network to better preserve fine textures while maintaining structural consistency. Unlike RGB-space regression, our approach leverages the stationary wavelet transform (SWT) to avoid spatial down-sampling, ensuring alignment across subbands and preserving shift invariance. The model predicts wavelet coefficients conditioned on spatial G-buffers and temporally warped history frames, which are then recombined through inverse wavelet synthesis. We conduct a comprehensive ablation study across wavelet families, transform types, and architectural variants, showing that incorporating SWT improves PSNR by up to 1.5 dB and reduces LPIPS by 17% on average, at a computational overhead of roughly +24 ms compared to out DFASR baseline. While absolute runtimes on our RTX 3050 mobile GPU are higher ( 141ms) than the original DFASR report on RTX 4090( 11ms), the relative overhead remains modest, suggesting that on higher-end GPUs our method would also remain real-time capable. Taken together, our results suggest that wavelet-domain representations are a principled and effective way to enhance perceptual quality in neural upscaling for graphics applications.
- Abstract(参考訳): 本稿では、ニューラルネットワークの超解像におけるウェーブレット空間の特徴分解の利用について検討する。
DFASRフレームワーク上に構築されたウェーブレットドメイン表現は,復元前の低周波・高周波の詳細を分離し,ネットワークが構造的整合性を維持しつつ微細なテクスチャをよりよく保存することを可能にする。
RGB空間の回帰とは異なり,本手法は定常ウェーブレット変換(SWT)を利用して,空間的なダウンサンプリングを回避し,サブバンド間のアライメントを確保し,シフト不変性を維持する。
このモデルは、空間的なGバッファと時間的に歪んだ歴史フレームに条件付けられたウェーブレット係数を予測し、その後、逆ウェーブレット合成によって再結合する。
ウェーブレット系, 変換型, アーキテクチャ変種を包括的に比較検討した結果, SWTの導入によりPSNRが1.5dB向上し, DFASRベースラインに比べて計算オーバーヘッドが約+24msでLPIPSが平均17%削減された。
RTX 3050モバイルGPUの絶対ランタイムは、RTX 4090(11ms)のDFASRレポートよりも141ms高いが、相対オーバーヘッドは控えめであり、ハイエンドGPUでは、我々のメソッドもリアルタイムに実行可能であることを示唆している。
その結果、ウェーブレットドメイン表現は、グラフィックアプリケーションにおけるニューラルアップスケーリングにおける知覚的品質を高めるための原則的かつ効果的な方法であることが示唆された。
関連論文リスト
- FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - SpINRv2: Implicit Neural Representation for Passband FMCW Radars [0.15193212081459279]
本研究では,周波数変調連続波レーダを用いた高忠実度ボリューム再構成のためのニューラルネットワークSpINRv2を提案する。
我々のコアコントリビューションは、クローズドフォーム合成を用いて複雑なレーダ応答をキャプチャする、完全微分可能な周波数領域フォワードモデルである。
細かな範囲の解像度で生じる曖昧なサブビンの曖昧さを解消するために、スパーシリティと正規化を導入する。
論文 参考訳(メタデータ) (2025-06-09T19:21:27Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - SpINR: Neural Volumetric Reconstruction for FMCW Radars [0.15193212081459279]
本稿では、周波数変調連続波(FMCW)レーダデータを用いたボリューム再構成のための新しいフレームワークSpINRを紹介する。
従来のバックプロジェクション手法や既存の学習ベースアプローチよりも,SpINRの方が優れていることを示す。
論文 参考訳(メタデータ) (2025-03-30T04:44:57Z) - Dual-domain Modulation Network for Lightweight Image Super-Resolution [26.992373105057684]
軽量画像超解像(SR)は、低解像度画像から限られた計算コストで高解像度画像を再構成することを目的としている。
既存の周波数ベースSR法では、全体構造と高周波部品の再構築のバランスが取れない。
本稿では,ウェーブレット情報とフーリエ情報の両方を導入することで,コスト削減を図りながら,高周波特徴と全体のSR構造再構築を両立させることができることを示す。
論文 参考訳(メタデータ) (2025-03-13T04:59:46Z) - Spatial-Frequency U-Net for Denoising Diffusion Probabilistic Models [89.76587063609806]
画素空間の代わりにウェーブレット空間における拡散確率モデル(DDPM)を視覚合成のために検討した。
ウェーブレット信号を明示的にモデル化することで、我々のモデルは複数のデータセット上でより高品質な画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-27T06:53:16Z) - Machine learning for phase-resolved reconstruction of nonlinear ocean
wave surface elevations from sparse remote sensing data [37.69303106863453]
ニューラルネットワークを用いた位相分解波面再構成のための新しい手法を提案する。
提案手法は,一次元格子を用いた合成的かつ高精度な訓練データを利用する。
論文 参考訳(メタデータ) (2023-05-18T12:30:26Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z) - Fourier Space Losses for Efficient Perceptual Image Super-Resolution [131.50099891772598]
提案した損失関数の適用のみで,最近導入された効率的なジェネレータアーキテクチャの性能向上が可能であることを示す。
フーリエ空間における周波数に対する損失の直接的強調は知覚的画質を著しく向上させることを示す。
訓練されたジェネレータは、最先端の知覚的SR法である RankSRGAN と SRFlow よりも2.4倍、48倍高速である。
論文 参考訳(メタデータ) (2021-06-01T20:34:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。