論文の概要: Learning Arbitrary-Scale RAW Image Downscaling with Wavelet-based Recurrent Reconstruction
- arxiv url: http://arxiv.org/abs/2507.23219v1
- Date: Thu, 31 Jul 2025 03:17:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:09.020671
- Title: Learning Arbitrary-Scale RAW Image Downscaling with Wavelet-based Recurrent Reconstruction
- Title(参考訳): ウェーブレット・リカレント再構成による任意スケールRAW画像ダウンスケーリングの学習
- Authors: Yang Ren, Hai Jiang, Wei Li, Menglong Yang, Heng Zhang, Zehua Sheng, Qingsheng Ye, Shuaicheng Liu,
- Abstract要約: 任意のスケールのRAW画像のダウンスケーリングを実現するために,ウェーブレットに基づくリカレント再構成フレームワークを提案する。
本稿では,非整数ダウンスケーリング係数が1.3$times$であるRealistic Non-Integer RAW Downscaling(Real-NIRD)データセットを紹介する。
提案手法は,既存のコンペティターの定量的および視覚的性能に優れる。
- 参考スコア(独自算出の注目度): 31.56360631121638
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image downscaling is critical for efficient storage and transmission of high-resolution (HR) images. Existing learning-based methods focus on performing downscaling within the sRGB domain, which typically suffers from blurred details and unexpected artifacts. RAW images, with their unprocessed photonic information, offer greater flexibility but lack specialized downscaling frameworks. In this paper, we propose a wavelet-based recurrent reconstruction framework that leverages the information lossless attribute of wavelet transformation to fulfill the arbitrary-scale RAW image downscaling in a coarse-to-fine manner, in which the Low-Frequency Arbitrary-Scale Downscaling Module (LASDM) and the High-Frequency Prediction Module (HFPM) are proposed to preserve structural and textural integrity of the reconstructed low-resolution (LR) RAW images, alongside an energy-maximization loss to align high-frequency energy between HR and LR domain. Furthermore, we introduce the Realistic Non-Integer RAW Downscaling (Real-NIRD) dataset, featuring a non-integer downscaling factor of 1.3$\times$, and incorporate it with publicly available datasets with integer factors (2$\times$, 3$\times$, 4$\times$) for comprehensive benchmarking arbitrary-scale image downscaling purposes. Extensive experiments demonstrate that our method outperforms existing state-of-the-art competitors both quantitatively and visually. The code and dataset will be released at https://github.com/RenYangSCU/ASRD.
- Abstract(参考訳): 画像ダウンスケーリングは高解像度(HR)画像の効率的な保存と伝送に重要である。
既存の学習ベースの方法は、通常、ぼやけた詳細や予期せぬ成果物に悩まされるsRGBドメイン内でダウンスケーリングを実行することに重点を置いている。
RAW画像は、未処理のフォトニック情報により、柔軟性が向上するが、特殊なダウンスケーリングフレームワークが欠如している。
本稿では、ウェーブレット変換の情報ロスレス特性を利用して、任意のスケールのRAW画像のダウンスケーリングを粗大な方法で達成するウェーブレット・リカレント・リコンストラクション・フレームワークを提案し、低周波数の任意スケールダウンスケーリングモジュール(LASDM)と高周波数予測モジュール(HFPM)は、再構成された低分解能(LR)RAW画像の構造的およびテクスチャ的整合性を維持するために提案され、HRとLRドメイン間の高周波数エネルギーの整合化のためのエネルギー最大化損失と合わせて、ウェーブレット・リカレント・リカレント・リカレント・リストラクション・フレームワークを提案する。
さらに、Realistic Non-Integer RAW Downscaling (Real-NIRD)データセットを導入し、整数係数(2$\times$, 3$\times$, 4$\times$)の非整数ダウンスケーリング係数を特徴付ける。
大規模な実験により,本手法は既存の競合相手よりも定量的,視覚的に優れていることが示された。
コードとデータセットはhttps://github.com/RenYangSCU/ASRDで公開される。
関連論文リスト
- Plug-and-Play Tri-Branch Invertible Block for Image Rescaling [11.457556028893329]
高分解能(HR)画像は通常、帯域幅を減らすために低分解能(LR)にダウンスケールされ、続いて元の細部をアップスケールして復元する。
画像再スケーリングアルゴリズムの最近の進歩は、ダウンスケーリングとアップスケーリングのための統一されたフレームワークを作成するために、非可逆ニューラルネットワーク(INN)を使用している。
本稿では、低周波分岐を輝度(Y)と輝度(CbCr)に分解するプラグアンドプレイ三分岐可逆ブロック(T-InvBlocks)を提案する。
論文 参考訳(メタデータ) (2024-12-18T05:14:13Z) - Timestep-Aware Diffusion Model for Extreme Image Rescaling [47.89362819768323]
本稿では,時間認識拡散モデル(TADM)と呼ばれる,画像再スケーリングのための新しいフレームワークを提案する。
TADMは、事前訓練されたオートエンコーダの潜在空間で再スケーリング操作を行う。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルによって学習された強力な自然画像の先行を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-17T09:51:42Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - DCS-RISR: Dynamic Channel Splitting for Efficient Real-world Image
Super-Resolution [15.694407977871341]
実世界の画像超解像(RISR)は、未知の複雑な劣化下でのSR画像の品質向上に重点を置いている。
既存の手法は、分解レベルが異なる低解像度(LR)画像を強化するために重いSRモデルに依存している。
本稿では,DCS-RISRと呼ばれる高効率リアルタイム画像超解法のための動的チャネル分割方式を提案する。
論文 参考訳(メタデータ) (2022-12-15T04:34:57Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。