論文の概要: Plug-and-Play Tri-Branch Invertible Block for Image Rescaling
- arxiv url: http://arxiv.org/abs/2412.13508v1
- Date: Wed, 18 Dec 2024 05:14:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:46:01.002919
- Title: Plug-and-Play Tri-Branch Invertible Block for Image Rescaling
- Title(参考訳): 画像再スケーリングのためのプラグアンドプレイ三分岐可逆ブロック
- Authors: Jingwei Bao, Jinhua Hao, Pengcheng Xu, Ming Sun, Chao Zhou, Shuyuan Zhu,
- Abstract要約: 高分解能(HR)画像は通常、帯域幅を減らすために低分解能(LR)にダウンスケールされ、続いて元の細部をアップスケールして復元する。
画像再スケーリングアルゴリズムの最近の進歩は、ダウンスケーリングとアップスケーリングのための統一されたフレームワークを作成するために、非可逆ニューラルネットワーク(INN)を使用している。
本稿では、低周波分岐を輝度(Y)と輝度(CbCr)に分解するプラグアンドプレイ三分岐可逆ブロック(T-InvBlocks)を提案する。
- 参考スコア(独自算出の注目度): 11.457556028893329
- License:
- Abstract: High-resolution (HR) images are commonly downscaled to low-resolution (LR) to reduce bandwidth, followed by upscaling to restore their original details. Recent advancements in image rescaling algorithms have employed invertible neural networks (INNs) to create a unified framework for downscaling and upscaling, ensuring a one-to-one mapping between LR and HR images. Traditional methods, utilizing dual-branch based vanilla invertible blocks, process high-frequency and low-frequency information separately, often relying on specific distributions to model high-frequency components. However, processing the low-frequency component directly in the RGB domain introduces channel redundancy, limiting the efficiency of image reconstruction. To address these challenges, we propose a plug-and-play tri-branch invertible block (T-InvBlocks) that decomposes the low-frequency branch into luminance (Y) and chrominance (CbCr) components, reducing redundancy and enhancing feature processing. Additionally, we adopt an all-zero mapping strategy for high-frequency components during upscaling, focusing essential rescaling information within the LR image. Our T-InvBlocks can be seamlessly integrated into existing rescaling models, improving performance in both general rescaling tasks and scenarios involving lossy compression. Extensive experiments confirm that our method advances the state of the art in HR image reconstruction.
- Abstract(参考訳): 高分解能(HR)画像は通常、帯域幅を減らすために低分解能(LR)にダウンスケールされ、続いて元の細部をアップスケールして復元する。
画像再スケーリングアルゴリズムの最近の進歩は、非可逆ニューラルネットワーク(INN)を使用して、ダウンスケーリングとアップスケーリングのための統一されたフレームワークを作成し、LRとHRイメージの1対1マッピングを保証する。
従来の手法では、デュアルブランチベースのバニラ可逆ブロックを利用し、高周波と低周波の情報を別々に処理し、しばしば高周波コンポーネントをモデル化するために特定の分布に依存する。
しかし、RGB領域で直接低周波成分を処理すると、チャネル冗長が生じ、画像再構成の効率が制限される。
これらの課題に対処するため,低周波分岐を輝度 (Y) とクロミナンス (CbCr) 成分に分解し,冗長性を低減し,特徴処理を向上するプラグアンドプレイ三分岐可逆ブロック (T-InvBlocks) を提案する。
さらに、アップスケーリング中に高周波数成分に対する全ゼロマッピング戦略を採用し、LR画像内の重要な再スケーリング情報に焦点をあてる。
我々のT-InvBlocksは、既存の再スケーリングモデルにシームレスに統合することができ、一般的な再スケーリングタスクと損失圧縮を含むシナリオの両方のパフォーマンスを改善します。
広汎な実験により,HR画像再構成における最先端の進歩が確認された。
関連論文リスト
- RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Gated Multi-Resolution Transfer Network for Burst Restoration and
Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。
5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文 参考訳(メタデータ) (2023-04-13T17:54:00Z) - Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - DCS-RISR: Dynamic Channel Splitting for Efficient Real-world Image
Super-Resolution [15.694407977871341]
実世界の画像超解像(RISR)は、未知の複雑な劣化下でのSR画像の品質向上に重点を置いている。
既存の手法は、分解レベルが異なる低解像度(LR)画像を強化するために重いSRモデルに依存している。
本稿では,DCS-RISRと呼ばれる高効率リアルタイム画像超解法のための動的チャネル分割方式を提案する。
論文 参考訳(メタデータ) (2022-12-15T04:34:57Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - Super-Resolution of Real-World Faces [3.4376560669160394]
実の低解像度 (LR) の顔画像は、変わらず複雑で既知のダウンサンプリングカーネルによってキャプチャされる劣化を含んでいる。
本稿では,特徴抽出モジュールがLR画像からロバストな特徴を抽出する2つのモジュール超解像ネットワークを提案する。
我々は、劣化GANを訓練し、双対的に縮小されたクリーン画像を実際の劣化画像に変換し、得られた劣化LR画像と、そのクリーンLR画像とを補間する。
論文 参考訳(メタデータ) (2020-11-04T17:25:54Z) - Deep Generative Adversarial Residual Convolutional Networks for
Real-World Super-Resolution [31.934084942626257]
我々は,超解像残差畳み込み生成共役ネットワーク(SRResCGAN)を提案する。
これは、生成したLRドメインからHRドメインの画素単位の監督でモデルを逆トレーニングすることで、現実世界の劣化設定に従う。
提案するネットワークは,画像の高精細化と凸最適化によるエネルギーベース目的関数の最小化により,残差学習を利用する。
論文 参考訳(メタデータ) (2020-05-03T00:12:38Z) - Blur, Noise, and Compression Robust Generative Adversarial Networks [85.68632778835253]
劣化画像から直接クリーンな画像生成装置を学習するために, ぼかし, ノイズ, 圧縮堅牢なGAN(BNCR-GAN)を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ぼやけたカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を実証する。
論文 参考訳(メタデータ) (2020-03-17T17:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。