論文の概要: Effective Invertible Arbitrary Image Rescaling
- arxiv url: http://arxiv.org/abs/2209.13055v1
- Date: Mon, 26 Sep 2022 22:22:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 16:19:43.247557
- Title: Effective Invertible Arbitrary Image Rescaling
- Title(参考訳): 有効非可逆任意画像再スケーリング
- Authors: Zhihong Pan, Baopu Li, Dongliang He, Wenhao Wu, Errui Ding
- Abstract要約: Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
- 参考スコア(独自算出の注目度): 77.46732646918936
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Great successes have been achieved using deep learning techniques for image
super-resolution (SR) with fixed scales. To increase its real world
applicability, numerous models have also been proposed to restore SR images
with arbitrary scale factors, including asymmetric ones where images are
resized to different scales along horizontal and vertical directions. Though
most models are only optimized for the unidirectional upscaling task while
assuming a predefined downscaling kernel for low-resolution (LR) inputs, recent
models based on Invertible Neural Networks (INN) are able to increase upscaling
accuracy significantly by optimizing the downscaling and upscaling cycle
jointly. However, limited by the INN architecture, it is constrained to fixed
integer scale factors and requires one model for each scale. Without increasing
model complexity, a simple and effective invertible arbitrary rescaling network
(IARN) is proposed to achieve arbitrary image rescaling by training only one
model in this work. Using innovative components like position-aware scale
encoding and preemptive channel splitting, the network is optimized to convert
the non-invertible rescaling cycle to an effectively invertible process. It is
shown to achieve a state-of-the-art (SOTA) performance in bidirectional
arbitrary rescaling without compromising perceptual quality in LR outputs. It
is also demonstrated to perform well on tests with asymmetric scales using the
same network architecture.
- Abstract(参考訳): 画像超解像(SR)のための深層学習技術を用いて、一定のスケールで大きな成功を収めた。
実世界の適用性を高めるために、水平方向と垂直方向の異なるスケールに画像が再サイズされる非対称な要素を含む任意のスケール要素でSR画像を復元する多くのモデルも提案されている。
ほとんどのモデルは、低解像度(LR)入力に対する事前定義されたダウンスケーリングカーネルを仮定しながら、一方向のアップスケーリングタスクに最適化されているだけであるが、Invertible Neural Networks (INN) に基づく最近のモデルは、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することで、アップスケーリング精度を著しく向上させることができる。
しかし、innアーキテクチャによって制限されるため、固定整数スケール係数に制限され、各スケールに1つのモデルが必要である。
モデル複雑性を増大させることなく、本研究の1つのモデルのみをトレーニングすることで任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
位置認識スケールエンコーディングやプリエンプティブチャネル分割といった革新的なコンポーネントを使用して、ネットワークは非可逆的再スケーリングサイクルを効果的に非可逆プロセスに変換するように最適化されている。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
また、同じネットワークアーキテクチャを用いた非対称スケールのテストでもうまく機能することが示されている。
関連論文リスト
- Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。
しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。
本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T02:14:04Z) - MsDC-DEQ-Net: Deep Equilibrium Model (DEQ) with Multi-scale Dilated
Convolution for Image Compressive Sensing (CS) [0.0]
圧縮センシング(CS)は、従来のサンプリング法よりも少ない測定値を用いてスパース信号の回復を可能にする技術である。
我々はCSを用いた自然画像再構成のための解釈可能かつ簡潔なニューラルネットワークモデルを構築した。
MsDC-DEQ-Netと呼ばれるこのモデルは、最先端のネットワークベースの手法と比較して、競争力のある性能を示す。
論文 参考訳(メタデータ) (2024-01-05T16:25:58Z) - Efficient Model Agnostic Approach for Implicit Neural Representation
Based Arbitrary-Scale Image Super-Resolution [5.704360536038803]
単一の画像超解像(SISR)は、主に深層畳み込みネットワークによって大きく進歩した。
従来のネットワークは、画像を一定のスケールにスケールアップすることに限定されており、任意のスケールのイメージを生成するために暗黙の神経機能を利用することになる。
我々は,任意のスケールで超解像を実現する,新しい,効率的なフレームワークであるMixture of Experts Implicit Super-Resolution(MoEISR)を導入する。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - Enhancing Image Rescaling using Dual Latent Variables in Invertible
Neural Network [42.18106162158025]
画像ダウンスケーリングプロセスのバリエーションをモデル化するために、新しいダウンスケーリング潜在変数が導入された。
これにより、ダウンスケールのLR画像の画質を犠牲にすることなく、画像のアップスケーリング精度を一貫して向上させることができる。
また、画像隠蔽のような画像復元アプリケーションのための他の INN ベースのモデルの拡張にも有効であることが示されている。
論文 参考訳(メタデータ) (2022-07-24T23:12:51Z) - Towards Bidirectional Arbitrary Image Rescaling: Joint Optimization and
Cycle Idempotence [76.93002743194974]
本稿では、任意の再スケーリング(アップスケーリングとダウンスケーリングの両方)を統一プロセスとして扱う方法を提案する。
提案モデルでは、アップスケーリングとダウンスケーリングを同時に学習し、双方向の任意のイメージ再スケーリングを実現する。
繰り返しにダウンスケーリング・アップスケーリング・サイクルが適用された場合, 復元精度が著しく低下することなく, サイクルイデオポテンス試験において堅牢であることが確認された。
論文 参考訳(メタデータ) (2022-03-02T07:42:15Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。