論文の概要: Approaching the Limit of Image Rescaling via Flow Guidance
- arxiv url: http://arxiv.org/abs/2111.05133v1
- Date: Tue, 9 Nov 2021 13:17:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 19:08:02.437826
- Title: Approaching the Limit of Image Rescaling via Flow Guidance
- Title(参考訳): フローガイダンスによる画像再スケーリングの限界へのアプローチ
- Authors: Shang Li, Guixuan Zhang, Zhengxiong Luo, Jie Liu, Zhi Zeng, Shuwu
Zhang
- Abstract要約: 本稿では, ダウンスケーリング中に, ダウンスケールされた表現を視覚的に可視な画像に変換し, アップスケーリング中に再変換できる非可逆フロー誘導モジュール(FGM)を提案する。
ダウンスケール画像と再構成画像の両方において、最先端(SotA)のパフォーマンスを達成することができる。
- 参考スコア(独自算出の注目度): 9.203416129039871
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image downscaling and upscaling are two basic rescaling operations. Once the
image is downscaled, it is difficult to be reconstructed via upscaling due to
the loss of information. To make these two processes more compatible and
improve the reconstruction performance, some efforts model them as a joint
encoding-decoding task, with the constraint that the downscaled (i.e. encoded)
low-resolution (LR) image must preserve the original visual appearance. To
implement this constraint, most methods guide the downscaling module by
supervising it with the bicubically downscaled LR version of the original
high-resolution (HR) image. However, this bicubic LR guidance may be suboptimal
for the subsequent upscaling (i.e. decoding) and restrict the final
reconstruction performance. In this paper, instead of directly applying the LR
guidance, we propose an additional invertible flow guidance module (FGM), which
can transform the downscaled representation to the visually plausible image
during downscaling and transform it back during upscaling. Benefiting from the
invertibility of FGM, the downscaled representation could get rid of the LR
guidance and would not disturb the downscaling-upscaling process. It allows us
to remove the restrictions on the downscaling module and optimize the
downscaling and upscaling modules in an end-to-end manner. In this way, these
two modules could cooperate to maximize the HR reconstruction performance.
Extensive experiments demonstrate that the proposed method can achieve
state-of-the-art (SotA) performance on both downscaled and reconstructed
images.
- Abstract(参考訳): イメージのダウンスケーリングとアップスケーリングは2つの基本的な再スケーリング操作である。
画像がダウンスケールされると、情報の喪失により、アップスケーリングによって再構築することが困難になる。
これら2つのプロセスの互換性を向上し、再構成性能を向上させるため、いくつかの取り組みでは、ダウンスケール(エンコードされた)低解像度(LR)画像が元の視覚的外観を保たなければならないという制約を伴って、共同符号化復号タスクとしてモデル化する。
この制約を実装するために、ほとんどのメソッドは、オリジナルの高解像度(HR)画像の双対的にダウンスケールされたLRバージョンで監視することで、ダウンスケーリングモジュールを誘導する。
しかし、このバイコビックLR誘導は、その後のアップスケーリング(デコード)に最適であり、最終的な再構築性能を制限する可能性がある。
本稿では、LR誘導を直接適用する代わりに、ダウンスケーリング中にダウンスケールされた表現を視覚的に可視な画像に変換し、アップスケーリング中に再変換する逆流誘導モジュール(FGM)を提案する。
FGMの可逆性から見れば、縮小された表現はLR誘導を排除でき、ダウンスケーリング・アップスケーリングのプロセスを妨げない。
これにより、ダウンスケーリングモジュールの制限を取り除き、ダウンスケーリングおよびアップスケーリングモジュールをエンドツーエンドで最適化できます。
このようにして、これらの2つのモジュールはHR再建性能を最大化するために協力することができる。
大規模な実験により, 提案手法は, ダウンスケール画像と再構成画像の両方において, 最先端(SotA)の性能を達成できることが実証された。
関連論文リスト
- Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [46.96362010335177]
本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文 参考訳(メタデータ) (2024-03-30T08:05:00Z) - Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - Invertible Rescaling Network and Its Extensions [118.72015270085535]
本研究では,新たな視点から双方向の劣化と復元をモデル化する,新しい可逆的枠組みを提案する。
我々は、有効な劣化画像を生成し、失われたコンテンツの分布を変換する可逆モデルを開発する。
そして、ランダムに描画された潜在変数とともに、生成された劣化画像に逆変換を適用することにより、復元可能とする。
論文 参考訳(メタデータ) (2022-10-09T06:58:58Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Towards Lightweight Super-Resolution with Dual Regression Learning [58.98801753555746]
深層ニューラルネットワークは、画像超解像(SR)タスクにおいて顕著な性能を示した。
SR問題は通常不適切な問題であり、既存の手法にはいくつかの制限がある。
本稿では、SRマッピングの可能な空間を削減するために、二重回帰学習方式を提案する。
論文 参考訳(メタデータ) (2022-07-16T12:46:10Z) - Toward Real-world Image Super-resolution via Hardware-based Adaptive
Degradation Models [3.9037347042028254]
ほとんどの単一画像超解像法は、合成低分解能(LR)と高分解能(HR)画像対上で開発されている。
ハードウェアの知識を取り入れた未知の劣化過程をシミュレートする新しい教師付き手法を提案する。
実世界のデータセットを用いた実験により,我々の劣化モデルが所定の劣化操作よりも精度良くLR画像を推定できることが確認された。
論文 参考訳(メタデータ) (2021-10-20T19:53:48Z) - Hierarchical Conditional Flow: A Unified Framework for Image
Super-Resolution and Image Rescaling [139.25215100378284]
画像SRと画像再スケーリングのための統合フレームワークとして階層的条件フロー(HCFlow)を提案する。
HCFlowは、LR画像と残りの高周波成分の分布を同時にモデル化することにより、HRとLR画像ペア間のマッピングを学習する。
さらに性能を高めるために、知覚的損失やGAN損失などの他の損失と、トレーニングで一般的に使用される負の対数類似損失とを組み合わせる。
論文 参考訳(メタデータ) (2021-08-11T16:11:01Z) - LAPAR: Linearly-Assembled Pixel-Adaptive Regression Network for Single
Image Super-Resolution and Beyond [75.37541439447314]
単一画像超解像(SISR)は、低解像度(LR)画像を高解像度(HR)バージョンにアップサンプリングする根本的な問題を扱う。
本稿では,線形組立画素適応回帰ネットワーク (LAPAR) を提案する。
論文 参考訳(メタデータ) (2021-05-21T15:47:18Z) - Closed-loop Matters: Dual Regression Networks for Single Image
Super-Resolution [73.86924594746884]
ディープニューラルネットワークは、画像超解像において有望な性能を示した。
これらのネットワークは、低分解能(LR)画像から高分解能(HR)画像への非線形マッピング関数を学習する。
本稿では,可能な関数の空間を削減するために,LRデータに新たな制約を導入することで,二重回帰手法を提案する。
論文 参考訳(メタデータ) (2020-03-16T04:23:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。