論文の概要: FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models
- arxiv url: http://arxiv.org/abs/2410.18083v3
- Date: Tue, 25 Mar 2025 15:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 20:13:27.562107
- Title: FIPER: Generalizable Factorized Features for Robust Low-Level Vision Models
- Title(参考訳): FIPER:ロバスト低レベルビジョンモデルのための一般化可能な因子化特徴
- Authors: Yang-Che Sun, Cheng Yu Yeo, Ernie Chu, Jun-Cheng Chen, Yu-Lun Liu,
- Abstract要約: 低レベル視覚タスクに統一表現(Factized Features)を用いることを提案する。
これらのタスク間の共通原則によって動機付けられ、細かい画像の詳細を復元し保存する必要がある。
- 参考スコア(独自算出の注目度): 12.77409981295186
- License:
- Abstract: In this work, we propose using a unified representation, termed Factorized Features, for low-level vision tasks, where we test on Single Image Super-Resolution (SISR) and Image Compression. Motivated by the shared principles between these tasks, they require recovering and preserving fine image details, whether by enhancing resolution for SISR or reconstructing compressed data for Image Compression. Unlike previous methods that mainly focus on network architecture, our proposed approach utilizes a basis-coefficient decomposition as well as an explicit formulation of frequencies to capture structural components and multi-scale visual features in images, which addresses the core challenges of both tasks. We replace the representation of prior models from simple feature maps with Factorized Features to validate the potential for broad generalizability. In addition, we further optimize the pipelines by leveraging the mergeable-basis property of our Factorized Features, which consolidates shared structures on multi-frame compression and super-resolution. Extensive experiments show that our unified representation delivers state-of-the-art performance, achieving an average relative improvement of 204.4% in PSNR over the baseline in Super-Resolution (SR) and 9.35% BD-rate reduction in Image Compression compared to the previous SOTA.
- Abstract(参考訳): 本研究では、低レベルの視覚タスクに対して、一元的表現であるFactized Featuresを用いて、Single Image Super-Resolution (SISR) と Image Compression を試す。
これらのタスク間で共有される原則により、SISRの解像度を向上するか、画像圧縮のために圧縮されたデータを再構築するかにかかわらず、細かな画像の詳細を復元および保存する必要がある。
ネットワークアーキテクチャを主眼とする従来の手法とは違い,提案手法では,基本係数分解と周波数の明示的な定式化を利用して,画像中の構造成分とマルチスケール視覚特徴をキャプチャし,両タスクのコア課題に対処する。
我々は、より広範な一般化可能性の可能性を検証するために、単純な特徴写像からFactized Featuresに置き換える。
さらに,マルチフレーム圧縮と超解像の共有構造を集約するFactized Featuresのマージ可能な基底特性を活用することで,パイプラインをさらに最適化する。
超解法(SR)のベースラインよりもPSNRが204.4%向上し,画像圧縮の9.35%が削減された。
関連論文リスト
- All-in-One Image Compression and Restoration [55.25638059492943]
我々はオールインワン画像の圧縮と復元のための統一的なフレームワークを提案する。
様々な劣化に対する画像復元機能を画像圧縮のプロセスに組み込む。
論文 参考訳(メタデータ) (2025-02-05T22:21:05Z) - Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling [6.861753163565238]
現実世界のアプリケーションでは、ほとんどの画像は伝送のために圧縮される。
圧縮対応画像再スケーリングのための自己非対称可逆ネットワーク(SAIN)を提案する。
論文 参考訳(メタデータ) (2023-03-04T08:33:46Z) - Bridging Component Learning with Degradation Modelling for Blind Image
Super-Resolution [69.11604249813304]
視覚障害者のためのコンポーネント分解・協調最適化ネットワーク(CDCN)を提案する。
CDCNは入力LR画像を特徴空間の構造と詳細成分に分解する。
本稿では,HR画像の細部と構造復元過程を協調的に監督する,劣化駆動型学習戦略を提案する。
論文 参考訳(メタデータ) (2022-12-03T14:53:56Z) - HST: Hierarchical Swin Transformer for Compressed Image Super-resolution [26.589370745694502]
低解像度圧縮画像を復元する階層型スウィントランス (HST) ネットワークを提案する。
我々のHSTは、低品質の圧縮画像超解像トラックにおけるAIM 2022の5位であり、PSNRは23.51dBである。
論文 参考訳(メタデータ) (2022-08-21T13:41:51Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Towards Compact CNNs via Collaborative Compression [166.86915086497433]
チャネルプルーニングとテンソル分解を結合してCNNモデルを圧縮する協調圧縮方式を提案する。
52.9%のFLOPを削減し、ResNet-50で48.4%のパラメータを削除しました。
論文 参考訳(メタデータ) (2021-05-24T12:07:38Z) - Regularized Compression of MRI Data: Modular Optimization of Joint
Reconstruction and Coding [2.370481325034443]
本稿では,MRI再構成と損失圧縮の協調最適化のためのフレームワークを提案する。
本手法は,品質とビットレートのトレードオフを改善するために,医用画像の圧縮表現を生成する。
正規化法と比較すると,PSNRは高いビットレートで0.5から1dBのゲインが得られる。
論文 参考訳(メタデータ) (2020-10-08T15:32:52Z) - Structure-Preserving Super Resolution with Gradient Guidance [87.79271975960764]
単一画像超解像(SISR)の構造
最近のGAN(Generative Adversarial Network)による研究は、SISRの開発を促進している。
しかし、復元された画像には常に望ましくない構造歪みがある。
論文 参考訳(メタデータ) (2020-03-29T17:26:58Z) - A GAN-based Tunable Image Compression System [13.76136694287327]
本稿では、GAN(Generative Adversarial Network)を用いてコンテンツベースの圧縮を再考し、重要でない領域を再構築する。
モデルを再トレーニングすることなく、特定の圧縮比に画像を圧縮するチューナブル圧縮スキームも提案する。
論文 参考訳(メタデータ) (2020-01-18T02:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。