論文の概要: PocketSR: The Super-Resolution Expert in Your Pocket Mobiles
- arxiv url: http://arxiv.org/abs/2510.03012v1
- Date: Fri, 03 Oct 2025 13:56:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-06 16:35:52.409108
- Title: PocketSR: The Super-Resolution Expert in Your Pocket Mobiles
- Title(参考訳): PocketSR: ポケットモバイルのスーパーリゾリューションの専門家
- Authors: Haoze Sun, Linfeng Jiang, Fan Li, Renjing Pei, Zhixin Wang, Yong Guo, Jiaqi Xu, Haoyu Chen, Jin Han, Fenglong Song, Yujiu Yang, Wenbo Li,
- Abstract要約: リアルワールド・イメージ・スーパーレゾリューション (RealSR) は、携帯電話が捉えたような、Wild内の画像の視覚的品質を高めることを目的としている。
大規模な生成モデルを利用する既存の手法は印象的な結果を示しているが、計算コストとレイテンシが高いため、エッジ配置には実用的ではない。
超軽量単一ステップモデルであるPocketSRを導入し,高忠実度を維持しつつ生成モデリング機能をRealSRにもたらす。
- 参考スコア(独自算出の注目度): 69.26751136689533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world image super-resolution (RealSR) aims to enhance the visual quality of in-the-wild images, such as those captured by mobile phones. While existing methods leveraging large generative models demonstrate impressive results, the high computational cost and latency make them impractical for edge deployment. In this paper, we introduce PocketSR, an ultra-lightweight, single-step model that brings generative modeling capabilities to RealSR while maintaining high fidelity. To achieve this, we design LiteED, a highly efficient alternative to the original computationally intensive VAE in SD, reducing parameters by 97.5% while preserving high-quality encoding and decoding. Additionally, we propose online annealing pruning for the U-Net, which progressively shifts generative priors from heavy modules to lightweight counterparts, ensuring effective knowledge transfer and further optimizing efficiency. To mitigate the loss of prior knowledge during pruning, we incorporate a multi-layer feature distillation loss. Through an in-depth analysis of each design component, we provide valuable insights for future research. PocketSR, with a model size of 146M parameters, processes 4K images in just 0.8 seconds, achieving a remarkable speedup over previous methods. Notably, it delivers performance on par with state-of-the-art single-step and even multi-step RealSR models, making it a highly practical solution for edge-device applications.
- Abstract(参考訳): リアルワールド・イメージ・スーパーレゾリューション (RealSR) は、携帯電話が捉えたような、Wild内の画像の視覚的品質を高めることを目的としている。
大規模な生成モデルを活用する既存の手法は印象的な結果を示しているが、計算コストとレイテンシが高いため、エッジデプロイメントでは実用的ではない。
本稿では,高忠実度を維持しつつ,RealSRに生成的モデリング機能を提供する,超軽量単一ステップモデルであるPocketSRを紹介する。
これを実現するために、私たちは、SDにおける元の計算集約型VAEの高効率な代替品であるLiteEDを設計し、高品質な符号化と復号を保ちながらパラメータを97.5%削減した。
さらに,重モジュールから軽量モジュールへ生成前処理を段階的にシフトさせ,効果的な知識伝達を確実にし,効率をさらに最適化するU-Netのオンラインアニーリングプルーニングを提案する。
刈り込み時の先行知識の喪失を軽減するため,多層式蒸留損失を取り入れた。
各デザインコンポーネントの詳細な分析を通じて、将来の研究に有用な洞察を提供する。
モデルサイズ146MのPocketSRは、わずか0.8秒で4K画像を処理し、従来の手法よりも顕著なスピードアップを実現した。
特に、最先端のシングルステップやマルチステップのRealSRモデルと同等のパフォーマンスを提供しており、エッジデバイスアプリケーションにとって非常に実用的なソリューションである。
関連論文リスト
- TinySR: Pruning Diffusion for Real-World Image Super-Resolution [35.07163534857897]
本稿では,Real-ISR用に設計されたコンパクトで効果的な拡散モデルTinySRを提案する。
TinySRは計算コストとモデルサイズを大幅に削減し、5.68倍の高速化と83%のパラメータ削減を実現した。
論文 参考訳(メタデータ) (2025-08-24T16:17:33Z) - Low-Resource Video Super-Resolution using Memory, Wavelets, and Deformable Convolutions [3.018928786249079]
ビデオスーパーレゾリューション(VSR)は、リソース制約のあるエッジデバイスへのデプロイにおいて、依然として大きな課題である。
本稿では,230万のパラメータで最先端の再現精度を実現する,VSRのための新しい軽量かつパラメータ効率のニューラルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-03T20:46:15Z) - Collaborative Decoding Makes Visual Auto-Regressive Modeling Efficient [52.96232442322824]
CoDe(Collaborative Decoding)は、Visual Auto-Regressive (VAR)フレームワーク用に設計された、新しい効率的なデコーディング戦略である。
CoDeは、大規模でのパラメータ要求の大幅な削減と、異なるスケールでの排他的生成パターンという、2つの重要な観察に乗じている。
CoDeは1.7倍のスピードアップを実現し、メモリ使用量を約50%削減し、画像品質を1.95から1.98に改善した。
論文 参考訳(メタデータ) (2024-11-26T15:13:15Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient Approach [58.57026686186709]
本稿では, Convolutional Transformer Layer (ConvFormer) を導入し, ConvFormer-based Super-Resolution Network (CFSR) を提案する。
CFSRは畳み込みベースのアプローチとトランスフォーマーベースのアプローチの両方の利点を継承する。
CFSRは計算コストと性能のバランスが最適であることを示す実験である。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z) - Generative Adversarial Super-Resolution at the Edge with Knowledge
Distillation [1.3764085113103222]
シングルイメージのスーパーソリューションは、信頼できるビジュアルストリームが必要な環境でのロボットタスクをサポートすることができる。
我々は,EdgeSRGANと呼ばれるリアルタイム超解法のための効率的な生成逆ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2022-09-07T10:58:41Z) - Extremely Lightweight Quantization Robust Real-Time Single-Image Super
Resolution for Mobile Devices [0.0]
シングルイメージ・スーパーレゾリューション(SISR)は古典的なコンピュータビジョンの問題であり、数十年にわたって研究されてきた。
SISRに関する最近の研究は、ディープラーニングの方法論に焦点を合わせ、最先端の結果を得る。
ハードウェア(Synaptics Dolphin NPU)を意識した超軽量量子化ロバストリアルタイム超解像ネットワーク(XLSR)を提案する。
論文 参考訳(メタデータ) (2021-05-21T11:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。