論文の概要: MOFA: A Model Simplification Roadmap for Image Restoration on Mobile
Devices
- arxiv url: http://arxiv.org/abs/2308.12494v1
- Date: Thu, 24 Aug 2023 01:29:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-25 15:44:11.488700
- Title: MOFA: A Model Simplification Roadmap for Image Restoration on Mobile
Devices
- Title(参考訳): MOFA: モバイルデバイス上の画像復元のためのモデル簡易ロードマップ
- Authors: Xiangyu Chen, Ruiwen Zhen, Shuai Li, Xiaotian Li and Guanghui Wang
- Abstract要約: 本稿では,展開前の画像復元モデルをさらに高速化するロードマップを提案する。
提案手法は,PSNRとSSIMを増大させながら,ランタイムを最大13%削減し,パラメータ数を最大23%削減する。
- 参考スコア(独自算出の注目度): 17.54747506334433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration aims to restore high-quality images from degraded
counterparts and has seen significant advancements through deep learning
techniques. The technique has been widely applied to mobile devices for tasks
such as mobile photography. Given the resource limitations on mobile devices,
such as memory constraints and runtime requirements, the efficiency of models
during deployment becomes paramount. Nevertheless, most previous works have
primarily concentrated on analyzing the efficiency of single modules and
improving them individually. This paper examines the efficiency across
different layers. We propose a roadmap that can be applied to further
accelerate image restoration models prior to deployment while simultaneously
increasing PSNR (Peak Signal-to-Noise Ratio) and SSIM (Structural Similarity
Index). The roadmap first increases the model capacity by adding more
parameters to partial convolutions on FLOPs non-sensitive layers. Then, it
applies partial depthwise convolution coupled with decoupling
upsampling/downsampling layers to accelerate the model speed. Extensive
experiments demonstrate that our approach decreases runtime by up to 13% and
reduces the number of parameters by up to 23%, while increasing PSNR and SSIM
on several image restoration datasets. Source Code of our method is available
at \href{https://github.com/xiangyu8/MOFA}{https://github.com/xiangyu8/MOFA}.
- Abstract(参考訳): 画像復元は、劣化した画像から高品質な画像を復元することを目的としており、ディープラーニング技術によって大きな進歩を遂げている。
この技術は、モバイル写真などのタスクにモバイルデバイスに広く適用されている。
メモリ制約やランタイム要件といったモバイルデバイスのリソース制限を考えると、デプロイメント中のモデルの効率性が最優先される。
それにもかかわらず、以前のほとんどの研究は主に単一モジュールの効率を分析し、個別に改善することに集中してきた。
本稿では,異なる層間の効率について検討する。
我々は,PSNR(Peak Signal-to-Noise Ratio)とSSIM(Structural similarity Index)を同時に増加させながら,展開前の画像復元モデルをさらに高速化するロードマップを提案する。
ロードマップはまず、フロープ非感受性層上の部分畳み込みにより多くのパラメータを追加することで、モデルキャパシティを増加させる。
そして、モデル速度を加速するために、部分的な奥行きの畳み込みと、アップサンプリング/ダウンサンプリング層を分離する。
大規模な実験では,複数の画像復元データセット上でPSNRとSSIMを増大させながら,ランタイムを最大13%減らし,パラメータ数を最大23%減らした。
我々のメソッドのソースコードは、 \href{https://github.com/xiangyu8/MOFA}{https://github.com/xiangyu8/MOFA} で入手できる。
関連論文リスト
- Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models [26.926712014346432]
本稿では,新しいマルチレゾリューションネットワークと時間依存層正規化を統合することで,拡散モデルの革新的拡張を提案する。
提案手法の有効性は,ImageNet 256 x 256で1.70,ImageNet 512 x 512で2.89の新しい最先端FIDスコアを設定することで,クラス条件のImageNet生成ベンチマークで実証される。
論文 参考訳(メタデータ) (2024-06-13T17:59:58Z) - Look-Around Before You Leap: High-Frequency Injected Transformer for Image Restoration [46.96362010335177]
本稿では,画像復元のための簡易かつ効果的な高周波インジェクト変換器HITを提案する。
具体的には,機能マップに高頻度の詳細を組み込んだウィンドウワイドインジェクションモジュール(WIM)を設計し,高品質な画像の復元のための信頼性の高い参照を提供する。
さらに,BIMにおけるチャネル次元の計算によって失われる可能性のある空間的関係を維持するために,空間拡張ユニット(SEU)を導入する。
論文 参考訳(メタデータ) (2024-03-30T08:05:00Z) - Efficient Diffusion Model for Image Restoration by Residual Shifting [63.02725947015132]
本研究では,画像復元のための新しい,効率的な拡散モデルを提案する。
提案手法は,推論中の後処理の高速化を回避し,関連する性能劣化を回避する。
提案手法は,3つの古典的IRタスクにおける現在の最先端手法よりも優れた,あるいは同等の性能を実現する。
論文 参考訳(メタデータ) (2024-03-12T05:06:07Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Improving Pixel-based MIM by Reducing Wasted Modeling Capability [77.99468514275185]
浅い層から低レベルの特徴を明示的に利用して画素再構成を支援する手法を提案する。
私たちの知る限りでは、等方的アーキテクチャのためのマルチレベル特徴融合を体系的に研究するのは、私たちは初めてです。
提案手法は, 微調整では1.2%, 線形探索では2.8%, セマンティックセグメンテーションでは2.6%など, 大幅な性能向上をもたらす。
論文 参考訳(メタデータ) (2023-08-01T03:44:56Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Asymmetric Learned Image Compression with Multi-Scale Residual Block,
Importance Map, and Post-Quantization Filtering [15.056672221375104]
ディープラーニングに基づく画像圧縮は、最新のH.266/VVCよりも高いレート歪み(R-D)性能を実現している。
多くの先導的な学習スキームは、パフォーマンスと複雑さの間の良いトレードオフを維持することができません。
そこで本研究では,R-D の性能を技術状況よりも低い複雑さで実現した,効率的かつ効果的な画像符号化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-21T09:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。