論文の概要: Real-Time Image Demoireing on Mobile Devices
- arxiv url: http://arxiv.org/abs/2302.02184v1
- Date: Sat, 4 Feb 2023 15:42:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 19:37:49.422429
- Title: Real-Time Image Demoireing on Mobile Devices
- Title(参考訳): モバイルデバイス上でのリアルタイム画像復調
- Authors: Yuxin Zhang, Mingbao Lin, Xunchao Li, Han Liu, Guozhi Wang, Fei Chao,
Shuai Ren, Yafei Wen, Xiaoxin Chen, Rongrong Ji
- Abstract要約: 本稿では,モバイルデバイス上でのリアルタイム展開に向けた動的復号化高速化手法(DDA)を提案する。
私たちの刺激は、モアレパターンが画像全体に不均衡に分散されることが、シンプルで普遍的な事実に起因しています。
提案手法は推定時間を劇的に短縮し,モバイルデバイス上でリアルタイムな画像復調を実現する。
- 参考スコア(独自算出の注目度): 59.59997851375429
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Moire patterns appear frequently when taking photos of digital screens,
drastically degrading the image quality. Despite the advance of CNNs in image
demoireing, existing networks are with heavy design, causing redundant
computation burden for mobile devices. In this paper, we launch the first study
on accelerating demoireing networks and propose a dynamic demoireing
acceleration method (DDA) towards a real-time deployment on mobile devices. Our
stimulus stems from a simple-yet-universal fact that moire patterns often
unbalancedly distribute across an image. Consequently, excessive computation is
wasted upon non-moire areas. Therefore, we reallocate computation costs in
proportion to the complexity of image patches. In order to achieve this aim, we
measure the complexity of an image patch by designing a novel moire prior that
considers both colorfulness and frequency information of moire patterns. Then,
we restore image patches with higher-complexity using larger networks and the
ones with lower-complexity are assigned with smaller networks to relieve the
computation burden. At last, we train all networks in a parameter-shared
supernet paradigm to avoid additional parameter burden. Extensive experiments
on several benchmarks demonstrate the efficacy of our proposed DDA. In
addition, the acceleration evaluated on the VIVO X80 Pro smartphone equipped
with a chip of Snapdragon 8 Gen 1 shows that our method can drastically reduce
the inference time, leading to a real-time image demoireing on mobile devices.
Source codes and models are released at https://github.com/zyxxmu/DDA
- Abstract(参考訳): モアレパターンは、デジタルスクリーンの写真を撮るときに頻繁に現れ、画質を大幅に劣化させる。
画像復号化におけるCNNの進歩にもかかわらず、既存のネットワークは設計が重く、モバイルデバイスに冗長な計算負荷をもたらす。
本稿では,デモレーアネットワークの高速化に関する最初の研究を開始し,モバイルデバイス上でのリアルタイム展開に向けた動的デモレーア・アクセラレーション手法(dda)を提案する。
私たちの刺激は、モアレパターンが画像全体に不均衡に分散されることが、シンプルで普遍的な事実に起因しています。
その結果、過剰な計算は非モアレ領域で無駄にされる。
したがって,画像パッチの複雑さに比例して計算コストを再配置する。
この目的を達成するために,moireパターンのカラフルさと頻度情報の両方を考慮した新しいmoire preを設計し,画像パッチの複雑さを測定する。
そして,より大規模なネットワークを用いて画像パッチを復元し,より複雑な画像パッチを小さなネットワークに割り当て,計算負担を軽減する。
最終的に、パラメータの重荷を避けるためにパラメータ共有スーパーネットパラダイムですべてのネットワークをトレーニングします。
いくつかのベンチマークにおいて,提案したDDAの有効性を示す実験を行った。
さらに、snapdragon 8 gen 1のチップを搭載したvivo x80 proスマートフォンで評価された加速度は、この手法が推定時間を劇的に短縮し、モバイルデバイスでのリアルタイム画像の復調に繋がることを示している。
ソースコードとモデルはhttps://github.com/zyxxmu/ddaでリリース
関連論文リスト
- Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models [26.926712014346432]
本稿では,新しいマルチレゾリューションネットワークと時間依存層正規化を統合することで,拡散モデルの革新的拡張を提案する。
提案手法の有効性は,ImageNet 256 x 256で1.70,ImageNet 512 x 512で2.89の新しい最先端FIDスコアを設定することで,クラス条件のImageNet生成ベンチマークで実証される。
論文 参考訳(メタデータ) (2024-06-13T17:59:58Z) - MOFA: A Model Simplification Roadmap for Image Restoration on Mobile
Devices [17.54747506334433]
本稿では,展開前の画像復元モデルをさらに高速化するロードマップを提案する。
提案手法は,PSNRとSSIMを増大させながら,ランタイムを最大13%削減し,パラメータ数を最大23%削減する。
論文 参考訳(メタデータ) (2023-08-24T01:29:15Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Real-Time Neural Light Field on Mobile Devices [54.44982318758239]
低レイテンシで小さなサイズでモバイルデバイス上で効率的に動作する新しいネットワークアーキテクチャを導入する。
本モデルでは,合成シーンと実世界のシーンの両方において,リアルタイムな推論を維持しながら高分解能な生成を実現する。
論文 参考訳(メタデータ) (2022-12-15T18:58:56Z) - FMD-cGAN: Fast Motion Deblurring using Conditional Generative
Adversarial Networks [26.878173373199786]
本稿では,1枚の画像の視覚的動きを識別するFMD-cGAN(Fast Motion Deblurring-Conditional Generative Adversarial Network)を提案する。
FMD-cGANは、画像が損なわれた後、印象的な構造的類似性と視覚的外観を提供する。
論文 参考訳(メタデータ) (2021-11-30T14:30:44Z) - Overparametrization of HyperNetworks at Fixed FLOP-Count Enables Fast
Neural Image Enhancement [0.0]
深層畳み込みニューラルネットワークは、小型のモバイルカメラセンサーで撮影された画像を強化し、分解、分解、超高解像度化といったタスクに優れる。
モバイルデバイスで実際に使用する場合、これらのネットワークはFLOPを多用し、畳み込み層のFLOPを減らし、パラメータ数を減少させる。
本稿では,HyperNetworksを用いて標準畳み込みのパラメータに対するFLOPの固定比を破ることを提案する。
論文 参考訳(メタデータ) (2021-05-18T12:27:05Z) - Scalable Visual Transformers with Hierarchical Pooling [61.05787583247392]
本稿では,視覚的トークンを徐々にプールしてシーケンス長を縮小する階層的ビジュアルトランスフォーマ(hvt)を提案する。
計算の複雑さを増すことなく、深さ/幅/解像度/パッチサイズの寸法をスケールすることで、大きなメリットをもたらします。
当社のHVTはImageNetとCIFAR-100データセットの競合ベースラインを上回っています。
論文 参考訳(メタデータ) (2021-03-19T03:55:58Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Glance and Focus: a Dynamic Approach to Reducing Spatial Redundancy in
Image Classification [46.885260723836865]
ディープ畳み込みニューラルネットワーク (Deep Convolutional Neural Network, CNN) は、高解像度画像で処理することで一般的に改善される。
画像中のすべての領域がタスク関連であるとは限らないという事実に着想を得て,効率的な画像分類を行う新しいフレームワークを提案する。
我々のフレームワークは、最先端の軽量CNNの多くと互換性があり、汎用的で柔軟です。
論文 参考訳(メタデータ) (2020-10-11T17:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。