論文の概要: Lightweight network towards real-time image denoising on mobile devices
- arxiv url: http://arxiv.org/abs/2211.04687v2
- Date: Thu, 25 May 2023 15:23:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 23:48:01.397699
- Title: Lightweight network towards real-time image denoising on mobile devices
- Title(参考訳): モバイルデバイス上でのリアルタイム画像デノーミングに向けた軽量ネットワーク
- Authors: Zhuoqun Liu and Meiguang Jin and Ying Chen and Huaida Liu and Canqian
Yang and Hongkai Xiong
- Abstract要約: 深層畳み込みニューラルネットワークは、画像復調タスクにおいて大きな進歩を遂げている。
複雑なアーキテクチャと計算コストにより、モバイルデバイスへのデプロイが妨げられる。
モバイルフレンドリーなデノベーションネットワークであるMFDNetを提案する。
- 参考スコア(独自算出の注目度): 26.130379174715742
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep convolutional neural networks have achieved great progress in image
denoising tasks. However, their complicated architectures and heavy
computational cost hinder their deployments on mobile devices. Some recent
efforts in designing lightweight denoising networks focus on reducing either
FLOPs (floating-point operations) or the number of parameters. However, these
metrics are not directly correlated with the on-device latency. In this paper,
we identify the real bottlenecks that affect the CNN-based models' run-time
performance on mobile devices: memory access cost and NPU-incompatible
operations, and build the model based on these. To further improve the
denoising performance, the mobile-friendly attention module MFA and the model
reparameterization module RepConv are proposed, which enjoy both low latency
and excellent denoising performance. To this end, we propose a mobile-friendly
denoising network, namely MFDNet. The experiments show that MFDNet achieves
state-of-the-art performance on real-world denoising benchmarks SIDD and DND
under real-time latency on mobile devices. The code and pre-trained models will
be released.
- Abstract(参考訳): 深層畳み込みニューラルネットワークは、画像復調タスクにおいて大きな進歩を遂げている。
しかし、複雑なアーキテクチャと計算コストがモバイルデバイスへのデプロイメントを妨げる。
軽量デノゲーションネットワークの設計における最近の取り組みは、FLOP(floating-point operation)の削減とパラメータ数の削減に重点を置いている。
しかしながら、これらのメトリクスはデバイス上のレイテンシに直接相関しない。
本稿では,CNNベースのモバイル端末における実行時の性能に影響を及ぼす真のボトルネック,すなわちメモリアクセスコストとNPU非互換な操作を特定し,それに基づいてモデルを構築する。
さらにデノージング性能を向上させるため,モバイルフレンドリーなアテンションモジュールmfaとモデルリパラメータモジュールrepconvを提案し,低レイテンシと優れたデノージング性能を両立させた。
そこで本稿では,モバイルフレンドリーなデノベーションネットワークであるMFDNetを提案する。
実験の結果,mfdnetはリアルタイム遅延下でsiddとdndのリアルタイムデノイジングベンチマークで最先端のパフォーマンスを達成していることがわかった。
コードと事前訓練されたモデルがリリースされる。
関連論文リスト
- Accelerating Linear Recurrent Neural Networks for the Edge with Unstructured Sparsity [39.483346492111515]
線形リカレントニューラルネットワークは、推論中に一定のメモリ使用量と時間毎の時間を含む強力な長距離シーケンスモデリングを可能にする。
非構造化空間は、互換性のあるハードウェアプラットフォームによって加速されるときに、計算とメモリの要求を大幅に削減できる魅力的なソリューションを提供する。
非常に疎い線形RNNは、高密度ベースラインよりも高い効率と性能のトレードオフを一貫して達成している。
論文 参考訳(メタデータ) (2025-02-03T13:09:21Z) - DFingerNet: Noise-Adaptive Speech Enhancement for Hearing Aids [41.294460006431564]
DeepFilterNet(DFN)アーキテクチャは補聴器に適したディープラーニングモデルとして提案されている。
この原理をDFNモデルに導入し,DFingerNet(DFiN)モデルを提案する。
論文 参考訳(メタデータ) (2025-01-17T19:56:22Z) - CompactFlowNet: Efficient Real-time Optical Flow Estimation on Mobile Devices [19.80162591240214]
我々は,光フロー予測のための最初のリアルタイム移動ニューラルネットワークであるCompactFlowNetを提案する。
光フローは、ビデオ復元、モーション推定、ビデオ安定化、オブジェクト追跡、アクション認識、ビデオ生成など、様々なビデオ関連タスクの基本的なビルディングブロックとして機能する。
論文 参考訳(メタデータ) (2024-12-17T19:06:12Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - Thunder: Thumbnail based Fast Lightweight Image Denoising Network [92.9631117239565]
textbfThumbtextbfnail ベースの textbfDtextbfenoising Netwotextbfrk called Thunder が提案されている。
論文 参考訳(メタデータ) (2022-05-24T06:38:46Z) - A Study of Designing Compact Audio-Visual Wake Word Spotting System
Based on Iterative Fine-Tuning in Neural Network Pruning [57.28467469709369]
視覚情報を利用した小型音声覚醒単語スポッティング(WWS)システムの設計について検討する。
繰り返し微調整方式(LTH-IF)で抽選券仮説を通したニューラルネットワークプルーニング戦略を導入する。
提案システムでは,ノイズ条件の異なる単一モード(オーディオのみ,ビデオのみ)システムに対して,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-17T08:26:25Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Overparametrization of HyperNetworks at Fixed FLOP-Count Enables Fast
Neural Image Enhancement [0.0]
深層畳み込みニューラルネットワークは、小型のモバイルカメラセンサーで撮影された画像を強化し、分解、分解、超高解像度化といったタスクに優れる。
モバイルデバイスで実際に使用する場合、これらのネットワークはFLOPを多用し、畳み込み層のFLOPを減らし、パラメータ数を減少させる。
本稿では,HyperNetworksを用いて標準畳み込みのパラメータに対するFLOPの固定比を破ることを提案する。
論文 参考訳(メタデータ) (2021-05-18T12:27:05Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。