論文の概要: SYENet: A Simple Yet Effective Network for Multiple Low-Level Vision
Tasks with Real-time Performance on Mobile Device
- arxiv url: http://arxiv.org/abs/2308.08137v1
- Date: Wed, 16 Aug 2023 04:03:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 14:52:49.399914
- Title: SYENet: A Simple Yet Effective Network for Multiple Low-Level Vision
Tasks with Real-time Performance on Mobile Device
- Title(参考訳): SYENet: モバイルデバイス上でリアルタイムに動作する複数の低レベル視覚タスクのためのシンプルで効果的なネットワーク
- Authors: Weiran Gou, Ziyao Yi, Yan Xiang, Shaoqing Li, Zibin Liu, Dehui Kong
and Ke Xu
- Abstract要約: 本稿では,モバイルデバイス上で複数の低レベル視覚タスクをリアルタイムに処理する新しいネットワークであるSYENetを提案する。
提案手法は, リアルタイムアプリケーションにおける他のネットワークと比較して, 最高のPSNRよりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 6.548475407783714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the rapid development of AI hardware accelerators, applying deep
learning-based algorithms to solve various low-level vision tasks on mobile
devices has gradually become possible. However, two main problems still need to
be solved: task-specific algorithms make it difficult to integrate them into a
single neural network architecture, and large amounts of parameters make it
difficult to achieve real-time inference. To tackle these problems, we propose
a novel network, SYENet, with only $~$6K parameters, to handle multiple
low-level vision tasks on mobile devices in a real-time manner. The SYENet
consists of two asymmetrical branches with simple building blocks. To
effectively connect the results by asymmetrical branches, a Quadratic
Connection Unit(QCU) is proposed. Furthermore, to improve performance, a new
Outlier-Aware Loss is proposed to process the image. The proposed method proves
its superior performance with the best PSNR as compared with other networks in
real-time applications such as Image Signal Processing(ISP), Low-Light
Enhancement(LLE), and Super-Resolution(SR) with 2K60FPS throughput on Qualcomm
8 Gen 1 mobile SoC(System-on-Chip). Particularly, for ISP task, SYENet got the
highest score in MAI 2022 Learned Smartphone ISP challenge.
- Abstract(参考訳): AIハードウェアアクセラレータの急速な開発に伴い、モバイルデバイス上のさまざまな低レベル視覚タスクを解決するためのディープラーニングベースのアルゴリズムの適用が徐々に可能になっている。
タスク固有のアルゴリズムは、それらを単一のニューラルネットワークアーキテクチャに統合することを難しくし、大量のパラメータは、リアルタイムな推論を達成するのを困難にしている。
これらの問題に対処するため,我々は,モバイル端末上で複数の低レベル視覚タスクをリアルタイムに処理できる,わずか$6kのパラメータを持つ新しいネットワークであるsyenetを提案する。
SYENetは2つの非対称な分岐と単純なビルディングブロックで構成されている。
非対称分岐により結果を効果的に接続するために、擬似接続ユニット(QCU)を提案する。
さらに, 性能向上のため, 画像の処理に新たな外部認識損失が提案されている。
提案手法は,Qualcomm 8 Gen 1 モバイル SoC (System-on-Chip) 上で2K60FPS スループットを持つ画像信号処理 (ISP) や低光強調 (LLE) ,超解像 (SR) などのリアルタイムアプリケーションにおける他のネットワークと比較して,優れたPSNR性能を示す。
特にISPタスクに関しては、SYENetはMAI 2022 Learned smartphone ISP Challengeで最高スコアを獲得した。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Ev-Edge: Efficient Execution of Event-based Vision Algorithms on Commodity Edge Platforms [10.104371980353973]
Ev-Edgeは、エッジプラットフォーム上でのイベントベースのビジョンシステムのパフォーマンスを高めるために、3つの重要な最適化を含むフレームワークである。
様々な自律ナビゲーションタスクのための最先端ネットワークでは、Ev-Edgeはレイテンシが1.28x-2.05x改善され、エネルギーが1.23x-2.15xになった。
論文 参考訳(メタデータ) (2024-03-23T04:44:55Z) - Fast GraspNeXt: A Fast Self-Attention Neural Network Architecture for
Multi-task Learning in Computer Vision Tasks for Robotic Grasping on the Edge [80.88063189896718]
アーキテクチャと計算の複雑さが高いと、組み込みデバイスへのデプロイに適さない。
Fast GraspNeXtは、ロボットグルーピングのためのコンピュータビジョンタスクに埋め込まれたマルチタスク学習に適した、高速な自己認識型ニューラルネットワークアーキテクチャである。
論文 参考訳(メタデータ) (2023-04-21T18:07:14Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - Achieving on-Mobile Real-Time Super-Resolution with Neural Architecture
and Pruning Search [64.80878113422824]
リアルタイムの推論要求を満たすとともに、画像品質の高いスパース超解像モデル(SR)を導出する自動探索フレームワークを提案する。
提案したフレームワークでは、競合画像の品質を持つ720pの解像度を実現するために、リアルタイムSR推論(フレームあたり数ミリ秒)を初めて実現している。
論文 参考訳(メタデータ) (2021-08-18T06:47:31Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Multi-Task Network Pruning and Embedded Optimization for Real-time
Deployment in ADAS [0.0]
カメラベースのディープラーニングアルゴリズムは、自動運転システムにおける認識にますます必要である。
自動車業界からの制約は、限られた計算リソースで組み込みシステムを課すことでCNNの展開に挑戦します。
商用プロトタイププラットフォーム上で,このような条件下でマルチタスクCNNネットワークを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-01-19T19:29:38Z) - AttendNets: Tiny Deep Image Recognition Neural Networks for the Edge via
Visual Attention Condensers [81.17461895644003]
我々は、オンデバイス画像認識に適した、低精度でコンパクトなディープニューラルネットワークであるAttendNetsを紹介する。
AttendNetsは、視覚的注意の凝縮に基づく深い自己注意アーキテクチャを持っている。
その結果、AttendNetsは、いくつかのディープニューラルネットワークと比較して、アーキテクチャと計算の複雑さが著しく低いことが示された。
論文 参考訳(メタデータ) (2020-09-30T01:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。