論文の概要: Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision
Applications
- arxiv url: http://arxiv.org/abs/2003.02449v1
- Date: Thu, 5 Mar 2020 06:20:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 07:01:21.096522
- Title: Cluster Pruning: An Efficient Filter Pruning Method for Edge AI Vision
Applications
- Title(参考訳): クラスタプルーニング:エッジAIビジョンアプリケーションのための効率的なフィルタプルーニング手法
- Authors: Chinthaka Gamanayake, Lahiru Jayasinghe, Benny Ng, Chau Yuen
- Abstract要約: CNNでフィルタを除去する構造的方法を提供するクラスタプルーニングと呼ばれる新しいグリーディ手法が提案されている。
提案手法を用いてエッジAIアプリケーションをデプロイするために,Intel Movidius-NCSからなる低コストIoTハードウェアセットアップを提案する。
- 参考スコア(独自算出の注目度): 13.197955183748796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Even though the Convolutional Neural Networks (CNN) has shown superior
results in the field of computer vision, it is still a challenging task to
implement computer vision algorithms in real-time at the edge, especially using
a low-cost IoT device due to high memory consumption and computation
complexities in a CNN. Network compression methodologies such as weight
pruning, filter pruning, and quantization are used to overcome the above
mentioned problem. Even though filter pruning methodology has shown better
performances compared to other techniques, irregularity of the number of
filters pruned across different layers of a CNN might not comply with majority
of the neural computing hardware architectures. In this paper, a novel greedy
approach called cluster pruning has been proposed, which provides a structured
way of removing filters in a CNN by considering the importance of filters and
the underlying hardware architecture. The proposed methodology is compared with
the conventional filter pruning algorithm on Pascal-VOC open dataset, and
Head-Counting dataset, which is our own dataset developed to detect and count
people entering a room. We benchmark our proposed method on three hardware
architectures, namely CPU, GPU, and Intel Movidius Neural Computer Stick (NCS)
using the popular SSD-MobileNet and SSD-SqueezeNet neural network architectures
used for edge-AI vision applications. Results demonstrate that our method
outperforms the conventional filter pruning methodology, using both datasets on
above mentioned hardware architectures. Furthermore, a low cost IoT hardware
setup consisting of an Intel Movidius-NCS is proposed to deploy an edge-AI
application using our proposed pruning methodology.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)はコンピュータビジョンの分野で優れた結果を示しているが、特にCNNのメモリ消費と計算の複雑さのために低コストのIoTデバイスを使用する場合、エッジでのコンピュータビジョンアルゴリズムをリアルタイムに実装することは依然として難しい課題である。
上記の問題を克服するために、重みプラニング、フィルタプラニング、量子化などのネットワーク圧縮手法が用いられる。
フィルタプルーニング手法は他の手法と比較して優れた性能を示しているが、cnnの異なる層にまたがるフィルタ数の不規則性は、ニューラルコンピューティングハードウェアアーキテクチャの大部分に従わないかもしれない。
本稿では,cnnにおけるフィルタの重要性と基盤となるハードウェアアーキテクチャを考慮したフィルタ除去手法として,クラスタプルーニング(cluster pruning)という新しいアプローチを提案する。
提案手法は,pascal-vocオープンデータセット上の従来のフィルタプルーニングアルゴリズムと,部屋に入る人を検知・カウントする独自のデータセットであるhead-counting datasetと比較した。
提案手法を3つのハードウェアアーキテクチャ,すなわちcpu,gpu,intel movidius neural computer stick (ncs) にベンチマークし,edge-ai visionアプリケーションで使用されるssd-mobilenetとssd-squeezenetニューラルネットワークアーキテクチャを用いた。
その結果,上述のハードウェアアーキテクチャ上の2つのデータセットを用いて,従来のフィルタプルーニング手法を上回った。
さらに,提案手法を用いてエッジAIアプリケーションをデプロイするために,Intel Movidius-NCSからなる低コストIoTハードウェアセットアップを提案する。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Pushing the Efficiency Limit Using Structured Sparse Convolutions [82.31130122200578]
本稿では,画像の固有構造を利用して畳み込みフィルタのパラメータを削減する構造的スパース畳み込み(SSC)を提案する。
我々は、SSCが効率的なアーキテクチャにおける一般的なレイヤ(奥行き、グループ回り、ポイント回りの畳み込み)の一般化であることを示す。
SSCに基づくアーキテクチャは、CIFAR-10、CIFAR-100、Tiny-ImageNet、ImageNet分類ベンチマークのベースラインと比較して、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-10-23T18:37:22Z) - Complexity-Driven CNN Compression for Resource-constrained Edge AI [1.6114012813668934]
本稿では,CNNの層レベルでの複雑さを生かして,新しい,計算効率の高いプルーニングパイプラインを提案する。
パラメータ認識(PA)、FLOP認識(FA)、メモリ認識(MA)の3つのモードを定義し、CNNの汎用圧縮を導入する。
論文 参考訳(メタデータ) (2022-08-26T16:01:23Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - EffCNet: An Efficient CondenseNet for Image Classification on NXP
BlueBox [0.0]
エッジデバイスは、安価なハードウェアと限られた冷却と計算資源のために、限られた処理能力を提供する。
我々はエッジデバイスのためのEffCNetと呼ばれる新しいディープ畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-28T21:32:31Z) - Hardware Architecture of Embedded Inference Accelerator and Analysis of
Algorithms for Depthwise and Large-Kernel Convolutions [27.141754658998323]
提案されたアーキテクチャは、異なるサイズのフィルタカーネルを高い柔軟性でサポートする。
画像分類では、深さ方向の畳み込みで3倍の3$フィルタを5倍の5$フィルタに置き換えることで、精度が1%向上する。
論文 参考訳(メタデータ) (2021-04-29T05:45:16Z) - Multi-Task Network Pruning and Embedded Optimization for Real-time
Deployment in ADAS [0.0]
カメラベースのディープラーニングアルゴリズムは、自動運転システムにおける認識にますます必要である。
自動車業界からの制約は、限られた計算リソースで組み込みシステムを課すことでCNNの展開に挑戦します。
商用プロトタイププラットフォーム上で,このような条件下でマルチタスクCNNネットワークを埋め込む手法を提案する。
論文 参考訳(メタデータ) (2021-01-19T19:29:38Z) - Computational optimization of convolutional neural networks using
separated filters architecture [69.73393478582027]
我々は、計算複雑性を低減し、ニューラルネットワーク処理を高速化する畳み込みニューラルネットワーク変換を考える。
畳み込みニューラルネットワーク(CNN)の使用は、計算的に要求が多すぎるにもかかわらず、画像認識の標準的なアプローチである。
論文 参考訳(メタデータ) (2020-02-18T17:42:13Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z) - Lightweight Residual Densely Connected Convolutional Neural Network [18.310331378001397]
畳み込みニューラルネットワークの深い監督, 効率的な勾配流, 特徴再利用能力を保証するために, 軽量な高密度連結ブロックを提案する。
提案手法は,特別なハードウェア・ソフトウェア機器を使わずに,トレーニングと推論のコストを低減させる。
論文 参考訳(メタデータ) (2020-01-02T17:15:32Z) - PatDNN: Achieving Real-Time DNN Execution on Mobile Devices with
Pattern-based Weight Pruning [57.20262984116752]
粗粒構造の内部に新しい次元、きめ細かなプルーニングパターンを導入し、これまで知られていなかった設計空間の点を明らかにした。
きめ細かいプルーニングパターンによって高い精度が実現されているため、コンパイラを使ってハードウェア効率を向上し、保証することがユニークな洞察である。
論文 参考訳(メタデータ) (2020-01-01T04:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。