論文の概要: SBCFormer: Lightweight Network Capable of Full-size ImageNet
Classification at 1 FPS on Single Board Computers
- arxiv url: http://arxiv.org/abs/2311.03747v1
- Date: Tue, 7 Nov 2023 06:09:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 16:36:44.960371
- Title: SBCFormer: Lightweight Network Capable of Full-size ImageNet
Classification at 1 FPS on Single Board Computers
- Title(参考訳): SBCFormer:シングルボードコンピュータ上で1FPSでフルサイズのイメージネット分類が可能な軽量ネットワーク
- Authors: Xiangyong Lu, Masanori Suganuma, Takayuki Okatani
- Abstract要約: 本稿では,ローエンドCPU上での高速かつ高精度な計算を実現する,SBCFormerと呼ばれるCNN-ViTハイブリッドネットワークを提案する。
高解像度内部特徴写像は過剰な計算資源を必要とするが、解像度を下げることで局所的な画像の詳細が失われる。
初めて、SBC上の1.0フレーム/秒の速度で、ImageNet-1Kトップ-1の精度を約80%達成した。
- 参考スコア(独自算出の注目度): 22.636351333487312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer vision has become increasingly prevalent in solving real-world
problems across diverse domains, including smart agriculture, fishery, and
livestock management. These applications may not require processing many image
frames per second, leading practitioners to use single board computers (SBCs).
Although many lightweight networks have been developed for mobile/edge devices,
they primarily target smartphones with more powerful processors and not SBCs
with the low-end CPUs. This paper introduces a CNN-ViT hybrid network called
SBCFormer, which achieves high accuracy and fast computation on such low-end
CPUs. The hardware constraints of these CPUs make the Transformer's attention
mechanism preferable to convolution. However, using attention on low-end CPUs
presents a challenge: high-resolution internal feature maps demand excessive
computational resources, but reducing their resolution results in the loss of
local image details. SBCFormer introduces an architectural design to address
this issue. As a result, SBCFormer achieves the highest trade-off between
accuracy and speed on a Raspberry Pi 4 Model B with an ARM-Cortex A72 CPU. For
the first time, it achieves an ImageNet-1K top-1 accuracy of around 80% at a
speed of 1.0 frame/sec on the SBC. Code is available at
https://github.com/xyongLu/SBCFormer.
- Abstract(参考訳): コンピュータビジョンは、スマート農業、漁業、畜産管理など、さまざまなドメインにわたる現実世界の問題を解決するためにますます普及している。
これらのアプリケーションは毎秒多くの画像フレームを処理する必要がないため、実践者はシングルボードコンピュータ(SBC)を使用する必要がある。
多くの軽量ネットワークがモバイル/エッジデバイス向けに開発されたが、主にローエンドCPUを搭載したSBCではなく、より強力なプロセッサを搭載したスマートフォンをターゲットにしている。
本稿では,CNN-ViTハイブリッドネットワークであるSBCFormerを提案する。
これらのCPUのハードウェア制約により、Transformerの注意機構は畳み込みよりも好まれる。
しかし、ローエンドCPUに注意を払ってみると、高解像度な内部特徴マップは過剰な計算資源を必要とするが、解像度を下げることで局所的な画像の詳細が失われる。
SBCFormerはこの問題に対処するためのアーキテクチャ設計を導入する。
その結果、SBCFormerはARM-Cortex A72 CPUを搭載したRaspberry Pi 4 Model Bの精度と速度のトレードオフが最も高い。
初めてimagenet-1k top-1の精度約80%をsbcで1.0フレーム/秒の速度で達成した。
コードはhttps://github.com/xyongLu/SBCFormerで入手できる。
関連論文リスト
- 1-bit AI Infra: Part 1.1, Fast and Lossless BitNet b1.58 Inference on CPUs [81.7388752468953]
bitnetは1ビットのLarge Language Modelの可能性を最大限に活用するために設計されたソフトウェアスタックです。
実験では、bitnetはxCPUの2.37xから6.17x、ARMの1.37xから5.07xまでの大幅なスピードアップを実現している。
論文 参考訳(メタデータ) (2024-10-21T16:14:57Z) - Taming Lookup Tables for Efficient Image Retouching [30.48643578900116]
我々は、畳み込みニューラルネットワーク(CNN)を使わずに、極めて効率的なエッジ推論にLUTを採用するICELUTを提案する。
ICELUTは最先端の性能と極めて低消費電力を実現している。
これにより、最初のLUTベースのイメージエンハンサーであるICELUTは、GPUでは0.4ms、CPUでは7msという前例のない速度に達し、CNNソリューションよりも少なくとも1桁高速になる。
論文 参考訳(メタデータ) (2024-03-28T08:49:35Z) - T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures
using Lookup Tables [49.965024476651706]
DeepGEMMはSIMDハードウェア上で超高精度畳み込みニューラルネットワークを実行するためのルックアップテーブルベースのアプローチである。
実装は、x86プラットフォーム上で、対応する8ビット整数カーネルを最大1.74倍の性能で上回る。
論文 参考訳(メタデータ) (2023-04-18T15:13:10Z) - PyNet-V2 Mobile: Efficient On-Device Photo Processing With Neural
Networks [115.97113917000145]
エッジデバイス用に設計された新しいPyNET-V2 Mobile CNNアーキテクチャを提案する。
提案アーキテクチャでは,携帯電話から直接RAW 12MPの写真を1.5秒で処理することができる。
提案したアーキテクチャは,最新のモバイルAIアクセラレータとも互換性があることが示されている。
論文 参考訳(メタデータ) (2022-11-08T17:18:01Z) - SOL: Reducing the Maintenance Overhead for Integrating Hardware Support
into AI Frameworks [0.7614628596146599]
Theano、Caffe、Chainer、CNTK、MxNet、PyTorch、DL4JといったAIフレームワークは、ハイレベルなスクリプティングAPIを提供する。
主流でないCPUやGPU、アクセラレータベンダは、これらのフレームワークでハードウェアをサポートするために、高い努力を払わなければならない。
NEC Laboratories Europeは、すでに数年前にSOL AI Optimizationプロジェクトの開発を開始した。
論文 参考訳(メタデータ) (2022-05-19T08:40:46Z) - BEANNA: A Binary-Enabled Architecture for Neural Network Acceleration [0.0]
本稿では,浮動小数点層とバイナリネットワーク層の両方を処理可能なニューラルネットワークハードウェアアクセラレータを提案し,評価する。
BEANNAは100MHzのクロック速度で動作し、ピークスループットは52.8ギガOps/秒である。
論文 参考訳(メタデータ) (2021-08-04T23:17:34Z) - DistGNN: Scalable Distributed Training for Large-Scale Graph Neural
Networks [58.48833325238537]
大規模グラフの構造を学ぶためにGNN(Graph Neural Networks)のフルバッチトレーニングは、実現可能な数百の計算ノードにスケールする必要がある重要な問題です。
本稿では,CPUクラスタ上でのフルバッチトレーニングのためのDGL(Deep Graph Library)を最適化したGNNについて述べる。
4つの一般的なGNNベンチマークデータセットの結果は、1つのCPUソケットを使用して最大3.7倍のスピードアップ、128のCPUソケットを使用して最大97倍のスピードアップを示す。
論文 参考訳(メタデータ) (2021-04-14T08:46:35Z) - PeleNet: A Reservoir Computing Framework for Loihi [0.0]
PeleNetは、ニューロモルフィックハードウェアLoihiの貯水池コンピューティングを単純化することを目指している。
複数のコアやチップ上でのネットワークの自動的かつ効率的な分散を提供する。
論文 参考訳(メタデータ) (2020-11-24T19:33:08Z) - Efficient Neural Network Deployment for Microcontroller [0.0]
本稿では,マイクロコントローラのための畳み込みニューラルネットワークの展開を探索し,一般化する。
メモリの節約と性能は、ARM Cortex-M CPU用に開発されたCMSIS-NNフレームワークと比較される。
最終的な目的は、トレーニングされたネットワーク重みを持つPyTorchモデルを消費するツールを開発することであり、低メモリ(キロバイトレベル)と限られた計算能力を持つマイクロコントローラのためにC/C++で最適化された推論エンジンとなる。
論文 参考訳(メタデータ) (2020-07-02T19:21:05Z) - Efficient Video Semantic Segmentation with Labels Propagation and
Refinement [138.55845680523908]
本稿では,ハイブリッドGPU/CPUを用いた高精細ビデオのリアルタイムセマンティックセマンティックセマンティック化の問題に取り組む。
i) CPU上では、非常に高速な光フロー法であり、ビデオの時間的側面を利用して、あるフレームから次のフレームへ意味情報を伝達するために使用される。
高解像度フレーム(2048 x 1024)を持つ一般的なCityscapesデータセットでは、単一のGPUとCPU上で80から1000Hzの動作ポイントが提案されている。
論文 参考訳(メタデータ) (2019-12-26T11:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。