論文の概要: Enabling Image Recognition on Constrained Devices Using Neural Network
Pruning and a CycleGAN
- arxiv url: http://arxiv.org/abs/2009.05300v1
- Date: Fri, 11 Sep 2020 09:12:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 21:32:22.010029
- Title: Enabling Image Recognition on Constrained Devices Using Neural Network
Pruning and a CycleGAN
- Title(参考訳): ニューラルネットワークとサイクロンを用いた拘束デバイス上の画像認識の実現
- Authors: August Lidfelt, Daniel Isaksson, Ludwig Hedlund, Simon {\AA}berg,
Markus Borg, Erik Larsson
- Abstract要約: アンダーパスにおける現代画像認識における計算の必要性を低減するための2つの方法を示す。
まず、我々は成功したニューラルネットワークのプルーニング、すなわち、わずか1.1%のニューロンしか残っていない同等の分類精度を保っていることを示す。
第2に,CycleGANを用いて,配布外画像の操作設計領域への変換を行う方法を示す。
- 参考スコア(独自算出の注目度): 5.033621086398366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Smart cameras are increasingly used in surveillance solutions in public
spaces. Contemporary computer vision applications can be used to recognize
events that require intervention by emergency services. Smart cameras can be
mounted in locations where citizens feel particularly unsafe, e.g., pathways
and underpasses with a history of incidents. One promising approach for smart
cameras is edge AI, i.e., deploying AI technology on IoT devices. However,
implementing resource-demanding technology such as image recognition using deep
neural networks (DNN) on constrained devices is a substantial challenge. In
this paper, we explore two approaches to reduce the need for compute in
contemporary image recognition in an underpass. First, we showcase successful
neural network pruning, i.e., we retain comparable classification accuracy with
only 1.1\% of the neurons remaining from the state-of-the-art DNN architecture.
Second, we demonstrate how a CycleGAN can be used to transform
out-of-distribution images to the operational design domain. We posit that both
pruning and CycleGANs are promising enablers for efficient edge AI in smart
cameras.
- Abstract(参考訳): スマートカメラは、公共空間の監視ソリューションとしてますます利用されている。
現代のコンピュータビジョンアプリケーションは、緊急サービスによる介入を必要とする事象を認識するために使用できる。
スマートカメラは、市民が特に安全でないと感じている場所(例えば、事件の歴史上の経路や地下道など)に設置することができる。
スマートカメラの有望なアプローチのひとつは、エッジAI、すなわちIoTデバイスにAIテクノロジをデプロイすることだ。
しかし、制約のあるデバイスにディープニューラルネットワーク(DNN)を用いた画像認識などのリソース需要技術を実装することは大きな課題である。
本稿では,現代画像認識におけるアンダーパスの計算の必要性を減らすための2つの手法について検討する。
まず、ニューラルネットワークのプルーニングの成功例、すなわち、最先端のDNNアーキテクチャから残るニューロンの1.1\%で、同等の分類精度を維持する。
第2に,CycleGANを用いて,配布外画像の操作設計領域への変換を行う方法を示す。
我々は、プルーニングとCycleGANの両方が、スマートカメラにおける効率的なエッジAIの実現を約束していると仮定する。
関連論文リスト
- Neuromorphic Synergy for Video Binarization [54.195375576583864]
バイモーダルオブジェクトは視覚システムによって容易に認識できる情報を埋め込む視覚形式として機能する。
ニューロモルフィックカメラは、動きのぼかしを緩和する新しい機能を提供するが、最初にブルーを脱色し、画像をリアルタイムでバイナライズするのは簡単ではない。
本稿では,イベント空間と画像空間の両方で独立に推論を行うために,バイモーダル目標特性の事前知識を活用するイベントベースバイナリ再構築手法を提案する。
また、このバイナリ画像を高フレームレートバイナリビデオに伝搬する効率的な統合手法も開発している。
論文 参考訳(メタデータ) (2024-02-20T01:43:51Z) - EventTransAct: A video transformer-based framework for Event-camera
based action recognition [52.537021302246664]
イベントカメラは、RGBビデオの標準アクション認識と比較して、新しい機会を提供する。
本研究では,最初にイベントフレーム当たりの空間埋め込みを取得するビデオトランスフォーマーネットワーク(VTN)という,計算効率のよいモデルを用いる。
イベントデータのスパースできめ細かい性質にVTNをよりよく採用するために、イベントコントラストロス(mathcalL_EC$)とイベント固有の拡張を設計する。
論文 参考訳(メタデータ) (2023-08-25T23:51:07Z) - Survey on Computer Vision Techniques for Internet-of-Things Devices [0.0]
ディープニューラルネットワーク(Deep Neural Network, DNN)は、コンピュータビジョン問題を解決する最先端技術である。
DNNは最先端の結果を得るために数十億のパラメータと演算を必要とする。
この要件により、DNNは計算量、メモリ、エネルギー不足を極端に増加させ、結果として限られたコンピューティングリソースを持つ小さなバッテリ駆動のIoT(Internet-of-Things)デバイスにデプロイすることが困難になる。
論文 参考訳(メタデータ) (2023-08-02T03:41:24Z) - SqueezerFaceNet: Reducing a Small Face Recognition CNN Even More Via
Filter Pruning [55.84746218227712]
我々は,100万パラメータ未満の軽量顔認識ネットワークであるSqueezerFaceNetを開発した。
性能を損なうことなく、さらに(最大40%)削減できることを示す。
論文 参考訳(メタデータ) (2023-07-20T08:38:50Z) - LaneSNNs: Spiking Neural Networks for Lane Detection on the Loihi
Neuromorphic Processor [12.47874622269824]
我々は、イベントベースのカメラ入力を用いて、道路にマークされた車線を検出するための新しいSNNベースのアプローチであるLaneSNNを提案する。
我々は、学習したSNNモデルをIntel Loihi Neuromorphic Research Chipに実装し、マッピングする。
損失関数に対して,重み付き二元交叉エントロピー(WCE)と平均二乗誤差(MSE)の線形合成に基づく新しい手法を開発した。
論文 参考訳(メタデータ) (2022-08-03T14:51:15Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - Visual Attention Network [90.0753726786985]
本稿では,自己アテンションにおける自己適応性および長距離相関を実現するために,新しいカーネルアテンション(LKA)モジュールを提案する。
また、LKAに基づく新しいニューラルネットワーク、すなわちVisual Attention Network (VAN)を導入する。
VANは、最先端のビジョントランスフォーマーと畳み込みニューラルネットワークを、広範な実験において大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-02-20T06:35:18Z) - Silicon photonic subspace neural chip for hardware-efficient deep
learning [11.374005508708995]
光ニューラルネットワーク(ONN)は次世代のニューロコンピューティングの候補として期待されている。
ハードウェア効率の良いフォトニックサブスペースニューラルネットワークアーキテクチャを考案する。
我々は,バタフライ型プログラマブルシリコンフォトニック集積回路上でPSNNを実験的に実証した。
論文 参考訳(メタデータ) (2021-11-11T06:34:05Z) - StereoSpike: Depth Learning with a Spiking Neural Network [0.0]
深度推定のためのエンドツーエンドのニューロモルフィック手法を提案する。
我々はSpiking Neural Network (SNN) と、StereoSpikeという名前のU-Netライクなエンコーダデコーダアーキテクチャを用いている。
このアーキテクチャは、スポーキング以外のアーキテクチャよりも、非常によく一般化されていることを実証します。
論文 参考訳(メタデータ) (2021-09-28T14:11:36Z) - Facial Masks and Soft-Biometrics: Leveraging Face Recognition CNNs for
Age and Gender Prediction on Mobile Ocular Images [53.913598771836924]
スマートフォンで撮影した自撮り眼画像を使って年齢や性別を推定します。
ImageNet Challengeの文脈で提案された2つの既存の軽量CNNを適応させる。
一部のネットワークは顔認識のためにさらにトレーニングされており、非常に大規模なトレーニングデータベースが利用可能です。
論文 参考訳(メタデータ) (2021-03-31T01:48:29Z) - YOLOpeds: Efficient Real-Time Single-Shot Pedestrian Detection for Smart
Camera Applications [2.588973722689844]
この研究は、スマートカメラアプリケーションにおけるディープラーニングに基づく歩行者検出の効率的な展開のために、精度と速度の良好なトレードオフを達成するという課題に対処する。
分離可能な畳み込みに基づいて計算効率の良いアーキテクチャを導入し、層間密結合とマルチスケール機能融合を提案する。
全体として、YOLOpedsは、既存のディープラーニングモデルよりも86%の速度で、毎秒30フレーム以上のリアルタイム持続的な操作を提供する。
論文 参考訳(メタデータ) (2020-07-27T09:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。