論文の概要: On-Sensor Binarized Fully Convolutional Neural Network with A Pixel
Processor Array
- arxiv url: http://arxiv.org/abs/2202.00836v1
- Date: Wed, 2 Feb 2022 01:18:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-03 15:20:45.110981
- Title: On-Sensor Binarized Fully Convolutional Neural Network with A Pixel
Processor Array
- Title(参考訳): 画素プロセッサアレイを用いた on-sensor binarized full convolutional neural network
- Authors: Yanan Liu, Laurie Bose, Yao Lu, Piotr Dudek, Walterio Mayol-Cuevas
- Abstract要約: 本研究では,Pixel Processor Array (PPA)センサに完全畳み込みニューラルネットワーク(FCN)を実装する手法を提案する。
本稿では,二項重みとアクティベーションの両立のための二項化FCNを,バッチノルム,グループ畳み込み,二項化のための学習しきい値を用いて設計し,訓練する。
PPAデバイス上でFCNを最初に実装し、ピクセルレベルのプロセッサで3つの畳み込み層を実行する。
- 参考スコア(独自算出の注目度): 17.4097919720973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents a method to implement fully convolutional neural networks
(FCNs) on Pixel Processor Array (PPA) sensors, and demonstrates coarse
segmentation and object localisation tasks. We design and train binarized FCN
for both binary weights and activations using batchnorm, group convolution, and
learnable threshold for binarization, producing networks small enough to be
embedded on the focal plane of the PPA, with limited local memory resources,
and using parallel elementary add/subtract, shifting, and bit operations only.
We demonstrate the first implementation of an FCN on a PPA device, performing
three convolution layers entirely in the pixel-level processors. We use this
architecture to demonstrate inference generating heat maps for object
segmentation and localisation at over 280 FPS using the SCAMP-5 PPA vision
chip.
- Abstract(参考訳): 本稿では、画素プロセッサアレイ(ppa)センサに完全畳み込みニューラルネットワーク(fcns)を実装する手法を提案し、粗いセグメンテーションとオブジェクトローカライズタスクを示す。
我々は,2値化のためのバッチノルム,グループ畳み込み,学習可能なしきい値を用いた2値化fcnの設計と訓練を行い,ppaの焦点面に埋め込むのに十分な大きさのネットワークを生成し,ローカルメモリリソースを制限し,並列の基本加算/減算,シフト,ビット演算のみを使用する。
PPAデバイス上でFCNを最初に実装し、ピクセルレベルのプロセッサで3つの畳み込み層を実行する。
このアーキテクチャを用いて,scamp-5 ppaビジョンチップを用いた280fps以上のオブジェクトセグメンテーションとローカライズのための熱マップ生成の推論を行う。
関連論文リスト
- Efficient Spatio-Temporal Signal Recognition on Edge Devices Using PointLCA-Net [0.45609532372046985]
本稿では、ポイントネットの特徴抽出とインメモリコンピューティング能力と時間信号認識のためのニューロモルフィックシステムのエネルギー効率を組み合わせたアプローチを提案する。
PointNetは、推定とトレーニングの両方において、同等のアプローチよりも高い精度とエネルギー負担を著しく低減します。
論文 参考訳(メタデータ) (2024-11-21T20:48:40Z) - Tiled Bit Networks: Sub-Bit Neural Network Compression Through Reuse of Learnable Binary Vectors [4.95475852994362]
本稿では,バイナリ重み付きニューラルネットワークのサブビット圧縮を実現するために,ビット列を持つタイル型ニューラルネットワーク層に対する新しい量子化方式を提案する。
私たちは完全に接続された層と畳み込み層の両方にアプローチを採用しています。
論文 参考訳(メタデータ) (2024-07-16T15:55:38Z) - BDC-Occ: Binarized Deep Convolution Unit For Binarized Occupancy Network [55.21288428359509]
既存の3D占有ネットワークは重要なハードウェアリソースを必要としており、エッジデバイスの配備を妨げている。
本稿では,バイナライズド・ディープ・コンボリューション(BDC)ユニットを提案し,バイナライズド・ディープ・コンボリューション・レイヤの数を増やしつつ性能を効果的に向上させる。
我々のBDC-Occモデルは既存の3D占有ネットワークをバイナライズするために提案したBDCユニットを適用して作成する。
論文 参考訳(メタデータ) (2024-05-27T10:44:05Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - Bandwidth-efficient distributed neural network architectures with
application to body sensor networks [73.02174868813475]
本稿では,分散ニューラルネットワークアーキテクチャを設計するための概念設計手法について述べる。
提案手法により,損失を最小限に抑えつつ,最大20倍の帯域幅削減が可能となることを示す。
本稿では,ウェアラブル脳-コンピュータインタフェースに焦点をあてるが,他のセンサネットワークアプリケーションにも適用できる。
論文 参考訳(メタデータ) (2022-10-14T12:35:32Z) - Two-Stream Networks for Object Segmentation in Videos [83.1383102535413]
我々は,2ストリームネットワーク(TSN)を用いて,その画素レベルのメモリ検索に基づいて表示された画素を分割する。
インスタンスの全体的理解は、ターゲットインスタンスの特徴に基づいて動的セグメンテーションヘッドで得られる。
コンパクトなインスタンスストリームは、適応的なルーティングマップで2つのストリームを融合させながら、目に見えないピクセルのセグメンテーション精度を効果的に向上させる。
論文 参考訳(メタデータ) (2022-08-08T10:22:42Z) - Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection [50.008529403150206]
我々はTrident Pyramid Network (TPN)と呼ばれる新しいコアアーキテクチャを提案する。
TPNはより深い設計を可能にし、コミュニケーションベースの処理と自己処理のバランスを改善する。
TPNコアをオブジェクト検出ベンチマークで使用した場合,BifPNベースラインを1.5 APで上回り,一貫した改善が見られた。
論文 参考訳(メタデータ) (2021-10-08T09:59:59Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - Efficient 3D Point Cloud Feature Learning for Large-Scale Place
Recognition [21.818744369503197]
視覚的位置認識のためのグローバルディスクリプタを構築するために,効率的なポイントクラウド学習ネットワーク(EPC-Net)を開発した。
提案手法は,フレームあたりのパラメータ,FLOP,ランタイムを低減して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-01-07T05:15:31Z) - Efficient Deep Learning of Non-local Features for Hyperspectral Image
Classification [28.72648031677868]
高スペクトル画像(HSI)分類のために, ENL-FCN と呼ばれる効率的な非局所モジュールを持つ深部完全畳み込みネットワーク (FCN) を提案する。
提案するフレームワークである深部FCNは、全HSIを入力とみなし、局所受容領域におけるスペクトル空間情報を抽出する。
リカレント操作を使用することで、各画素の応答はHSIの全画素から集約される。
論文 参考訳(メタデータ) (2020-08-02T19:13:22Z) - Fully Embedding Fast Convolutional Networks on Pixel Processor Arrays [16.531637803429277]
本稿では,PPA(Pixel processor array)視覚センサのための新しいCNN推論手法を提案する。
提案手法は, 畳み込み層, 最大プーリング, ReLu, およびPPAセンサ上に完全に接続された最終層を実現する。
これは、外部処理を必要としないPPA視覚センサデバイスのプロセッサアレイで完全に行われたCNN推論を示す最初の研究である。
論文 参考訳(メタデータ) (2020-04-27T01:00:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。