論文の概要: Minimal Filtering Algorithms for Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2004.05607v1
- Date: Sun, 12 Apr 2020 13:18:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 05:13:11.541926
- Title: Minimal Filtering Algorithms for Convolutional Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークのための最小フィルタリングアルゴリズム
- Authors: Aleksandr Cariow and Galina Cariowa
- Abstract要約: 我々は,M=3,5,7,9,11の基本的なフィルタリング操作を実装するための完全並列ハードウェア指向アルゴリズムを開発した。
各ケースにおける提案アルゴリズムの完全な並列ハードウェア実装は、組込み乗算器の数を約30%削減する。
- 参考スコア(独自算出の注目度): 82.24592140096622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present several resource-efficient algorithmic solutions
regarding the fully parallel hardware implementation of the basic filtering
operation performed in the convolutional layers of convolution neural networks.
In fact, these basic operations calculate two inner products of neighboring
vectors formed by a sliding time window from the current data stream with an
impulse response of the M-tap finite impulse response filter. We used Winograd
minimal filtering trick and applied it to develop fully parallel
hardware-oriented algorithms for implementing the basic filtering operation for
M=3,5,7,9, and 11. A fully parallel hardware implementation of the proposed
algorithms in each case gives approximately 30 percent savings in the number of
embedded multipliers compared to a fully parallel hardware implementation of
the naive calculation methods.
- Abstract(参考訳): 本稿では,畳み込みニューラルネットワークの畳み込み層で実行される基本フィルタリング操作の完全並列ハードウェア実装に関する,リソース効率の高いアルゴリズムソリューションを提案する。
実際、これらの基本演算は、mタップ有限インパルス応答フィルタのインパルス応答を伴う電流データストリームから、スライディングタイムウィンドウによって形成される隣り合うベクトルの2つの内積を計算する。
我々はウィノグラードの最小フィルタリング手法を用いて,m=3,5,7,9,11の基本フィルタリング操作を実現するための完全並列ハードウェア指向アルゴリズムを開発した。
各ケースにおいて提案アルゴリズムの完全並列ハードウェア実装は、単純計算方式の完全並列ハードウェア実装と比較して、組込み乗算器の数を約30%削減する。
関連論文リスト
- DeepPCR: Parallelizing Sequential Operations in Neural Networks [4.241834259165193]
我々は、ニューラルネットワークの推論とトレーニングを高速化するために、典型的にはシーケンシャルな操作を並列化する新しいアルゴリズムであるDeepPCRを紹介する。
DeepPCRは、特定の方程式系の解法として$L$のステップ列を解釈し、並列サイクル還元アルゴリズムを用いて回復する。
アルゴリズムの理論的に低い複雑性を検証し,高速化のための機構を同定するために,多層パーセプトロンの前方・後方パスの並列化におけるDeepPCRの有効性を検証した。
論文 参考訳(メタデータ) (2023-09-28T10:15:30Z) - Low-complexity Approximate Convolutional Neural Networks [1.7368964547487395]
本稿では,学習された畳み込みニューラルネットワーク(ConvNet)の計算複雑性を最小化する手法を提案する。
この考え方は、与えられたConvNetのすべての要素を計算複雑性を極端に削減できる効率的な近似で近似することである。
このような低複雑さ構造は、低消費電力で効率的なハードウェア設計の道を開く。
論文 参考訳(メタデータ) (2022-07-29T21:59:29Z) - Instant Neural Graphics Primitives with a Multiresolution Hash Encoding [67.33850633281803]
品質を犠牲にすることなく、より小さなネットワークを使用できる汎用的な新しい入力符号化を提案する。
小さなニューラルネットワークは、勾配降下によって値が最適化された訓練可能な特徴ベクトルの多分解能ハッシュテーブルによって拡張される。
数桁の高速化を実現し、高品質なニューラルネットワークプリミティブを数秒でトレーニングすることができる。
論文 参考訳(メタデータ) (2022-01-16T07:22:47Z) - FPGA deep learning acceleration based on convolutional neural network [0.0]
本稿では、フィールドプログラマブル論理ゲートアレイ(FPGA)に基づく畳み込みニューラルネットワークハードウェアアクセラレータを提案する。
本論文で提案した加速器のエネルギー効率比は32.73 GOPS/Wで、これは既存の溶液よりも34%高く、性能は317.86 GOPSに達する。
論文 参考訳(メタデータ) (2020-11-17T16:20:44Z) - NOMA in UAV-aided cellular offloading: A machine learning approach [59.32570888309133]
複数の無人航空機(UAV)によるセルローディングのための新しい枠組みの提案
非直交多重アクセス(NOMA)技術は、無線ネットワークのスペクトル効率をさらに向上するために、各UAVに採用されている。
相互深いQ-network (MDQN) アルゴリズムは,UAVの最適3次元軌道と電力配分を共同で決定するために提案される。
論文 参考訳(メタデータ) (2020-10-18T17:38:48Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z) - Accelerating Feedforward Computation via Parallel Nonlinear Equation
Solving [106.63673243937492]
ニューラルネットワークの評価や自己回帰モデルからのサンプリングなどのフィードフォワード計算は、機械学習においてユビキタスである。
本稿では,非線形方程式の解法としてフィードフォワード計算の課題を定式化し,ジャコビ・ガウス・シーデル固定点法とハイブリッド法を用いて解を求める。
提案手法は, 並列化可能な繰り返し回数の削減(あるいは等値化)により, 元のフィードフォワード計算と全く同じ値が与えられることを保証し, 十分な並列化計算能力を付与する。
論文 参考訳(メタデータ) (2020-02-10T10:11:31Z) - Channel Assignment in Uplink Wireless Communication using Machine
Learning Approach [54.012791474906514]
本稿では,アップリンク無線通信システムにおけるチャネル割り当て問題について検討する。
我々の目標は、整数チャネル割り当て制約を受ける全ユーザの総和率を最大化することです。
計算複雑性が高いため、機械学習アプローチは計算効率のよい解を得るために用いられる。
論文 参考訳(メタデータ) (2020-01-12T15:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。