論文の概要: Improving the Performance of a NoC-based CNN Accelerator with Gather
Support
- arxiv url: http://arxiv.org/abs/2108.02567v1
- Date: Sun, 1 Aug 2021 23:33:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-07 04:34:11.471939
- Title: Improving the Performance of a NoC-based CNN Accelerator with Gather
Support
- Title(参考訳): NoC-based CNN Accelerator のギャザサポートによる性能向上
- Authors: Binayak Tiwari, Mei Yang, Xiaohang Wang, Yingtao Jiang, Venkatesan
Muthukumar
- Abstract要約: ディープラーニング技術は、CNNのための効率的な並列コンピューティングアーキテクチャの必要性を促進する。
CNNのワークロードには1対1のトラフィックと1対1のトラフィックに加えて、多対1のトラフィックが導入されている。
本稿では,メッシュベースのNoCにおいて,複数対1のトラフィックをサポートするために,出力定常シストリックアレイを用いて収集パケットを利用することを提案する。
- 参考スコア(独自算出の注目度): 6.824747267214373
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing application of deep learning technology drives the need for an
efficient parallel computing architecture for Convolutional Neural Networks
(CNNs). A significant challenge faced when designing a many-core CNN
accelerator is to handle the data movement between the processing elements. The
CNN workload introduces many-to-one traffic in addition to one-to-one and
one-to-many traffic. As the de-facto standard for on-chip communication,
Network-on-Chip (NoC) can support various unicast and multicast traffic. For
many-to-one traffic, repetitive unicast is employed which is not an efficient
way. In this paper, we propose to use the gather packet on mesh-based NoCs
employing output stationary systolic array in support of many-to-one traffic.
The gather packet will collect the data from the intermediate nodes eventually
leading to the destination efficiently. This method is evaluated using the
traffic traces generated from the convolution layer of AlexNet and VGG-16 with
improvement in the latency and power than the repetitive unicast method.
- Abstract(参考訳): 深層学習技術の応用が増え、畳み込みニューラルネットワーク(cnns)のための効率的な並列コンピューティングアーキテクチャの必要性が高まっている。
マルチコアCNNアクセラレータを設計する際の大きな課題は、処理要素間のデータ移動を処理することだ。
cnn workloadは1対1のトラフィックに加えて1対1のトラフィックも導入している。
オンチップ通信のデファクトスタンダードとして、network-on-chip (noc) は様々なユニキャストおよびマルチキャストトラフィックをサポートできる。
多対一のトラフィックでは、効率的な方法ではない繰り返しユニキャストが使用される。
本稿では,複数対1のトラフィックをサポートするために,出力定常シストリックアレイを用いたメッシュベースのNoC上での集合パケットの利用を提案する。
収集パケットは中間ノードからデータを収集し、最終的には効率よく目的地に導く。
この手法は,AlexNet と VGG-16 の畳み込み層から発生するトラヒックトレースを用いて,繰り返しユニキャスト法よりも遅延と電力を改善する。
関連論文リスト
- Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - Lens: A Foundation Model for Network Traffic [19.3652490585798]
Lensは、T5アーキテクチャを活用して、大規模な未ラベルデータから事前訓練された表現を学習するネットワークトラフィックの基礎モデルである。
Masked Span Prediction(MSP)、Packet Order Prediction(POP)、Homologous Traffic Prediction(HTP)の3つの異なるタスクを組み合わせた新しい損失を設計する。
論文 参考訳(メタデータ) (2024-02-06T02:45:13Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - Multi-task Learning for Sparse Traffic Forecasting [13.359590890052454]
本稿では,各道路セグメントの混雑クラスと速度を同時に予測できるマルチタスク学習ネットワークを提案する。
提案手法はTraffic4cast Competition 2022で提供されたデータセットにおいて,ソースコードをhttps://github.com/OctopusLi/NeurIPS2022-traffic4castで公開しています。
論文 参考訳(メタデータ) (2022-11-18T02:10:40Z) - Teal: Learning-Accelerated Optimization of WAN Traffic Engineering [68.7863363109948]
本稿では,GPUの並列処理能力を活用してTE制御を高速化する学習型TEアルゴリズムTealを提案する。
問題スケールの削減と学習のトラクタビリティ向上のために,Tealはマルチエージェント強化学習(RL)アルゴリズムを用いて,各トラフィック要求を独立に割り当てる。
他のTE加速方式と比較して、Tealは需要を6~32%増やし、197~625倍のスピードアップを達成している。
論文 参考訳(メタデータ) (2022-10-25T04:46:30Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Data Streaming and Traffic Gathering in Mesh-based NoC for Deep Neural
Network Acceleration [7.455546102930911]
本稿では,1対多のトラフィックを高速化するために,一方/双方向のストリーミングバスを備えたメッシュアーキテクチャを提案する。
畳み込みレイヤのランタイムレイテンシの解析は、双方向ストリーミングアーキテクチャが一方的なストリーミングアーキテクチャよりも改善されていることを示している。
論文 参考訳(メタデータ) (2021-08-01T23:50:12Z) - TrafficStream: A Streaming Traffic Flow Forecasting Framework Based on
Graph Neural Networks and Continual Learning [10.205873494981633]
グラフニューラルネットワーク(GNN)と連続学習(CL)に基づくストリームトラフィックフロー予測フレームワークであるTrafficStreamを提案する。
新たなトラフィックパターンをマイニングするために,JS-divergence に基づくアルゴリズムを提案する。
モデルの有効性と有効性を検証するために,ストリーミングトラフィックデータセットを構築した。
論文 参考訳(メタデータ) (2021-06-11T09:42:37Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。