論文の概要: Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing
- arxiv url: http://arxiv.org/abs/2207.11293v1
- Date: Fri, 22 Jul 2022 18:38:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 15:22:33.824150
- Title: Receptive Field-based Segmentation for Distributed CNN Inference
Acceleration in Collaborative Edge Computing
- Title(参考訳): 協調エッジコンピューティングにおける分散CNN推論高速化のための受容場ベースセグメンテーション
- Authors: Nan Li, Alexandros Iosifidis, Qi Zhang
- Abstract要約: 協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
我々は,CNNモデルを複数の畳み込み層に分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
- 参考スコア(独自算出の注目度): 93.67044879636093
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper studies inference acceleration using distributed convolutional
neural networks (CNNs) in collaborative edge computing network. To avoid
inference accuracy loss in inference task partitioning, we propose receptive
field-based segmentation (RFS). To reduce the computation time and
communication overhead, we propose a novel collaborative edge computing using
fused-layer parallelization to partition a CNN model into multiple blocks of
convolutional layers. In this scheme, the collaborative edge servers (ESs) only
need to exchange small fraction of the sub-outputs after computing each fused
block. In addition, to find the optimal solution of partitioning a CNN model
into multiple blocks, we use dynamic programming, named as dynamic programming
for fused-layer parallelization (DPFP). The experimental results show that DPFP
can accelerate inference of VGG-16 up to 73% compared with the pre-trained
model, which outperforms the existing work MoDNN in all tested scenarios.
Moreover, we evaluate the service reliability of DPFP under time-variant
channel, which shows that DPFP is an effective solution to ensure high service
reliability with strict service deadline.
- Abstract(参考訳): 本稿では,協調エッジコンピューティングネットワークにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
推定タスク分割における推定精度の損失を回避するため,レセプティブフィールドベースセグメンテーション(rfs)を提案する。
計算時間と通信オーバーヘッドを削減するため,cnnモデルを複数の畳み込み層のブロックに分割するために,融合層並列化を用いた新しい協調エッジコンピューティングを提案する。
このスキームでは、コラボレーティブエッジサーバ(ES)は、各融合ブロックを計算した後のみ、サブアウトプットのごく一部を交換する必要がある。
さらに, CNNモデルを複数のブロックに分割する最適解を見つけるために, 動的プログラミングを用いて, 融合層並列化(DPFP)のための動的プログラミングを行う。
実験結果から,DPFPがVGG-16の推算を73%まで加速できることが示された。
さらに,dpfpの信頼性を時間変動チャネルで評価することで,厳格なサービス期限で高い信頼性を確保するための有効な解決策であることを示す。
関連論文リスト
- Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - Attention-based Feature Compression for CNN Inference Offloading in Edge
Computing [93.67044879636093]
本稿では,デバイスエッジ共振器におけるCNN推論の計算負荷について検討する。
エンドデバイスにおける効率的な特徴抽出のための新しいオートエンコーダベースのCNNアーキテクチャ(AECNN)を提案する。
実験の結果、AECNNは中間データを約4%の精度で256倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2022-11-24T18:10:01Z) - A Low-Complexity Approach to Rate-Distortion Optimized Variable Bit-Rate
Compression for Split DNN Computing [5.3221129103999125]
分散コンピューティングは、DNNベースのAIワークロードを実装するための最近のパラダイムとして登場した。
本稿では,レート・精度・複雑さのトレードオフを最適化する上での課題に対処するアプローチを提案する。
我々のアプローチは、トレーニングと推論の両方において非常に軽量であり、非常に効果的であり、高い速度歪曲性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T15:02:11Z) - Distributed Deep Learning Inference Acceleration using Seamless
Collaboration in Edge Computing [93.67044879636093]
本稿では,コラボレーティブエッジコンピューティングにおける分散畳み込みニューラルネットワーク(CNN)を用いた推論高速化について検討する。
本研究では,第2エッジサーバ(ES)上のサブタスクの重なり合うゾーンをホストES上で実行し,HALPと命名した新しいタスク協調方式を設計する。
実験結果から,GTX 1080TIとJETSON AGX Xavierでは,単一のタスクに対して1.7-2.0x,バッチ毎に1.7-1.8x,バッチ毎に1.7-1.8x,VGG-16では1.7-2.0xのCNN推論を高速化できることがわかった。
論文 参考訳(メタデータ) (2022-07-22T18:39:09Z) - Dynamic Split Computing for Efficient Deep Edge Intelligence [78.4233915447056]
通信チャネルの状態に基づいて最適な分割位置を動的に選択する動的分割計算を導入する。
本研究では,データレートとサーバ負荷が時間とともに変化するエッジコンピューティング環境において,動的スプリットコンピューティングが高速な推論を実現することを示す。
論文 参考訳(メタデータ) (2022-05-23T12:35:18Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Partitioning sparse deep neural networks for scalable training and
inference [8.282177703075453]
最先端のディープニューラルネットワーク(DNN)には、計算とデータ管理の大幅な要件がある。
スパシフィケーション法とプルーニング法は,DNNの大量の接続を除去するのに有効であることが示されている。
その結果得られたスパースネットワークは、ディープラーニングにおけるトレーニングと推論の計算効率をさらに向上するためのユニークな課題を提示する。
論文 参考訳(メタデータ) (2021-04-23T20:05:52Z) - Training and Inference for Integer-Based Semantic Segmentation Network [18.457074855823315]
セグメンテーションネットワークのトレーニングと推論のための新しい量子化フレームワークを提案する。
我々のフレームワークはFCN-VGG16やDeepLabv3-ResNet50のような主流セマンティックセマンティクスネットワークで評価されている。
論文 参考訳(メタデータ) (2020-11-30T02:07:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。