論文の概要: Streaming Video Analytics On The Edge With Asynchronous Cloud Support
- arxiv url: http://arxiv.org/abs/2210.01402v1
- Date: Tue, 4 Oct 2022 06:22:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:44:21.185528
- Title: Streaming Video Analytics On The Edge With Asynchronous Cloud Support
- Title(参考訳): 非同期クラウドサポートを備えたエッジ上のストリーミングビデオ分析
- Authors: Anurag Ghosh, Srinivasan Iyengar, Stephen Lee, Anuj Rathore, Venkat N
Padmanabhan
- Abstract要約: 本稿では,エッジとクラウドの予測を融合させ,低レイテンシで高精度なエッジクラウド融合アルゴリズムを提案する。
ビデオのオブジェクト検出(多くのビデオ分析シナリオに適用可能)に注目し、融合したエッジクラウド予測が、エッジのみのシナリオとクラウドのみのシナリオの精度を最大50%上回ることを示す。
- 参考スコア(独自算出の注目度): 2.7456483236562437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emerging Internet of Things (IoT) and mobile computing applications are
expected to support latency-sensitive deep neural network (DNN) workloads. To
realize this vision, the Internet is evolving towards an edge-computing
architecture, where computing infrastructure is located closer to the end
device to help achieve low latency. However, edge computing may have limited
resources compared to cloud environments and thus, cannot run large DNN models
that often have high accuracy. In this work, we develop REACT, a framework that
leverages cloud resources to execute large DNN models with higher accuracy to
improve the accuracy of models running on edge devices. To do so, we propose a
novel edge-cloud fusion algorithm that fuses edge and cloud predictions,
achieving low latency and high accuracy. We extensively evaluate our approach
and show that our approach can significantly improve the accuracy compared to
baseline approaches. We focus specifically on object detection in videos
(applicable in many video analytics scenarios) and show that the fused
edge-cloud predictions can outperform the accuracy of edge-only and cloud-only
scenarios by as much as 50%. We also show that REACT can achieve good
performance across tradeoff points by choosing a wide range of system
parameters to satisfy use-case specific constraints, such as limited network
bandwidth or GPU cycles.
- Abstract(参考訳): IoT(Internet of Things)とモバイルコンピューティングアプリケーションは、レイテンシに敏感なディープニューラルネットワーク(DNN)ワークロードをサポートすることが期待されている。
このビジョンを実現するために、インターネットはエッジコンピューティングアーキテクチャに向かって進化している。
しかし、エッジコンピューティングはクラウド環境と比較して限られたリソースしか持たないため、しばしば高精度な大規模なDNNモデルを実行することはできない。
本研究では,クラウドリソースを活用して大規模DNNモデルを高い精度で実行し,エッジデバイス上で動作するモデルの精度を向上させるフレームワークであるREACTを開発する。
そこで我々は,エッジとクラウドの予測を融合し,低レイテンシで高精度なエッジクラウド融合アルゴリズムを提案する。
我々は,我々のアプローチを広範囲に評価し,本手法がベースラインアプローチと比較して精度を著しく向上できることを示す。
ビデオ中のオブジェクト検出(多くのビデオ分析シナリオで適用可能)に注目し、エッジのみの予測がエッジのみの予測とクラウドのみの予測の精度を最大50%上回ることを示した。
また,ネットワーク帯域幅の制限やGPUサイクルといったユースケース固有の制約を満たすため,幅広いシステムパラメータを選択することで,トレードオフ点間でのREACTの性能が向上することを示す。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Distributed Inference on Mobile Edge and Cloud: An Early Exit based Clustering Approach [5.402030962296633]
ディープニューラルネットワーク(DNN)は、様々な領域で優れたパフォーマンスを示している。
小型のDNNをモバイル、エッジの大型バージョン、クラウドのフルフローにデプロイできる分散推論設定を使用することができる。
DNNにおける推論遅延を最小限に抑えるために,Early Exit(EE)戦略を利用した新しい手法を開発した。
論文 参考訳(メタデータ) (2024-10-06T20:14:27Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - EffCNet: An Efficient CondenseNet for Image Classification on NXP
BlueBox [0.0]
エッジデバイスは、安価なハードウェアと限られた冷却と計算資源のために、限られた処理能力を提供する。
我々はエッジデバイスのためのEffCNetと呼ばれる新しいディープ畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-28T21:32:31Z) - POEM: 1-bit Point-wise Operations based on Expectation-Maximization for
Efficient Point Cloud Processing [53.74076015905961]
我々は,効率的なポイントクラウド処理のために,期待最大化に基づくポイントワイズ処理をBNNに導入する。
私たちのPOEMは、最先端のバイナリポイントクラウドネットワークを6.7%まで大きく上回っている。
論文 参考訳(メタデータ) (2021-11-26T09:45:01Z) - Auto-Split: A General Framework of Collaborative Edge-Cloud AI [49.750972428032355]
本稿では,Huawei Cloudのエッジクラウド共同プロトタイプであるAuto-Splitの技法と技術実践について述べる。
私たちの知る限りでは、Deep Neural Network(DNN)分割機能を提供する既存の産業製品はありません。
論文 参考訳(メタデータ) (2021-08-30T08:03:29Z) - Latency-Memory Optimized Splitting of Convolution Neural Networks for
Resource Constrained Edge Devices [1.6873748786804317]
我々は、エッジデバイスとクラウド間でCNNを実行することは、リソース制約のある最適化問題を解決することと同義であると主張している。
実世界のエッジデバイスでの実験では、LMOSはエッジで異なるCNNモデルの実行可能な実行を保証する。
論文 参考訳(メタデータ) (2021-07-19T19:39:56Z) - Towards Unsupervised Fine-Tuning for Edge Video Analytics [1.1091582432763736]
自動モデル特殊化による余分な計算コストを伴わずにエッジモデルの精度を向上させる手法を提案する。
その結果,本手法は,事前学習モデルの精度を平均21%向上できることがわかった。
論文 参考訳(メタデータ) (2021-04-14T12:57:40Z) - A Serverless Cloud-Fog Platform for DNN-Based Video Analytics with
Incremental Learning [31.712746462418693]
本稿では、クライアント-フォグクラウドのシナジーをフル活用して、DNNベースのビデオ分析に役立てる最初のサーバーレスシステムを提案する。
この目的のために、V(Video-Platform-as-a-Service)と呼ばれる総合的なクラウドフォッグシステムを実装した。
評価の結果、Vは複数のSOTAシステムよりも優れており、高い精度を維持しながら帯域幅を最大21%削減し、RTTを最大62.5%削減し、クラウドの金融コストを最大50%削減している。
論文 参考訳(メタデータ) (2021-02-05T05:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。