論文の概要: Serdab: An IoT Framework for Partitioning Neural Networks Computation
across Multiple Enclaves
- arxiv url: http://arxiv.org/abs/2005.06043v1
- Date: Tue, 12 May 2020 20:51:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 19:59:19.505462
- Title: Serdab: An IoT Framework for Partitioning Neural Networks Computation
across Multiple Enclaves
- Title(参考訳): Serdab: 複数のエンクレーブにまたがるニューラルネットワーク計算を分割するIoTフレームワーク
- Authors: Tarek Elgamal, Klara Nahrstedt
- Abstract要約: Serdabは、複数のセキュアなエンクレーブにディープニューラルネットワークをデプロイするための分散オーケストレーションフレームワークである。
我々のパーティショニング戦略は、ニューラルネットワーク全体を1エンクレーブで実行する場合と比較して最大4.7倍のスピードアップを達成する。
- 参考スコア(独自算出の注目度): 8.550865312110911
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in Deep Neural Networks (DNN) and Edge Computing have made it
possible to automatically analyze streams of videos from home/security cameras
over hierarchical clusters that include edge devices, close to the video
source, as well as remote cloud compute resources. However, preserving the
privacy and confidentiality of users' sensitive data as it passes through
different devices remains a concern to most users. Private user data is subject
to attacks by malicious attackers or misuse by internal administrators who may
use the data in activities that are not explicitly approved by the user. To
address this challenge, we present Serdab, a distributed orchestration
framework for deploying deep neural network computation across multiple secure
enclaves (e.g., Intel SGX). Secure enclaves provide a guarantee on the privacy
of the data/code deployed inside it. However, their limited hardware resources
make them inefficient when solely running an entire deep neural network. To
bridge this gap, Serdab presents a DNN partitioning strategy to distribute the
layers of the neural network across multiple enclave devices or across an
enclave device and other hardware accelerators. Our partitioning strategy
achieves up to 4.7x speedup compared to executing the entire neural network in
one enclave.
- Abstract(参考訳): 近年のDeep Neural Networks(DNN)とEdge Computingの進歩により、エッジデバイス、ビデオソースに近い、リモートクラウド計算リソースを含む階層的なクラスタ上で、ホーム/セキュリティカメラからのビデオストリームを自動的に分析することが可能になった。
しかし、異なるデバイスを通過するユーザーの機密データのプライバシーと機密性を維持することは、多くのユーザーにとって懸念されている。
プライベートユーザデータは、悪意のある攻撃者による攻撃や、ユーザによって明示的に承認されていないアクティビティでデータを使用する内部管理者による誤用の対象となる。
この課題に対処するために,複数のセキュアなエンクレーブ(例えばintel sgx)にディープニューラルネットワークをデプロイするための分散オーケストレーションフレームワークであるserdabを提案する。
Secure Enclavesは、その内部にデプロイされたデータ/コードのプライバシを保証する。
しかし、その限られたハードウェアリソースは、ディープニューラルネットワーク全体を実行する場合に非効率になる。
このギャップを埋めるため、SerdabはDNNパーティショニング戦略を提案し、ニューラルネットワークの層を複数のエンクレーブデバイスまたは複数のエンクレーブデバイスや他のハードウェアアクセラレータに分散させる。
我々のパーティショニング戦略は、ニューラルネットワーク全体を1エンクレーブで実行する場合と比較して最大4.7倍のスピードアップを達成する。
関連論文リスト
- MatchNAS: Optimizing Edge AI in Sparse-Label Data Contexts via
Automating Deep Neural Network Porting for Mobile Deployment [54.77943671991863]
MatchNASはDeep Neural Networksをモバイルデバイスに移植するための新しいスキームである。
ラベル付きデータと非ラベル付きデータの両方を用いて、大規模なネットワークファミリを最適化する。
そして、さまざまなハードウェアプラットフォーム用に調整されたネットワークを自動的に検索する。
論文 参考訳(メタデータ) (2024-02-21T04:43:12Z) - Fully Spiking Actor Network with Intra-layer Connections for
Reinforcement Learning [51.386945803485084]
エージェントが制御する多次元決定論的ポリシーを学習する必要があるタスクに焦点をあてる。
既存のスパイクベースのRL法は、SNNの出力として発火率を取り、完全に接続された層を通して連続的なアクション空間(つまり決定論的なポリシー)を表すように変換する。
浮動小数点行列操作を伴わない完全にスパイクするアクターネットワークを開発するため,昆虫に見られる非スパイク介在ニューロンからインスピレーションを得た。
論文 参考訳(メタデータ) (2024-01-09T07:31:34Z) - $\Lambda$-Split: A Privacy-Preserving Split Computing Framework for
Cloud-Powered Generative AI [3.363904632882723]
本稿では,計算オフロードを容易にする分割計算フレームワークである$Lambda$-Splitを紹介する。
Lambda$-Splitでは、生成モデル(通常はディープニューラルネットワーク(DNN))が3つのサブモデルに分割され、ユーザのローカルデバイスとクラウドサーバに分散される。
このアーキテクチャにより、隠された層出力のみが送信されることが保証され、プライバシーに敏感な生入力および出力データの外部送信が防止される。
論文 参考訳(メタデータ) (2023-10-23T07:44:04Z) - RL-DistPrivacy: Privacy-Aware Distributed Deep Inference for low latency
IoT systems [41.1371349978643]
本稿では,流通戦略の再考を通じて協調的深層推論の安全性を目標とするアプローチを提案する。
我々は、この手法を最適化として定式化し、コ推論のレイテンシとプライバシーレベルのデータのトレードオフを確立する。
論文 参考訳(メタデータ) (2022-08-27T14:50:00Z) - Decentralized Low-Latency Collaborative Inference via Ensembles on the
Edge [28.61344039233783]
本稿では,複数のユーザが推論中に協力して精度を向上させることで,エッジ上でのディープニューラルネットワーク(DNN)の適用を容易にすることを提案する。
私たちのメカニズムは、エッジアンサンブル(em edge ensembles)と呼ばれ、各デバイスに様々な予測子を持ち、推論中にモデルのアンサンブルを形成する。
エッジアンサンブルによって引き起こされる遅延を分析し、その性能改善は、通信ネットワーク上の一般的な前提の下で、わずかな追加遅延のコストで生じることを示す。
論文 参考訳(メタデータ) (2022-06-07T10:24:20Z) - Dynamic Split Computing for Efficient Deep Edge Intelligence [78.4233915447056]
通信チャネルの状態に基づいて最適な分割位置を動的に選択する動的分割計算を導入する。
本研究では,データレートとサーバ負荷が時間とともに変化するエッジコンピューティング環境において,動的スプリットコンピューティングが高速な推論を実現することを示す。
論文 参考訳(メタデータ) (2022-05-23T12:35:18Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Quantized Neural Networks via {-1, +1} Encoding Decomposition and
Acceleration [83.84684675841167]
本稿では,量子化されたニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解するために,-1,+1を用いた新しい符号化方式を提案する。
本稿では,大規模画像分類,オブジェクト検出,セマンティックセグメンテーションにおける提案手法の有効性を検証する。
論文 参考訳(メタデータ) (2021-06-18T03:11:15Z) - NeuraCrypt: Hiding Private Health Data via Random Neural Networks for
Public Training [64.54200987493573]
我々は,ランダムな深層ニューラルネットワークに基づくプライベート符号化方式であるNeuraCryptを提案する。
NeuraCryptは、データ所有者のみが知っているランダムに構築されたニューラルネットワークを使用して、生の患者データをエンコードする。
我々は,NeuraCryptが,様々なX線タスクの非プライベートベースラインに対して,競合精度を達成することを示す。
論文 参考訳(メタデータ) (2021-06-04T13:42:21Z) - Robust error bounds for quantised and pruned neural networks [1.8083503268672914]
機械学習のアルゴリズムは、データとアルゴリズムを保存し、訓練し、デバイス上でローカルに分散化しようとしている。
デバイスハードウェアは、このセットアップにおけるモデル機能の主要なボトルネックとなり、スリム化され、より効率的なニューラルネットワークの必要性を生み出します。
半確定プログラムを導入して、ニューラルネットワークのプルーニングや定量化による最悪のケースエラーをバインドする。
計算されたバウンダリは、安全クリティカルなシステムにデプロイした場合に、これらのアルゴリズムの性能に確実性をもたらすことが期待されている。
論文 参考訳(メタデータ) (2020-11-30T22:19:44Z) - Multi-stage Jamming Attacks Detection using Deep Learning Combined with
Kernelized Support Vector Machine in 5G Cloud Radio Access Networks [17.2528983535773]
本研究は5G C-RANにML-IDS(Multi-stage Machine Learning-based Intrusion Detection)を配置することに焦点を当てる。
一定のジャミング、ランダムジャミング、ジャミング、リアクティブジャミングの4種類のジャミング攻撃を検出し、分類することができる。
最終分類精度は94.51%で、偽陰性率は7.84%である。
論文 参考訳(メタデータ) (2020-04-13T17:21:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。