Fugu-MT 論文翻訳(概要): CONTINUER: Maintaining Distributed DNN Services During Edge Failures

論文の概要: CONTINUER: Maintaining Distributed DNN Services During Edge Failures

arxiv url: http://arxiv.org/abs/2206.05267v1
Date: Mon, 25 Apr 2022 18:53:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-15 17:32:55.152844
Title: CONTINUER: Maintaining Distributed DNN Services During Edge Failures
Title（参考訳）: CONTINUER: エッジ障害時の分散DNNサービスのメンテナンス
Authors: Ayesha Abdul Majeed and Peter Kilpatrick and Ivor Spence and Blesson Varghese
Abstract要約: エッジノード間のディープニューラルネットワーク(DNN)のパーティショニングとデプロイは、アプリケーションのパフォーマンス目標を満たすために使用することができる。単一ノードの障害はカスケード障害を引き起こし、サービスのデリバリに悪影響を及ぼす可能性がある。本稿では, 分割, 早期終了, スキップ接続の3つの手法について検討する。
参考スコア（独自算出の注目度）: 0.34410212782758043
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Partitioning and deploying Deep Neural Networks (DNNs) across edge nodes may be used to meet performance objectives of applications. However, the failure of a single node may result in cascading failures that will adversely impact the delivery of the service and will result in failure to meet specific objectives. The impact of these failures needs to be minimised at runtime. Three techniques are explored in this paper, namely repartitioning, early-exit and skip-connection. When an edge node fails, the repartitioning technique will repartition and redeploy the DNN thus avoiding the failed nodes. The early-exit technique makes provision for a request to exit (early) before the failed node. The skip connection technique dynamically routes the request by skipping the failed nodes. This paper will leverage trade-offs in accuracy, end-to-end latency and downtime for selecting the best technique given user-defined objectives (accuracy, latency and downtime thresholds) when an edge node fails. To this end, CONTINUER is developed. Two key activities of the framework are estimating the accuracy and latency when using the techniques for distributed DNNs and selecting the best technique. It is demonstrated on a lab-based experimental testbed that CONTINUER estimates accuracy and latency when using the techniques with no more than an average error of 0.28% and 13.06%, respectively and selects the suitable technique with a low overhead of no more than 16.82 milliseconds and an accuracy of up to 99.86%.
Abstract（参考訳）: エッジノードにまたがるディープニューラルネットワーク(dnn)のパーティショニングとデプロイは、アプリケーションのパフォーマンス目標を満たすために使用できる。しかしながら、単一ノードの障害はカスケード障害を引き起こし、サービスのデリバリに悪影響を及ぼし、特定の目的を達成するのに失敗する可能性がある。これらの障害の影響は、実行時に最小化する必要がある。本稿では, 分割, 早期終了, スキップ接続の3つの手法について検討する。エッジノードがフェールすると、リパーティショニングテクニックが再分割され、DNNが再デプロイされるため、失敗したノードは回避される。 early-exitテクニックは、失敗したノードの前に(早期に)終了する要求をプロビジョニングする。スキップ接続技術は、失敗したノードをスキップすることでリクエストを動的にルーティングする。本稿では,エッジノードが故障した場合のユーザ定義目標(精度,レイテンシ,ダウンタイムしきい値)の最適手法を選択するために,精度,エンドツーエンドレイテンシ,ダウンタイムのトレードオフを利用する。そのため、CONTINUERが開発された。フレームワークの2つの重要なアクティビティは、分散DNNのテクニックを使用する際の精度とレイテンシを推定し、最良のテクニックを選択することである。ラボベースの実験実験ベッドでは、平均誤差0.28%と13.06%以下の技術を使用する場合、継続者が精度とレイテンシを推定し、16.82ミリ秒以下のオーバーヘッドと99.86%の精度で適切な手法を選択することが示されている。

関連論文リスト

Effects of Dropout on Performance in Long-range Graph Learning Tasks [8.524684315458243]
MPNNはグラフニューラルネットワーク(Graph Neural Networks)で、ローカルな地区を通じてグラフ全体に情報を伝達する。オーバースムーシングとオーバースキャッシングは、MPNNにとって2つの重要な課題である。我々は、エッジドロップによって失われた情報の比率を明示的に制御するDropEdgeの感度対応版であるDropSensを紹介する。
論文参考訳（メタデータ） (2025-02-11T08:36:38Z)
BEEM: Boosting Performance of Early Exit DNNs using Multi-Exit Classifiers as Experts [5.402030962296633]
ディープニューラルネットワーク(DNN)における推論遅延を低減する手段として、初期のExitテクニックが登場した。本稿では,出口分類器を専門家のBEEMとして扱い,信頼性スコアを集計する新たな意思決定基準を提案する。提案手法は最先端のEE手法の性能を向上し,1.5倍から2.1倍の高速化を実現している。
論文参考訳（メタデータ） (2025-02-02T10:35:19Z)
Direct Training Needs Regularisation: Anytime Optimal Inference Spiking Neural Network [23.434563009813218]
スパイキングニューラルネットワーク(SNN)は,次世代のニューラルネットワーク(ANN)として認識される空間時間正規化(STR)と呼ばれる新しい正規化手法を導入する。 STRは各段階におけるスパイクの強さと膜電位の比を調節する。これは、トレーニング中の空間的および時間的パフォーマンスを効果的にバランスさせ、最終的にはAnytime Optimal Inference (AOI) SNNとなる。
論文参考訳（メタデータ） (2024-04-15T15:57:01Z)
UPNet: Uncertainty-based Picking Deep Learning Network for Robust First Break Picking [6.380128763476294]
第一破砕(FB)ピッキングは地下速度モデルの決定において重要な側面である。この処理を高速化するために、ディープニューラルネットワーク(DNN)が提案されている。本稿では、FB選択タスクに不確実性定量化を導入し、UPNetと呼ばれる新しい不確実性に基づくディープラーニングネットワークを提案する。
論文参考訳（メタデータ） (2023-05-23T08:13:09Z)
Knowing When to Stop: Delay-Adaptive Spiking Neural Network Classifiers with Reliability Guarantees [36.14499894307206]
スパイキングニューラルネットワーク(SNN)は、内部イベント駆動型ニューラルネットワークを通じて時系列データを処理する。本稿では,入力依存停止時に発生する決定に対して,信頼性を保証する新しい遅延適応型SNNベースの推論手法を提案する。
論文参考訳（メタデータ） (2023-05-18T22:11:04Z)
Optimising Event-Driven Spiking Neural Network with Regularisation and Cutoff [31.61525648918492]
スパイキングニューラルネットワーク(SNN)は、ニューラルネットワークのより近い模倣を提供する。現在のSNNは一定期間にわたって推測するように訓練されている。本稿では,効率的な推論を実現するため,推論中にいつでもSNNを停止できるSNNのカットオフを提案する。
論文参考訳（メタデータ） (2023-01-23T16:14:09Z)
Fast Exploration of the Impact of Precision Reduction on Spiking Neural Networks [63.614519238823206]
ターゲットハードウェアがコンピューティングの端に達すると、スパイキングニューラルネットワーク(SNN)が実用的な選択となる。我々は、近似誤差を伝播するそのようなモデルの能力を生かした探索手法を開発するために、インターヴァル算術(IA)モデルを用いる。
論文参考訳（メタデータ） (2022-11-22T15:08:05Z)
TCT: Convexifying Federated Learning using Bootstrapped Neural Tangent Kernels [141.29156234353133]
最先端の凸学習手法は、クライアントが異なるデータ分布を持つ場合、集中型よりもはるかにパフォーマンスが劣る。我々は、この格差は、非NISTityが提示した課題に大きく起因していることを示す。本稿では,Train-Convexify Neural Network (TCT) 手法を提案する。
論文参考訳（メタデータ） (2022-07-13T16:58:22Z)
GDP: Stabilized Neural Network Pruning via Gates with Differentiable Polarization [84.57695474130273]
ゲートベースまたは重要度に基づくプルーニング手法は、重要度が最小のチャネルを削除することを目的としている。 GDPは、各チャネルのオン・アンド・オフを制御するために、ベルやホイッスルのない畳み込み層の前に接続することができる。 CIFAR-10とImageNetデータセットを用いて行った実験は、提案したGDPが最先端のパフォーマンスを達成することを示している。
論文参考訳（メタデータ） (2021-09-06T03:17:10Z)
Edge-Detect: Edge-centric Network Intrusion Detection using Deep Neural Network [0.0]
エッジノードは、Internet-of-Thingsエンドポイント上の複数のサイバー攻撃を検出するために不可欠である。 DLM技術を用いてエッジノードに対するDoS攻撃を検知する,軽量で高速かつ高精度なEdge-Detectモデルを開発した。
論文参考訳（メタデータ） (2021-02-03T04:24:34Z)
Scission: Performance-driven and Context-aware Cloud-Edge Distribution of Deep Neural Networks [1.2949520455740093]
本稿では,対象とするデバイス,エッジ,クラウドリソースのセット上で,ディープニューラルネットワーク(DNN)の自動ベンチマークを行うツールであるScisionを提案する。意思決定のアプローチは、ターゲットリソースのハードウェア機能を活用することによって、コンテキスト認識である。 Scissionのベンチマークのオーバーヘッドにより、リアルタイムではなく、定期的に運用上の変更に対応することができる。
論文参考訳（メタデータ） (2020-08-08T13:39:57Z)
AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文参考訳（メタデータ） (2020-07-14T09:07:29Z)
Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey [77.99182201815763]
ディープニューラルネットワーク(DNN)は多くの異なる問題設定において最先端の結果を達成する。 DNNはしばしばブラックボックスシステムとして扱われ、評価と検証が複雑になる。コンピュータビジョンタスクにおける畳み込みニューラルネットワーク(CNN)の成功に触発された、有望な分野のひとつは、対称幾何学的変換に関する知識を取り入れることである。
論文参考訳（メタデータ） (2020-06-30T14:56:05Z)
GraN: An Efficient Gradient-Norm Based Detector for Adversarial and Misclassified Examples [77.99182201815763]
ディープニューラルネットワーク(DNN)は、敵対的な例やその他のデータ摂動に対して脆弱である。 GraNは、どのDNNにも容易に適応できる時間およびパラメータ効率の手法である。 GraNは多くの問題セットで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2020-04-20T10:09:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。