論文の概要: Revisiting Outage for Edge Inference Systems
- arxiv url: http://arxiv.org/abs/2504.03686v2
- Date: Mon, 28 Apr 2025 06:14:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.394023
- Title: Revisiting Outage for Edge Inference Systems
- Title(参考訳): エッジ推論システムにおける障害の再検討
- Authors: Zhanwei Wang, Qunsong Zeng, Haotian Zheng, Kaibin Huang,
- Abstract要約: 本稿では,E2E推定精度が目標閾値を下回る確率を定量化する,推論停止(InfOut)確率を特徴付ける理論的枠組みを提案する。
実験により,従来のコミュニケーション中心のアプローチよりも提案設計の方が優れていることが示された。
- 参考スコア(独自算出の注目度): 26.22867156180142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the key missions of sixth-generation (6G) mobile networks is to deploy large-scale artificial intelligence (AI) models at the network edge to provide remote-inference services for edge devices. The resultant platform, known as edge inference, will support a wide range of Internet-of-Things applications, such as autonomous driving, industrial automation, and augmented reality. Given the mission-critical and time-sensitive nature of these tasks, it is essential to design edge inference systems that are both reliable and capable of meeting stringent end-to-end (E2E) latency constraints. Existing studies, which primarily focus on communication reliability as characterized by channel outage probability, may fail to guarantee E2E performance, specifically in terms of E2E inference accuracy and latency. To address this limitation, we propose a theoretical framework that introduces and mathematically characterizes the inference outage (InfOut) probability, which quantifies the likelihood that the E2E inference accuracy falls below a target threshold. Under an E2E latency constraint, this framework establishes a fundamental tradeoff between communication overhead (i.e., uploading more sensor observations) and inference reliability as quantified by the InfOut probability. To find a tractable way to optimize this tradeoff, we derive accurate surrogate functions for InfOut probability by applying a Gaussian approximation to the distribution of the received discriminant gain. Experimental results demonstrate the superiority of the proposed design over conventional communication-centric approaches in terms of E2E inference reliability.
- Abstract(参考訳): 第6世代(6G)モバイルネットワークの重要なミッションの1つは、エッジデバイスのためのリモート推論サービスを提供するために、大規模人工知能(AI)モデルをネットワークエッジに展開することである。
エッジ推論として知られるこのプラットフォームは、自動運転、産業自動化、拡張現実など、幅広いインターネット・オブ・Thingsアプリケーションをサポートする。
これらのタスクのミッションクリティカルで時間に敏感な性質を考えると、信頼性が高く、E2E(stringent end-to-end)レイテンシの制約を満たすことができるエッジ推論システムを設計することが不可欠である。
チャネル停止確率を特徴とする通信信頼性に主に注目する既存の研究は、特にE2Eの推測精度と遅延の観点から、E2Eの性能を保証することに失敗する可能性がある。
この制限に対処するために、E2E推論精度が目標しきい値を下回る確率を定量化する推論停止(InfOut)確率を数学的に導入し、特徴付ける理論的枠組みを提案する。
E2Eレイテンシ制約の下で、このフレームワークは通信オーバーヘッド(つまり、より多くのセンサ観測をアップロードする)とInfOut確率で定量化される推論信頼性の基本的なトレードオフを確立する。
このトレードオフを最適化する方法を見つけるために、受信した識別利得の分布にガウス近似を適用することにより、InfOut確率の正確なサロゲート関数を導出する。
実験により,E2E推論の信頼性の観点から,従来の通信中心方式よりも提案手法の方が優れていることが示された。
関連論文リスト
- DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - DistrEE: Distributed Early Exit of Deep Neural Network Inference on Edge Devices [13.916010072536377]
サービス要求の品質を満たすために、モデル推論を早期に終了させることができる分散DNN推論フレームワークであるDistrEEを提案する。
DistrEEは効率的な協調推論を効率的に実現でき、推論レイテンシと精度のトレードオフを効果的に達成できることを示す。
論文 参考訳(メタデータ) (2025-02-06T09:16:54Z) - Communication-Efficient Federated Learning by Quantized Variance Reduction for Heterogeneous Wireless Edge Networks [55.467288506826755]
フェデレーテッド・ラーニング(FL)は、無線エッジネットワークにおけるローカル・プライバシ・アウェア・コラボレーティブ・モデルトレーニングの有効なソリューションとして認識されている。
既存の通信効率の高いFLアルゴリズムは、デバイス間の大きなばらつきを低減できない。
本稿では,高度分散還元方式に依存する新しい通信効率FLアルゴリズムであるFedQVRを提案する。
論文 参考訳(メタデータ) (2025-01-20T04:26:21Z) - Learning Robust Representations for Communications over Interference-limited Channels [0.6990493129893111]
本研究では、干渉制限環境下でのブロック伝送と検出のためのエンコーダとデコーダの設計のために、TwinNetとSiameseNetという2つの高効率な手法を紹介した。
論文 参考訳(メタデータ) (2024-10-13T09:09:21Z) - Reliable Federated Disentangling Network for Non-IID Domain Feature [62.73267904147804]
本稿では、RFedDisと呼ばれる新しい信頼性のあるフェデレーション・ディエンタングリング・ネットワークを提案する。
我々の知る限り、提案するRFedDisは、明らかな不確実性と特徴の混在に基づくFLアプローチを開発する最初の試みである。
提案するRFedDisは,他の最先端FL手法と比較して信頼性の高い優れた性能を提供する。
論文 参考訳(メタデータ) (2023-01-30T11:46:34Z) - Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Variational Autoencoders for Reliability Optimization in Multi-Access
Edge Computing Networks [36.54164679645639]
マルチレイテンシエッジコンピューティング(MEC)は、サービス信頼性とレイテンシの厳しい新しいアプリケーションをサポートするために、将来の無線ネットワークの不可欠な部分と見なされている。
超信頼性と低レイテンシのMECを保証することは、無線リンクの不確実性、限られた通信とコンピューティングリソース、そして動的ネットワークトラフィックのために非常に難しい。
URLL MECの導入は、無線およびエッジコンピューティングシステムにおけるエンドツーエンド(E2E)のレイテンシと信頼性の統計を考慮に入れている。
論文 参考訳(メタデータ) (2022-01-25T01:20:37Z) - Introspective Robot Perception using Smoothed Predictions from Bayesian
Neural Networks [17.162534445528827]
本研究は、RGB画像から対象分類の分野における不確実性推定を改善することに焦点を当てる。
我々はBNNを用いて2つの実用的な推論手法を評価し、より良い不確実性の推定値を得る。
条件付きランダム場内の一様ポテンシャルとして信頼性の高い不確実性推定を用いた性能向上を示す。
論文 参考訳(メタデータ) (2021-09-27T08:40:19Z) - Quantized Federated Learning under Transmission Delay and Outage
Constraints [30.892724364965005]
フェデレートラーニング(Federated Learning)は、無線エッジ内の巨大なモバイルデバイスと協調して機械学習モデルをトレーニングする、実行可能な分散学習パラダイムである。
無線リソースが限られている実用的なシステムでは、多数のモデルパラメータの送信は量子化エラー(QE)と送信停止(TO)に必然的に悩まされる。
我々は,無線リソースと量子化ビットをクライアント間で共同で割り当て,QEを最小化するとともに,クライアントがTO確率を持つようにする,堅牢なFLスキームFedTOEを提案する。
論文 参考訳(メタデータ) (2021-06-17T11:29:12Z) - Uncertainty-Aware Deep Calibrated Salient Object Detection [74.58153220370527]
既存のディープニューラルネットワークに基づくサルエントオブジェクト検出(SOD)手法は主に高いネットワーク精度の追求に重点を置いている。
これらの手法は、信頼不均衡問題として知られるネットワーク精度と予測信頼の間のギャップを見落としている。
我々は,不確実性を考慮した深部SODネットワークを導入し,深部SODネットワークの過信を防止するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2020-12-10T23:28:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。