論文の概要: Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via
Deep Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2301.00130v1
- Date: Sat, 31 Dec 2022 05:53:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 14:26:13.399147
- Title: Accuracy-Guaranteed Collaborative DNN Inference in Industrial IoT via
Deep Reinforcement Learning
- Title(参考訳): 深層強化学習による産業IoTにおける精度保証協調DNN推論
- Authors: Wen Wu, Peng Yang, Weiting Zhang, Conghao Zhou, Xuemin (Sherman) Shen
- Abstract要約: 計算集約型ディープニューラルネットワーク(DNN)推論サービスをサポートするためには,IoT(Industrial Internet of Things)デバイスとエッジネットワークのコラボレーションが不可欠だ。
本稿では,産業用IoTネットワークにおける協調推論問題について検討する。
- 参考スコア(独自算出の注目度): 10.223526707269537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaboration among industrial Internet of Things (IoT) devices and edge
networks is essential to support computation-intensive deep neural network
(DNN) inference services which require low delay and high accuracy. Sampling
rate adaption which dynamically configures the sampling rates of industrial IoT
devices according to network conditions, is the key in minimizing the service
delay. In this paper, we investigate the collaborative DNN inference problem in
industrial IoT networks. To capture the channel variation and task arrival
randomness, we formulate the problem as a constrained Markov decision process
(CMDP). Specifically, sampling rate adaption, inference task offloading and
edge computing resource allocation are jointly considered to minimize the
average service delay while guaranteeing the long-term accuracy requirements of
different inference services. Since CMDP cannot be directly solved by general
reinforcement learning (RL) algorithms due to the intractable long-term
constraints, we first transform the CMDP into an MDP by leveraging the Lyapunov
optimization technique. Then, a deep RL-based algorithm is proposed to solve
the MDP. To expedite the training process, an optimization subroutine is
embedded in the proposed algorithm to directly obtain the optimal edge
computing resource allocation. Extensive simulation results are provided to
demonstrate that the proposed RL-based algorithm can significantly reduce the
average service delay while preserving long-term inference accuracy with a high
probability.
- Abstract(参考訳): 産業用モノのインターネット(IoT)デバイスとエッジネットワークのコラボレーションは、低遅延と高精度を必要とする計算集約型ディープニューラルネットワーク(DNN)推論サービスをサポートするために不可欠である。
ネットワーク条件に応じて産業用IoTデバイスのサンプリングレートを動的に設定するサンプリングレート適応は、サービス遅延を最小限にする鍵となる。
本稿では,産業用IoTネットワークにおける協調型DNN推論問題について検討する。
チャネル変動とタスク到着ランダム性を捉えるため,マルコフ決定過程 (CMDP) として問題を定式化する。
特に、サンプリングレート適応、推論タスクオフロード、エッジコンピューティングリソース割り当ては、異なる推論サービスの長期精度要件を保証しつつ、平均的なサービス遅延を最小限に抑えるために共同で検討される。
難解な長期制約のため,一般強化学習(rl)アルゴリズムではcmdpを直接解くことができないため,まずlyapunov最適化手法を用いてcmdpをmdpに変換する。
次に,MDPの解法として深部RLに基づくアルゴリズムを提案する。
トレーニングプロセスの高速化のために,提案アルゴリズムに最適化サブルーチンを組み込んで,最適なエッジコンピューティングリソース割り当てを直接取得する。
提案手法は, 長期推定精度を高い確率で保持しつつ, 平均サービス遅延を著しく低減できることを示すために, 広範なシミュレーション結果が得られた。
関連論文リスト
- Computation Pre-Offloading for MEC-Enabled Vehicular Networks via Trajectory Prediction [38.493882483362135]
本稿では,車両の過去の軌跡を解析するためのトラジェクトリ予測に基づく事前負荷決定アルゴリズムを提案する。
本稿では,Double Deep Q-Network (DDQN) を用いて,エッジサーバがタスク処理遅延を最小限に抑える動的リソース割り当てアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-26T09:46:43Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Training Latency Minimization for Model-Splitting Allowed Federated Edge
Learning [16.8717239856441]
我々は,深層ニューラルネットワーク(DNN)の訓練において,クライアントが直面する計算能力の不足を軽減するためのモデル分割許容FL(SFL)フレームワークを提案する。
同期したグローバルアップデート設定では、グローバルトレーニングを完了するためのレイテンシは、クライアントがローカルトレーニングセッションを完了するための最大レイテンシによって決定される。
この混合整数非線形計画問題の解法として,AIモデルのカット層と他のパラメータの量的関係に適合する回帰法を提案し,TLMPを連続的な問題に変換する。
論文 参考訳(メタデータ) (2023-07-21T12:26:42Z) - Efficient Parallel Split Learning over Resource-constrained Wireless
Edge Networks [44.37047471448793]
本稿では,エッジコンピューティングパラダイムと並列分割学習(PSL)の統合を提唱する。
そこで本研究では,モデル学習を高速化するために,効率的な並列分割学習(EPSL)という革新的なPSLフレームワークを提案する。
提案するEPSLフレームワークは,目標精度を達成するために必要なトレーニング遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2023-03-26T16:09:48Z) - Scheduling Inference Workloads on Distributed Edge Clusters with
Reinforcement Learning [11.007816552466952]
本稿では,エッジネットワークにおける予測クエリを短時間でスケジューリングする問題に焦点をあてる。
シミュレーションにより,大規模ISPの現実的なネットワーク設定とワークロードにおけるいくつかのポリシーを解析する。
我々は、強化学習に基づくスケジューリングアルゴリズムASETを設計し、システム条件に応じてその決定を適応させることができる。
論文 参考訳(メタデータ) (2023-01-31T13:23:34Z) - Low Complexity Approaches for End-to-End Latency Prediction [0.0]
我々は、エンドツーエンドのレイテンシ予測に焦点を当て、GNNにおける最近の国際的課題から得られた公開データセットに、我々のアプローチと結果を説明する。
提案手法は,最先端のグローバルGNNソリューションと比較して,比較的低い精度で予測精度を保ちながら,トレーニングと推論の両面において,壁面時間を大幅に短縮する。
論文 参考訳(メタデータ) (2023-01-31T10:31:41Z) - Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - Predictive GAN-powered Multi-Objective Optimization for Hybrid Federated
Split Learning [56.125720497163684]
無線ネットワークにおけるハイブリッド・フェデレーション・スプリット・ラーニング・フレームワークを提案する。
ラベル共有のないモデル分割のための並列計算方式を設計し,提案方式が収束速度に与える影響を理論的に解析する。
論文 参考訳(メタデータ) (2022-09-02T10:29:56Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - Computational Intelligence and Deep Learning for Next-Generation
Edge-Enabled Industrial IoT [51.68933585002123]
エッジ対応産業用IoTネットワークにおける計算知能とディープラーニング(DL)の展開方法について検討する。
本稿では,新しいマルチエグジットベースフェデレーションエッジ学習(ME-FEEL)フレームワークを提案する。
特に、提案されたME-FEELは、非常に限られたリソースを持つ産業用IoTネットワークにおいて、最大32.7%の精度を達成することができる。
論文 参考訳(メタデータ) (2021-10-28T08:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。