論文の概要: Adaptive DNN Partitioning and Offloading in Heterogeneous Edge-Cloud Continuum
- arxiv url: http://arxiv.org/abs/2605.09623v1
- Date: Sun, 10 May 2026 16:09:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.339028
- Title: Adaptive DNN Partitioning and Offloading in Heterogeneous Edge-Cloud Continuum
- Title(参考訳): 不均一エッジクラウド連続体における適応DNN分割とオフロード
- Authors: Akuen Akoi Deng, Eimantas Butkus, Alfreds Lapkovskis, Praveen Kumar Donta,
- Abstract要約: ニューラルネットワーク層を異種連続体に動的に分割するフレームワークを提案する。
広く採用されている3つの畳み込みニューラルネットワーク(VGG16、AlexNet、MobileNetV2)上で、このフレームワークを評価する。
その結果、このフレームワークは、それぞれ27.09-35.82%と6.34-22.92%のエネルギーとエンドツーエンドのレイテンシの低減を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the use of artificial intelligence on resource-constrained IoT devices has grown significantly. However, existing approaches to DNN partitioning and offloading across the edge-cloud continuum typically rely on static methods that ignore runtime dynamics. Furthermore, they are often evaluated in simulated environments rather than on real hardware. To address this gap, we propose a framework that dynamically splits neural network layers across the heterogeneous continuum. The framework profiles the model at startup, measures network link conditions between nodes, and periodically re-evaluates the partition to adapt to environmental changes. We created a physical testbed comprising a Raspberry Pi edge device, a laptop fog, and a high-performance desktop PC as the cloud. We evaluated the framework over three widely adopted convolutional neural networks: VGG16, AlexNet, and MobileNetV2. Our results show that the framework achieves reductions in energy and end-to-end latency of 27.09--35.82% and 6.34--22.92%, respectively, compared to a static partitioning baseline. These findings confirm the superiority of adaptive to static partitioning.
- Abstract(参考訳): 近年,資源制約型IoTデバイスにおける人工知能の利用は著しく増加している。
しかしながら、DNNのパーティショニングとエッジクラウド連続体へのオフロードに対する既存のアプローチは、通常、ランタイムのダイナミクスを無視する静的メソッドに依存している。
さらに、実際のハードウェアではなく、シミュレーション環境で評価されることも多い。
このギャップに対処するために、ニューラルネットワーク層を異種連続体に動的に分割するフレームワークを提案する。
フレームワークは起動時にモデルをプロファイルし、ノード間のネットワークリンク条件を測定し、パーティションを定期的に再評価し、環境の変化に対応する。
Raspberry Piのエッジデバイス、ラップトップの霧、高性能デスクトップPCをクラウドとして構成した物理的テストベッドを作成しました。
我々は,広く採用されている3つの畳み込みニューラルネットワーク(VGG16,AlexNet,MobileNetV2)上で,このフレームワークを評価した。
その結果, 静的パーティショニングベースラインと比較して, 27.09-35.82% と 6.34-22.92% の遅延時間削減を実現していることがわかった。
以上の結果から,静的パーティショニングへの適応性が示唆された。
関連論文リスト
- Robust Cross-Domain WiFi Fall Detection via Physics-Driven Attention-Enhanced Transformers [64.35403680946182]
WiFiチャンネル状態情報(CSI)を利用したデバイスフリーの転倒検出が,高齢者の健康モニタリングのための有望なソリューションとして浮上している。
既存のディープラーニングアプローチでは、目に見えない環境にデプロイされた場合、パフォーマンスが大幅に低下する。
本稿では,新しいCNN-Transformerハイブリッドアーキテクチャを特徴とする,堅牢で汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-23T03:28:12Z) - DynaSplit: A Hardware-Software Co-Design Framework for Energy-Aware Inference on Edge [40.96858640950632]
ソフトウェアとハードウェアの両方でパラメータを動的に設定するフレームワークであるDynaSplitを提案する。
実世界のテストベッド上で、人気のあるトレーニング済みNNを用いてDynaSplitを評価する。
その結果,クラウドのみの計算に比べてエネルギー消費が最大で72%減少した。
論文 参考訳(メタデータ) (2024-10-31T12:44:07Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Unified Static and Dynamic Network: Efficient Temporal Filtering for Video Grounding [56.315932539150324]
ビデオとテキスト/オーディオクエリ間の意味的関連を学習するために,Unified Static and Dynamic Network (UniSDNet) を設計する。
我々のUniSDNetは、NLVG(Natural Language Video Grounding)タスクとSLVG(Spoke Language Video Grounding)タスクの両方に適用できます。
論文 参考訳(メタデータ) (2024-03-21T06:53:40Z) - Dynamic Split Computing for Efficient Deep Edge Intelligence [78.4233915447056]
通信チャネルの状態に基づいて最適な分割位置を動的に選択する動的分割計算を導入する。
本研究では,データレートとサーバ負荷が時間とともに変化するエッジコンピューティング環境において,動的スプリットコンピューティングが高速な推論を実現することを示す。
論文 参考訳(メタデータ) (2022-05-23T12:35:18Z) - DS-Net++: Dynamic Weight Slicing for Efficient Inference in CNNs and
Transformers [105.74546828182834]
本稿では,様々な難易度を持つ入力に対して,ネットワークパラメータの一部を適応的にスライスする動的ウェイトスライシングという,ハードウェア効率のよい動的推論方式を示す。
我々は、CNNのフィルタ数とCNNと変換器の多重次元を入力依存的に調整することで、動的スライム可能なネットワーク(DS-Net)と動的スライス可能なネットワーク(DS-Net++)を提案する。
論文 参考訳(メタデータ) (2021-09-21T09:57:21Z) - Incremental Training and Group Convolution Pruning for Runtime DNN
Performance Scaling on Heterogeneous Embedded Platforms [23.00896228073755]
Deep Neural Networksの推論は、モバイルおよび組み込みプラットフォームでローカルに実行されるようになっている。
本稿では,インクリメンタルトレーニングとグループ畳み込みプルーニングを用いた動的DNNを提案する。
タスクマッピングとDVFSを組み合わせて10.6倍(エネルギー)と41.6倍(時間)のダイナミックレンジを達成した。
論文 参考訳(メタデータ) (2021-05-08T05:38:01Z) - Dynamic DNN Decomposition for Lossless Synergistic Inference [0.9549013615433989]
ディープニューラルネットワーク(DNN)は、今日のデータ処理アプリケーションで高性能を維持します。
精度損失のない相乗的推論のための動的DNN分解システムD3を提案する。
d3は最先端のdnn推論時間を最大3.4倍に上回り、バックボーンネットワーク通信のオーバーヘッドを3.68倍に削減する。
論文 参考訳(メタデータ) (2021-01-15T03:18:53Z) - Dynamic Scheduling for Stochastic Edge-Cloud Computing Environments
using A3C learning and Residual Recurrent Neural Networks [30.61220416710614]
A-Advantage-Actor-Critic(A3C)学習は、データが少ない動的なシナリオに迅速に適応することが知られ、Residual Recurrent Neural Network(R2N2)はモデルパラメータを迅速に更新する。
我々はR2N2アーキテクチャを用いて、多数のホストパラメータとタスクパラメータを時間パターンとともにキャプチャし、効率的なスケジューリング決定を提供する。
実世界のデータセットで実施された実験では、エネルギー消費、応答時間、ServiceLevelAgreementおよびランニングコストがそれぞれ14.4%、7.74%、31.9%、および4.64%で大幅に改善された。
論文 参考訳(メタデータ) (2020-09-01T13:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。