論文の概要: CANS: Accelerating Multiuser Collaborative Edge Inference via Cooperative Autodidactic NeuroSurgeon
- arxiv url: http://arxiv.org/abs/2606.09175v1
- Date: Mon, 08 Jun 2026 08:14:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.824036
- Title: CANS: Accelerating Multiuser Collaborative Edge Inference via Cooperative Autodidactic NeuroSurgeon
- Title(参考訳): CANS:Cooperative Autodidactic NeuroSurgeonによる複数ユーザ協調エッジ推論の高速化
- Authors: Zheshun Wu, Ziyang Zhang, Changyao Lin, Zenglin Xu, Jie Liu,
- Abstract要約: モバイルエッジコンピューティング(MEC)による協調型ディープニューラルネットワーク(DNN)推論は、リソース制約のあるモバイルデバイスにインテリジェントなサービスを提供するための有望なアプローチとして登場した。
我々は、協調的エッジ推論フレームワークであるCooperative Autodidactic NeuroSurgeon (CANS)を提案し、オンライン推論中に情報的フィードバックを共有することで、デバイスが最適なDNNパーティションを適応的に学習できるようにする。
特に2つのエッジデバイスにおける試作実験において,提案したCANSは,非協調的ベースラインと比較して,平均推論遅延を最大50%削減した。
- 参考スコア(独自算出の注目度): 46.896701137872604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, mobile edge computing (MEC)-enabled collaborative deep neural network (DNN) inference has emerged as a promising approach for delivering intelligent services to resource-constrained mobile devices. A representative scenario is multi-user collaborative edge inference, where distinct devices independently partition their DNN models and offload backend computation to a common edge server over wireless networks. However, determining the optimal DNN partition for each device is challenging due to unknown and time-varying system conditions, including fluctuating wireless links and diverse device capabilities. To address this problem, we propose Cooperative Autodidactic NeuroSurgeon (CANS), a collaborative edge inference framework that enables devices to adaptively learn optimal DNN partitions by sharing informative feedback during online inference. To handle the challenge of device heterogeneity and better leverage offline inference experience, we integrate a novel FedLinUCB-DW algorithm that groups devices of the same type and warm-starts online exploration using local offline early-exit inference experience. Furthermore, we provide theoretical guarantees for FedLinUCB-DW by deriving the regret upper bound. We also validate our method on both a simulated environment and a hardware prototype system. Empirical evaluations demonstrate that CANS achieves lower inference latency compared to state-of-the-art baselines. Especially, in prototype experiments on two edge devices, the proposed CANS reduced average inference latency by up to 50% compared to the non-cooperative baseline.
- Abstract(参考訳): 近年,リソース制約のあるモバイルデバイスにインテリジェントなサービスを提供するための,モバイルエッジコンピューティング(MEC)による協調型ディープニューラルネットワーク(DNN)推論が,有望なアプローチとして浮上している。
代表的なシナリオは、DNNモデルを独立して分割し、バックエンドの計算を無線ネットワーク上の共通のエッジサーバにオフロードする、マルチユーザ共同エッジ推論である。
しかし、無線リンクのゆらぎや多様なデバイス機能など、未知かつ時間的に変化するシステム条件のため、各デバイスに対して最適なDNNパーティションを決定することは困難である。
この問題を解決するために,協調型自律神経外科医(CANS)を提案する。これは協調型エッジ推論フレームワークで,オンライン推論中に情報的フィードバックを共有することで,デバイスが最適なDNNパーティションを適応的に学習することを可能にする。
デバイスの不均一性の課題に対処し、オフラインの推論エクスペリエンスをより活用するために、同じタイプのデバイスをグループ化し、ローカルのオフライン早期実行推論エクスペリエンスを使用して、オンライン探索をウォームスタートする新しいFedLinUCB-DWアルゴリズムを統合する。
さらに,FedLinUCB-DWに対する理論的保証として,後悔の上限を導出する。
また,本手法をシミュレーション環境とハードウェアプロトタイプシステムの両方で検証する。
実証的な評価では、CANSは最先端のベースラインに比べて推論レイテンシが低いことが示されている。
特に,2つのエッジデバイスにおける試作実験において,提案したCANSは,非協調的ベースラインと比較して平均推論遅延を最大50%削減した。
関連論文リスト
- Joint Optimization of Model Partitioning and Resource Allocation for Anti-Jamming Collaborative Inference Systems [52.842088497389746]
この手紙は、悪意のあるジャマーの存在下での、アンチジャミングの協調推論システムに焦点を当てている。
まず、ジャミングとDNNパーティショニングがデータ回帰による推測精度に与える影響を解析する。
問題を3つのサブプロブレムに分解する,効率的な交互最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2026-03-03T03:52:52Z) - Intra-DP: A High Performance Collaborative Inference System for Mobile Edge Computing [67.98609858326951]
Intra-DPはモバイルデバイス上でのディープニューラルネットワーク(DNN)に最適化された高性能な協調推論システムである。
推論毎のレイテンシを最大50%削減し、最先端のベースラインと比較してエネルギー消費量を最大75%削減する。
評価の結果,DP内の遅延は,最先端のベースラインと比較して最大50%,エネルギー消費は最大75%減少することがわかった。
論文 参考訳(メタデータ) (2025-07-08T09:50:57Z) - Adaptive DNN Surgery for Selfish Inference Acceleration with On-demand
Edge Resource [25.274288063300844]
ディープニューラルネットワーク(DNN)は、モバイルデバイス上のインテリジェントアプリケーションの精度を大幅に改善した。
DNN手術は、モバイルデバイスの計算能力に制限があるにもかかわらず、リアルタイムの推論を可能にする。
本稿では,分散DNN手術(Decentralized DNN Surgery, DDS)フレームワークについて紹介する。
論文 参考訳(メタデータ) (2023-06-21T11:32:28Z) - Design and Prototyping Distributed CNN Inference Acceleration in Edge
Computing [85.74517957717363]
HALPはエッジコンピューティングにおけるエッジデバイス(ED)間のシームレスなコラボレーションを設計することで推論を加速する。
実験により、分散推論HALPはVGG-16に対して1.7倍の推論加速を達成することが示された。
分散推論HALPを用いたモデル選択は,サービスの信頼性を著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-24T19:48:30Z) - Decentralized Low-Latency Collaborative Inference via Ensembles on the
Edge [28.61344039233783]
本稿では,複数のユーザが推論中に協力して精度を向上させることで,エッジ上でのディープニューラルネットワーク(DNN)の適用を容易にすることを提案する。
私たちのメカニズムは、エッジアンサンブル(em edge ensembles)と呼ばれ、各デバイスに様々な予測子を持ち、推論中にモデルのアンサンブルを形成する。
エッジアンサンブルによって引き起こされる遅延を分析し、その性能改善は、通信ネットワーク上の一般的な前提の下で、わずかな追加遅延のコストで生じることを示す。
論文 参考訳(メタデータ) (2022-06-07T10:24:20Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Autodidactic Neurosurgeon: Collaborative Deep Inference for Mobile Edge
Intelligence via Online Learning [19.013102763434794]
本稿では,資源制約のあるモバイルデバイスと強力なエッジサーバとの間に協調的な深層推論システムを構築する。
我々のシステムには、Autodidactic Neurosurgeon (ANS)と呼ばれるオンライン学習モジュールが組み込まれており、最適な分割点を自動的に学習する。
ANSは、トラッキングシステムの変更とエンドツーエンドの推論遅延の低減の観点から、最先端のベンチマークを著しく上回る。
論文 参考訳(メタデータ) (2021-02-02T18:50:06Z) - Deep Multi-Task Learning for Cooperative NOMA: System Design and
Principles [52.79089414630366]
我々は,近年のディープラーニング(DL)の進歩を反映した,新しいディープ・コラボレーティブなNOMAスキームを開発する。
我々は,システム全体を包括的に最適化できるように,新しいハイブリッドカスケードディープニューラルネットワーク(DNN)アーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-07-27T12:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。