論文の概要: AdaptiveNet: Post-deployment Neural Architecture Adaptation for Diverse
Edge Environments
- arxiv url: http://arxiv.org/abs/2303.07129v1
- Date: Mon, 13 Mar 2023 13:59:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 14:41:35.702920
- Title: AdaptiveNet: Post-deployment Neural Architecture Adaptation for Diverse
Edge Environments
- Title(参考訳): AdaptiveNet: 分散エッジ環境のためのポストデプロイニューラルネットワーク適応
- Authors: Hao Wen, Yuanchun Li, Zunshuai Zhang, Shiqi Jiang, Xiaozhou Ye, Ye
Ouyang, Ya-Qin Zhang, Yunxin Liu
- Abstract要約: 本稿では,事前学習支援型オンクラウドモデルエラスティフィケーション手法とエッジフレンドリーなオンデバイスアーキテクチャ探索手法を提案する。
様々なエッジデバイスの実験により、我々のアプローチは精度とレイテンシのトレードオフを大幅に改善できることを示した。
- 参考スコア(独自算出の注目度): 12.882110536398121
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models are increasingly deployed to edge devices for real-time
applications. To ensure stable service quality across diverse edge
environments, it is highly desirable to generate tailored model architectures
for different conditions. However, conventional pre-deployment model generation
approaches are not satisfactory due to the difficulty of handling the diversity
of edge environments and the demand for edge information. In this paper, we
propose to adapt the model architecture after deployment in the target
environment, where the model quality can be precisely measured and private edge
data can be retained. To achieve efficient and effective edge model generation,
we introduce a pretraining-assisted on-cloud model elastification method and an
edge-friendly on-device architecture search method. Model elastification
generates a high-quality search space of model architectures with the guidance
of a developer-specified oracle model. Each subnet in the space is a valid
model with different environment affinity, and each device efficiently finds
and maintains the most suitable subnet based on a series of edge-tailored
optimizations. Extensive experiments on various edge devices demonstrate that
our approach is able to achieve significantly better accuracy-latency tradeoffs
(e.g. 46.74\% higher on average accuracy with a 60\% latency budget) than
strong baselines with minimal overhead (13 GPU hours in the cloud and 2 minutes
on the edge server).
- Abstract(参考訳): ディープラーニングモデルは、リアルタイムアプリケーションのためのエッジデバイスにますますデプロイされる。
多様なエッジ環境にまたがって安定したサービス品質を確保するためには、異なる条件下で適切なモデルアーキテクチャを生成することが望ましい。
しかし,エッジ環境の多様性やエッジ情報要求の処理が困難であるため,従来のデプロイ前モデル生成手法では満足できない。
本稿では,モデル品質を正確に測定し,プライベートエッジデータを保持可能なターゲット環境に配置した後に,モデルアーキテクチャを適用することを提案する。
効率的なエッジモデル生成を実現するために,事前学習型オンクラウドモデルエラスティフィケーション法とエッジフレンドリーなオンデバイスアーキテクチャ探索法を導入する。
モデルエラスタフィケーションは、開発者が特定したoracleモデルのガイダンスに従って、モデルアーキテクチャの高品質な検索空間を生成する。
空間内の各サブネットは、異なる環境親和性を持つ有効なモデルであり、各デバイスは、一連のエッジ調整最適化に基づいて、最も適切なサブネットを効率的に見つけて維持する。
様々なエッジデバイスでの広範囲な実験により、我々のアプローチは、最小のオーバーヘッド(クラウドで13gpu時間、エッジサーバーで2分)を持つ強力なベースラインよりも、精度とレイテンシのトレードオフ(平均精度で46.74\%、レイテンシー予算で60\%)が大幅に向上できることが示されました。
関連論文リスト
- Adaptable Embeddings Network (AEN) [49.1574468325115]
我々はカーネル密度推定(KDE)を用いた新しいデュアルエンコーダアーキテクチャであるAdaptable Embeddings Networks (AEN)を紹介する。
AENは、再トレーニングせずに分類基準のランタイム適応を可能にし、非自己回帰的である。
アーキテクチャのプリプロセスとキャッシュ条件の埋め込み能力は、エッジコンピューティングアプリケーションやリアルタイム監視システムに最適である。
論文 参考訳(メタデータ) (2024-11-21T02:15:52Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Dual-Model Distillation for Efficient Action Classification with Hybrid Edge-Cloud Solution [1.8029479474051309]
我々は、より大規模で正確なクラウドベースモデルに必要に応じて遅延しながら、より小さなモデルのローカル処理効率を活用するハイブリッドエッジクラウドソリューションを設計する。
具体的には、エッジモデルの出力が不確かである場合に予測可能な軽量スイッチャーモデルをトレーニングするための、新しい教師なしデータ生成手法であるDual-Model Distillation(DMD)を提案する。
動作分類タスクの実験結果から,我々のフレームワークは計算オーバーヘッドを少なくするだけでなく,大規模モデルのみを使用する場合と比較して精度も向上することが示された。
論文 参考訳(メタデータ) (2024-10-16T02:06:27Z) - Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient [52.2669490431145]
PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
論文 参考訳(メタデータ) (2024-05-28T11:30:19Z) - Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation [56.79064699832383]
Cloud-Edge Elastic Model Adaptation (CEMA)パラダイムを確立し、エッジモデルが前方伝播のみを実行するようにします。
CEMAでは,通信負担を軽減するため,不要なサンプルをクラウドにアップロードすることを避けるための2つの基準を考案した。
論文 参考訳(メタデータ) (2024-02-27T08:47:19Z) - Slimmable Domain Adaptation [112.19652651687402]
重み付けモデルバンクを用いて、ドメイン間の一般化を改善するためのシンプルなフレームワーク、Slimmable Domain Adaptationを導入する。
私たちのフレームワークは、他の競合するアプローチを、複数のベンチマークにおいて非常に大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-06-14T06:28:04Z) - Data Summarization via Bilevel Optimization [48.89977988203108]
シンプルだが強力なアプローチは、小さなサブセットのデータを操作することだ。
本研究では,コアセット選択を基数制約付き双レベル最適化問題として定式化する汎用コアセットフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T09:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。