論文の概要: Hierarchical adaptive control for real-time dynamic inference at the edge
- arxiv url: http://arxiv.org/abs/2604.26470v1
- Date: Wed, 29 Apr 2026 09:28:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.333615
- Title: Hierarchical adaptive control for real-time dynamic inference at the edge
- Title(参考訳): エッジにおけるリアルタイム動的推論のための階層型適応制御
- Authors: Francesco Daghero, Mahyar Tourchi Moghaddam, Mikkel Baun Kjærgaard,
- Abstract要約: 産業システムは機械学習(ML)にますます依存している
モデルとシステム決定を協調的に最適化する2層適応アーキテクチャを提案する。
遅延時間の平均は2.45倍、エネルギーは2.86倍まで減少し、静的ベースラインに比べて4%未満の精度で低下した。
- 参考スコア(独自算出の注目度): 1.018651537140377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial systems increasingly depend on Machine Learning (ML), and operate on heterogeneous nodes that must satisfy tight latency, energy, and memory constraints. Dynamic ML models, which reconfigure their computational footprint at runtime, promise high energy efficiency and lower average latency for modest accuracy tradeoffs; however, their deployment is complex due to the additional hyperparameters they rely on. These hyperparameters, controlling the accuracy versus average latency tradeoff, are often tuned on a calibration dataset that must match the test time distribution, an assumption that rarely holds in real-world scenarios, leading to suboptimal operational conditions, possibly below static models. We propose a two-tier adaptive architecture that co-optimizes model and system decisions. At the global level, a scheduler configures and deploys, for each edge node, a cascade of classifiers composed of lightweight specialized models and a generalist fallback, satisfying latency and memory constraints. At the node level, a local controller tracks data drifts and hardware resources, enabling or disabling specialized predictors (SP) to preserve high energy efficiency and avoid latency-constraint violations under varying conditions. This design allows longer operating times without forcing a global redeployment step, and enables efficient execution in case of an unreachable remote global controller. We evaluate the approach on two datasets under controlled distribution mismatch scenarios, showing average per-inference reductions of latency up to 2.45x and energy up to 2.86x, with less than 4% accuracy drop compared to static baselines. Our contributions are:(1) a budgeted SP-cascade formulation that preserves worst-case latency constraints;(2) a hierarchical controller that maintains efficiency under data and resource changes; and (3) an experimental evaluation on embedded hardware.
- Abstract(参考訳): 産業システムは機械学習(ML)にますます依存し、厳密なレイテンシ、エネルギ、メモリ制約を満たすヘテロジニアスなノードで運用される。
実行時に計算フットプリントを再構成する動的MLモデルは、高エネルギー効率と低平均遅延を適度な精度トレードオフで保証するが、それらが依存する追加のハイパーパラメータのため、デプロイは複雑である。
これらのハイパーパラメータは、平均遅延トレードオフの精度を制御し、テスト時間分布にマッチしなければならないキャリブレーションデータセットで調整されることが多い。
モデルとシステム決定を協調的に最適化する2層適応アーキテクチャを提案する。
グローバルレベルでは、スケジューラが各エッジノードに対して、軽量な特殊モデルと一般的なフォールバックで構成される分類器のカスケードを設定し、デプロイし、レイテンシとメモリ制約を満たす。
ノードレベルでは、ローカルコントローラがデータドリフトとハードウェアリソースを追跡し、特別な予測器(SP)を無効にすることで、高いエネルギー効率を維持し、様々な条件下での遅延制約違反を回避する。
この設計により、グローバル再デプロイステップを強制せずに長時間の運用が可能となり、到達不能なリモートグローバルコントローラの場合の効率的な実行が可能となる。
制御された分散ミスマッチシナリオ下での2つのデータセットに対するアプローチを評価し,静的ベースラインと比較して平均2.45倍,エネルギー2.86倍の遅延時間と4%未満の精度低下を示す。
コントリビューションは,(1)最悪ケースの遅延制約を保存するSPカスケード形式,(2)データおよびリソース変更時の効率を維持する階層型コントローラ,(3)組込みハードウェアに関する実験的評価である。
関連論文リスト
- DexWorldModel: Causal Latent World Modeling towards Automated Learning of Embodied Tasks [54.32016216994156]
本稿では,DINOv3特徴を生成対象として用い,視覚ノイズから相互作用意味を乱す因果潜在世界モデル(CLWM)を提案する。
メモリスケーリングを克服するため、CLWMはDual-State Test-Time Training (TTT)メモリを備えている。
EmbodiChainは、トレーニング中に物理基底軌道の無限の流れを注入することによって効率法を確立するオンラインフレームワークである。
論文 参考訳(メタデータ) (2026-04-13T03:19:36Z) - TS-DP: Reinforcement Speculative Decoding For Temporal Adaptive Diffusion Policy Acceleration [64.32072516882947]
拡散ポリシーは、具体的制御が優れているが、高い推論遅延と計算コストに悩まされている。
時間認識強化に基づく投機的拡散政策(TS-DP)を提案する。
TS-DPは94%以上のドラフトで最大4.17倍高速な推論を実現し、推論周波数は25Hzに達した。
論文 参考訳(メタデータ) (2025-12-13T07:53:14Z) - Slim Scheduler: A Runtime-Aware RL and Scheduler System for Efficient CNN Inference [0.0]
Slim Schedulerは、PPO(Proximal Policy Optimization)強化学習ポリシーとアルゴリズム的、欲求的なスケジューラを統合し、スクリム可能なモデルに対する分散推論を調整する。
この階層的な設計は、検索空間の複雑さを減らし、特定のハードウェアへの過度な適合を緩和し、効率とスループットのバランスをとる。
論文 参考訳(メタデータ) (2025-10-10T05:44:05Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - Optimal Batch-Size Control for Low-Latency Federated Learning with Device Heterogeneity [30.53961003855146]
フェデレートラーニング(FL)は、第6世代(6G)ネットワークにおける協調機械学習の一般的なアプローチとして登場した。
FLアルゴリズムの展開は、自律運転、拡張現実、ヘルスケアなど、幅広いIoT(Internet-of-Things)アプリケーションを強化することが期待されている。
本稿では,収束性を確保しつつ,エンドツーエンド(E2E)学習遅延を最小限に抑える,バッチサイズ最適制御のための新しいC$2のフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-21T13:24:38Z) - Adaptive Deadline and Batch Layered Synchronized Federated Learning [66.93447103966439]
フェデレートラーニング(FL)は、データプライバシを保持しながら、分散エッジデバイス間で協調的なモデルトレーニングを可能にする。
我々は,レイヤワイドアグリゲーションのために,ラウンド単位の期限とユーザ固有のバッチサイズを共同で最適化する新しいフレームワークADEL-FLを提案する。
論文 参考訳(メタデータ) (2025-05-29T19:59:18Z) - Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models [3.5161229331588095]
高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。
完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。
非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
論文 参考訳(メタデータ) (2024-12-13T08:04:21Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。