論文の概要: Interference-Aware Edge Runtime Prediction with Conformal Matrix Completion
- arxiv url: http://arxiv.org/abs/2503.06428v1
- Date: Sun, 09 Mar 2025 03:41:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:46:50.094142
- Title: Interference-Aware Edge Runtime Prediction with Conformal Matrix Completion
- Title(参考訳): Conformal Matrix Completion を用いた干渉対応エッジ実行予測
- Authors: Tianshu Huang, Arjun Ramesh, Emily Ruppel, Nuno Pereira, Anthony Rowe, Carlee Joe-Wong,
- Abstract要約: 正確なワークロードランタイムの推定は、コンピュータシステムにおける長年の目標である。
本研究では,厳密な保証付き不確実性境界を持つ干渉認識予測を高精度に生成する行列分解法を開発した。
当社のメソッドは、24のユニークなデバイスから収集された新しいWebAssemblyランタイムデータセット上で検証され、予測エラーが5.2% -- 2倍向上した。
- 参考スコア(独自算出の注目度): 10.776912158818437
- License:
- Abstract: Accurately estimating workload runtime is a longstanding goal in computer systems, and plays a key role in efficient resource provisioning, latency minimization, and various other system management tasks. Runtime prediction is particularly important for managing increasingly complex distributed systems in which more sophisticated processing is pushed to the edge in search of better latency. Previous approaches for runtime prediction in edge systems suffer from poor data efficiency or require intensive instrumentation; these challenges are compounded in heterogeneous edge computing environments, where historical runtime data may be sparsely available and instrumentation is often challenging. Moreover, edge computing environments often feature multi-tenancy due to limited resources at the network edge, potentially leading to interference between workloads and further complicating the runtime prediction problem. Drawing from insights across machine learning and computer systems, we design a matrix factorization-inspired method that generates accurate interference-aware predictions with tight provably-guaranteed uncertainty bounds. We validate our method on a novel WebAssembly runtime dataset collected from 24 unique devices, achieving a prediction error of 5.2% -- 2x better than a naive application of existing methods.
- Abstract(参考訳): ワークロードランタイムの正確な推定は、コンピュータシステムにおける長年の目標であり、効率的なリソースプロビジョニング、レイテンシの最小化、その他の様々なシステム管理タスクにおいて重要な役割を果たす。
実行時の予測は、より複雑な分散システムを管理する上で特に重要である。
エッジシステムにおける実行時の予測には、データ効率の低下や集中的な計測が必要であった。これらの課題は、過去の実行時データがわずかに利用可能であり、機器化がしばしば困難である異種エッジコンピューティング環境において、複合化されている。
さらに、エッジコンピューティング環境は、ネットワークエッジのリソースが限られており、ワークロード間の干渉や実行時の予測問題をさらに複雑にする可能性があるため、マルチテナンシを特徴とすることが多い。
機械学習とコンピュータシステムに関する洞察から、我々は、厳密な証明可能な保証された不確実性境界を持つ正確な干渉認識予測を生成する行列分解に着想を得た手法を設計する。
当社のメソッドは、24のユニークなデバイスから収集された新しいWebAssemblyランタイムデータセット上で検証され、予測エラーが5.2% -- 2倍向上した。
関連論文リスト
- Communication Efficient Cooperative Edge AI via Event-Triggered Computation Offloading [34.18100643343979]
本稿では,効率的なレアイベント処理を優先する,チャネルトリガーによるイベントトリガーエッジ推論フレームワークを提案する。
提案手法は,従来のエッジ推論手法とは対照的に,より優れたレアイベント分類精度を実現し,通信オーバーヘッドを効果的に低減する。
論文 参考訳(メタデータ) (2025-01-01T15:55:59Z) - Loss Shaping Constraints for Long-Term Time Series Forecasting [79.3533114027664]
本稿では,長期時系列予測のための制約付き学習手法を提案する。
提案手法は, 予測ウィンドウ上でエラーを発生させながら, 時系列ベンチマークにおける競合平均性能を示すことを示すための, 実用的なプリマル・デュアルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-14T18:20:44Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Networked Online Learning for Control of Safety-Critical
Resource-Constrained Systems based on Gaussian Processes [9.544146562919792]
本稿では,ガウス過程の回帰に基づく新しいネットワーク型オンライン学習手法を提案する。
本稿では,送信チャネルの帯域制限と時間遅延を考慮した,ローカルシステムとクラウド間の効率的なデータ伝送方式を提案する。
論文 参考訳(メタデータ) (2022-02-23T13:12:12Z) - Real-Time GPU-Accelerated Machine Learning Based Multiuser Detection for
5G and Beyond [70.81551587109833]
非線形ビームフォーミングフィルタは、大規模な接続を伴う定常シナリオにおいて、線形アプローチを著しく上回る。
主な課題の1つは、これらのアルゴリズムのリアルタイム実装である。
本稿では,大規模並列化によるAPSMに基づくアルゴリズムの高速化について検討する。
論文 参考訳(メタデータ) (2022-01-13T15:20:45Z) - On Efficient Uncertainty Estimation for Resource-Constrained Mobile
Applications [0.0]
予測の不確実性は、モデル予測を補完し、下流タスクの機能を改善します。
Axolotlフレームワークを用いてモンテカルロ・ドロップアウト(MCDO)モデルを構築することでこの問題に対処する。
我々は,(1)CIFAR10データセットを用いた多クラス分類タスク,(2)より複雑な人体セグメンテーションタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-11-11T22:24:15Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Dynamic Compression Ratio Selection for Edge Inference Systems with Hard
Deadlines [9.585931043664363]
本稿では,ハード期限付きエッジ推論システムの動的圧縮比選択手法を提案する。
誤り推論により少ない圧縮データを再送信する情報拡張を提案し,精度向上を図る。
無線伝送エラーを考慮し、パケット損失による性能劣化を低減する再送信方式を更に設計する。
論文 参考訳(メタデータ) (2020-05-25T17:11:53Z) - Fast-Fourier-Forecasting Resource Utilisation in Distributed Systems [10.219353459640137]
本稿では,分散コンピューティングシステムのための通信効率の高いデータ収集機構を提案する。
また,複雑なGated Recurrent Unitを用いて資源利用予測を行うディープラーニングアーキテクチャを提案する。
提案手法は,資源供給フレームワークで発生する課題を解決し,他の予測問題にも適用できる。
論文 参考訳(メタデータ) (2020-01-13T14:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。