論文の概要: FELARE: Fair Scheduling of Machine Learning Applications on
Heterogeneous Edge Systems
- arxiv url: http://arxiv.org/abs/2206.00065v1
- Date: Tue, 31 May 2022 19:19:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-03 12:35:46.778056
- Title: FELARE: Fair Scheduling of Machine Learning Applications on
Heterogeneous Edge Systems
- Title(参考訳): FELARE: 不均一エッジシステムにおける機械学習アプリケーションの公正スケジューリング
- Authors: Ali Mokhtari, Pooyan Jamshidi, Mohsen Amini Salehi
- Abstract要約: エッジコンピューティングは、レイテンシに敏感な機械学習(ML)アプリケーションの同時実行と継続的実行を通じて、スマートIoTベースのシステムを実現する。
エネルギー制約を考慮しつつ、リアルタイムタスク完了率を向上させるリソース割当ソリューションを検討、分析する。
作業完了率の8.9%,省エネ率の12.6%はエッジシステムに大きなオーバーヘッドを伴わずに改善した。
- 参考スコア(独自算出の注目度): 5.165692107696155
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Edge computing enables smart IoT-based systems via concurrent and continuous
execution of latency-sensitive machine learning (ML) applications. These
edge-based machine learning systems are often battery-powered (i.e.,
energy-limited). They use heterogeneous resources with diverse computing
performance (e.g., CPU, GPU, and/or FPGAs) to fulfill the latency constraints
of ML applications. The challenge is to allocate user requests for different ML
applications on the Heterogeneous Edge Computing Systems (HEC) with respect to
both the energy and latency constraints of these systems. To this end, we study
and analyze resource allocation solutions that can increase the on-time task
completion rate while considering the energy constraint. Importantly, we
investigate edge-friendly (lightweight) multi-objective mapping heuristics that
do not become biased toward a particular application type to achieve the
objectives; instead, the heuristics consider "fairness" across the concurrent
ML applications in their mapping decisions. Performance evaluations demonstrate
that the proposed heuristic outperforms widely-used heuristics in heterogeneous
systems in terms of the latency and energy objectives, particularly, at low to
moderate request arrival rates. We observed 8.9% improvement in on-time task
completion rate and 12.6% in energy-saving without imposing any significant
overhead on the edge system.
- Abstract(参考訳): エッジコンピューティングは、レイテンシに敏感な機械学習(ML)アプリケーションの同時実行と継続的実行を通じて、スマートIoTベースのシステムを実現する。
これらのエッジベースの機械学習システムは、しばしばバッテリ駆動(エネルギー制限)である。
彼らはMLアプリケーションのレイテンシ制約を満たすために、様々なコンピューティング性能(CPU、GPU、FPGAなど)を持つ異種資源を使用する。
課題は、これらのシステムのエネルギとレイテンシの制約に関して、異種エッジコンピューティングシステム(Heterogeneous Edge Computing Systems:HEC)上で異なるMLアプリケーションのユーザリクエストを割り当てることである。
そこで本研究では,エネルギー制約を考慮しつつ,オンタイムのタスク完了率を増加させる資源割当ソリューションを考察し,分析する。
重要なことは、目的を達成するために特定のアプリケーションタイプに偏らないエッジフレンドリーな(軽量な)多目的マッピングヒューリスティックを調査することである。
性能評価の結果,提案するヒューリスティックは,レイテンシやエネルギー目標,特に低ないし中程度の要求到達率において,異種システムで広く使用されているヒューリスティックよりも優れていることが示された。
作業完了率の8.9%,省エネ率の12.6%はエッジシステムに大きなオーバーヘッドを伴わずに改善した。
関連論文リスト
- AdaLog: Post-Training Quantization for Vision Transformers with Adaptive Logarithm Quantizer [54.713778961605115]
Vision Transformer (ViT) はコンピュータビジョンコミュニティにおいて最も普及しているバックボーンネットワークの1つである。
本稿では,AdaLog(Adaptive Logarithm AdaLog)量子化器を提案する。
論文 参考訳(メタデータ) (2024-07-17T18:38:48Z) - Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - ORIENT: A Priority-Aware Energy-Efficient Approach for Latency-Sensitive
Applications in 6G [15.753216159980434]
コンピューティングとネットワークにおけるエネルギー消費の増加に関する懸念が高まっている。
接続デバイスとリソース需要アプリケーションの増加は、エネルギー資源に対する前例のない課題を呈している。
PIRAと呼ばれるサービスインスタンス配置・割り当て・経路選択・要求優先順位付けの連立問題について検討する。
論文 参考訳(メタデータ) (2024-02-10T12:05:52Z) - Age-Based Scheduling for Mobile Edge Computing: A Deep Reinforcement
Learning Approach [58.911515417156174]
我々は情報時代(AoI)の新たな定義を提案し、再定義されたAoIに基づいて、MECシステムにおけるオンラインAoI問題を定式化する。
本稿では,システム力学の部分的知識を活用するために,PDS(Post-Decision State)を導入する。
また、PSDと深いRLを組み合わせることで、アルゴリズムの適用性、スケーラビリティ、堅牢性をさらに向上します。
論文 参考訳(メタデータ) (2023-12-01T01:30:49Z) - Task Graph offloading via Deep Reinforcement Learning in Mobile Edge Computing [6.872434270841794]
本稿では,エッジコンピューティングデバイスの時間変化を考慮したMECにおけるタスクグラフのオフロードについて検討する。
環境変化に対応するために,計算オフロードのためのタスクグラフスケジューリングをマルコフ決定プロセスとしてモデル化する。
そこで我々は,環境とのインタラクションからタスクスケジューリング戦略を学習するために,深層強化学習アルゴリズム(SATA-DRL)を設計する。
論文 参考訳(メタデータ) (2023-09-19T12:26:56Z) - An Energy-Aware Approach to Design Self-Adaptive AI-based Applications
on the Edge [42.462246527457594]
我々は、自己適応型AIベースのアプリケーションの設計と展開にエネルギーを意識したアプローチを提案する。
本稿では,メタヒューリスティックな探索手順でシステムに自己適応できる構成の集合を決定する問題に対処する。
その結果、我々の自己適応型アプリケーションは、最大81%のエネルギーを節約し、2%から6%の精度で、非適応型ベースライン構成を上回ります。
論文 参考訳(メタデータ) (2023-08-31T09:33:44Z) - Multi-objective Deep Reinforcement Learning for Mobile Edge Computing [11.966938107719903]
モバイルエッジコンピューティング(MEC)は、遅延やエネルギー消費など、さまざまなパフォーマンス指標を優先する次世代のモバイルネットワークアプリケーションに不可欠である。
本研究では,複数のエッジを持つMECにおいて,長期エネルギー消費と送信遅延を最小限に抑えるために,多目的オフロード問題を定式化する。
我々は,MECシステムにおいて,複数のエッジの機能を構築するためのよく設計された状態符号化手法を導入し,遅延とエネルギー消費のユーティリティを正確に計算する洗練された報酬関数を提案する。
論文 参考訳(メタデータ) (2023-07-05T16:36:42Z) - Dynamic Scheduling for Federated Edge Learning with Streaming Data [56.91063444859008]
我々は,長期的エネルギー制約のある分散エッジデバイスにおいて,トレーニングデータを時間とともにランダムに生成するフェデレーションエッジ学習(FEEL)システムを検討する。
限られた通信リソースとレイテンシ要件のため、各イテレーションでローカルトレーニングプロセスに参加するのはデバイスのサブセットのみである。
論文 参考訳(メタデータ) (2023-05-02T07:41:16Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - MCDS: AI Augmented Workflow Scheduling in Mobile Edge Cloud Computing
Systems [12.215537834860699]
近年,エッジコンピューティングプラットフォームの低応答時間を利用してアプリケーション品質・オブ・サービス(QoS)を最適化するスケジューリング手法が提案されている。
本稿では,Deep Surrogate Models を用いたモンテカルロ学習を用いて,モバイルエッジクラウドコンピューティングシステムにおけるワークフローアプリケーションを効率的にスケジューリングする手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T10:00:01Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。