論文の概要: BanditWare: A Contextual Bandit-based Framework for Hardware Prediction
- arxiv url: http://arxiv.org/abs/2506.13730v1
- Date: Mon, 16 Jun 2025 17:40:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:49.189639
- Title: BanditWare: A Contextual Bandit-based Framework for Hardware Prediction
- Title(参考訳): BanditWare: ハードウェア予測のためのコンテキストバンドベースのフレームワーク
- Authors: Tainã Coleman, Hena Ahmed, Ravi Shende, Ismael Perez, Ïlkay Altintaş,
- Abstract要約: BanditWareは、アプリケーションに適したハードウェアを動的に選択するオンラインレコメンデーションシステムである。
従来の統計的および機械学習のアプローチとは異なり、BanditWareはオンラインで、新しいワークロードが到着すると学習と適応をリアルタイムで行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Distributed computing systems are essential for meeting the demands of modern applications, yet transitioning from single-system to distributed environments presents significant challenges. Misallocating resources in shared systems can lead to resource contention, system instability, degraded performance, priority inversion, inefficient utilization, increased latency, and environmental impact. We present BanditWare, an online recommendation system that dynamically selects the most suitable hardware for applications using a contextual multi-armed bandit algorithm. BanditWare balances exploration and exploitation, gradually refining its hardware recommendations based on observed application performance while continuing to explore potentially better options. Unlike traditional statistical and machine learning approaches that rely heavily on large historical datasets, BanditWare operates online, learning and adapting in real-time as new workloads arrive. We evaluated BanditWare on three workflow applications: Cycles (an agricultural science scientific workflow) BurnPro3D (a web-based platform for fire science) and a matrix multiplication application. Designed for seamless integration with the National Data Platform (NDP), BanditWare enables users of all experience levels to optimize resource allocation efficiently.
- Abstract(参考訳): 分散コンピューティングシステムは、現代のアプリケーションの要求を満たすために不可欠であるが、単一システムから分散環境への移行は重大な課題である。
共有システムにおけるリソースの配置ミスは、リソースの競合、システムの不安定性、性能低下、優先度の反転、非効率な利用、レイテンシの増加、環境への影響につながる可能性がある。
そこで,BanditWareを提案する。BanditWareは,コンテキスト型マルチアームバンディットアルゴリズムを用いて,アプリケーションに適したハードウェアを動的に選択するオンラインレコメンデーションシステムである。
BanditWareは、探索とエクスプロイトのバランスを保ち、観察されたアプリケーションパフォーマンスに基づいてハードウェアレコメンデーションを徐々に改善するとともに、潜在的に優れた選択肢を模索している。
大規模な履歴データセットに大きく依存する従来の統計的および機械学習アプローチとは異なり、BanditWareは、新たなワークロードが到着するにつれて、オンラインで学習し、リアルタイムで適応する。
我々は、BanditWareを3つのワークフローアプリケーションで評価した: サイクル(農業科学科学のワークフロー) BurnPro3D(消防科学のWebベースプラットフォーム)と行列乗算アプリケーション。
National Data Platform (NDP)とのシームレスな統合のために設計されたBanditWareは、すべての経験レベルのユーザがリソース割り当てを効率的に最適化できる。
関連論文リスト
- Secure Resource Allocation via Constrained Deep Reinforcement Learning [49.15061461220109]
リソース割り当て、タスクオフロード、セキュリティ、パフォーマンスのバランスをとるフレームワークであるSARMTOを紹介します。
SARMTOは5つのベースラインアプローチを一貫して上回り、最大40%のシステムコスト削減を実現している。
これらの拡張は、複雑な分散コンピューティング環境におけるリソース管理に革命をもたらすSARMTOの可能性を強調している。
論文 参考訳(メタデータ) (2025-01-20T15:52:43Z) - Defining a Reference Architecture for Edge Systems in Highly-Uncertain Environments [3.2861283087008406]
エッジシステムに対する異なるアーキテクチャアプローチが優先品質の懸念にどのように影響するかを示す。
本稿では,エッジシステムの参照アーキテクチャを高度に不確実な環境で定義する。
論文 参考訳(メタデータ) (2024-06-12T18:39:43Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - REFT: Resource-Efficient Federated Training Framework for Heterogeneous
and Resource-Constrained Environments [2.117841684082203]
分散システムでは、フェデレートラーニング(FL)が重要な役割を果たす。
FLは、機械学習のプライバシ強化サブドメインとして出現する。
我々は「不均一・資源制約環境のための資源効率の良いフェデレーション・トレーニング・フレームワーク」を提案する。
論文 参考訳(メタデータ) (2023-08-25T20:33:30Z) - FIRE: A Failure-Adaptive Reinforcement Learning Framework for Edge Computing Migrations [52.85536740465277]
FIREは、エッジコンピューティングのディジタルツイン環境でRLポリシーをトレーニングすることで、まれなイベントに適応するフレームワークである。
ImREは重要なサンプリングに基づくQ-ラーニングアルゴリズムであり、希少事象をその値関数への影響に比例してサンプリングする。
FIREは故障時にバニラRLやグリーディベースラインと比較してコストを削減できることを示す。
論文 参考訳(メタデータ) (2022-09-28T19:49:39Z) - SCOPE: Safe Exploration for Dynamic Computer Systems Optimization [18.498208917123414]
本稿では,実行空間からハードウェアリソースを動的に割り当てるリソースマネージャSCOPEを提案する。
電力制約違反を最小限に抑えながら、SCOPEのレイテンシ向上能力を評価する。
論文 参考訳(メタデータ) (2022-04-22T00:58:52Z) - Optimising Resource Management for Embedded Machine Learning [23.00896228073755]
機械学習推論は、モバイルおよび組み込みプラットフォーム上でローカルに実行されつつある。
異種マルチコアシステムにおけるオンラインリソース管理手法を提案する。
論文 参考訳(メタデータ) (2021-05-08T06:10:05Z) - Intelligent colocation of HPC workloads [0.0]
多くのHPCアプリケーションは、共有キャッシュ、命令実行ユニット、I/O、メモリ帯域幅のボトルネックに苦しんでいる。
開発者やランタイムシステムにとって、すべての重要なリソースが単一のアプリケーションによって完全に悪用されることを保証するのは難しいため、魅力的なテクニックは、複数のアプリケーションを同じサーバに配置することです。
まず,ハードウェアの性能カウンタに基づいて,コロケーションされたアプリケーションの性能劣化をモデル化することにより,サーバ効率を向上できることを示す。
論文 参考訳(メタデータ) (2021-03-16T12:35:35Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。