論文の概要: HiDVFS: A Hierarchical Multi-Agent DVFS Scheduler for OpenMP DAG Workloads
- arxiv url: http://arxiv.org/abs/2601.06425v1
- Date: Sat, 10 Jan 2026 04:42:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:00.807276
- Title: HiDVFS: A Hierarchical Multi-Agent DVFS Scheduler for OpenMP DAG Workloads
- Title(参考訳): HiDVFS: OpenMP DAGワークロードのための階層型マルチエージェントDVFSスケジューリング
- Authors: Mohammad Pivezhandi, Abusayeed Saifullah, Ali Jannesari,
- Abstract要約: HiDVFSは、OpenMP DAGワークロードのための階層的なマルチエージェント、パフォーマンスを意識したDVFSスケジューラである。
二次的な結果としてエネルギーと熱を報告しながら、パフォーマンス(マケスパン)を優先する。
平均3.95倍のスピードアップと47.1%のエネルギー削減を実現している。
- 参考スコア(独自算出の注目度): 8.189696720657247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With advancements in multicore embedded systems, leakage power, exponentially tied to chip temperature, has surpassed dynamic power consumption. Energy-aware solutions use dynamic voltage and frequency scaling (DVFS) to mitigate overheating in performance-intensive scenarios, while software approaches allocate high-utilization tasks across core configurations in parallel systems to reduce power. However, existing heuristics lack per-core frequency monitoring, failing to address overheating from uneven core activity, and task assignments without detailed profiling overlook irregular execution patterns. We target OpenMP DAG workloads. Because makespan, energy, and thermal goals often conflict within a single benchmark, this work prioritizes performance (makespan) while reporting energy and thermal as secondary outcomes. To overcome these issues, we propose HiDVFS (a hierarchical multi-agent, performance-aware DVFS scheduler) for parallel systems that optimizes task allocation based on profiling data, core temperatures, and makespan-first objectives. It employs three agents: one selects cores and frequencies using profiler data, another manages core combinations via temperature sensors, and a third sets task priorities during resource contention. A makespan-focused reward with energy and temperature regularizers estimates future states and enhances sample efficiency. Experiments on the NVIDIA Jetson TX2 using the BOTS suite (9 benchmarks) compare HiDVFS against state-of-the-art approaches. With multi-seed validation (seeds 42, 123, 456), HiDVFS achieves the best finetuned performance with 4.16 plus/minus 0.58s average makespan (L10), representing a 3.44x speedup over GearDVFS (14.32 plus/minus 2.61s) and 50.4% energy reduction (63.7 kJ vs 128.4 kJ). Across all BOTS benchmarks, HiDVFS achieves an average 3.95x speedup and 47.1% energy reduction.
- Abstract(参考訳): マルチコア組み込みシステムの進歩により、チップ温度と指数関数的に結びついたリーク電力は、動的消費電力を上回っている。
エネルギーを意識したソリューションでは、動的電圧と周波数スケーリング(DVFS)を使用してパフォーマンス集約的なシナリオでのオーバーヒートを軽減し、ソフトウェアアプローチでは、並列システムのコア構成全体にわたって高ユーティリティタスクを割り当てて電力を削減している。
しかし、既存のヒューリスティックにはコア毎の周波数モニタリングがなく、不均一なコアアクティビティからのオーバーヒートに対処できず、詳細なプロファイリングが不規則な実行パターンを見ることなくタスクを割り当てている。
OpenMP DAGワークロードをターゲットにしています。
メースパン、エネルギー、熱目標はしばしば1つのベンチマークで矛盾するため、この研究はエネルギーと熱を二次的な結果として報告しながら性能(マッケパン)を優先する。
これらの課題を克服するため、並列システムのためのHiDVFS(階層型マルチエージェント、性能対応DVFSスケジューラ)を提案し、プロファイリングデータ、コア温度、メースパン優先の目的に基づいてタスク割り当てを最適化する。
3つのエージェントが採用されている: 1つはプロファイラデータを使用してコアと周波数を選択し、もう1つは温度センサーを介してコアの組み合わせを管理し、もう1つはリソース競合時にタスクの優先順位を設定する。
エネルギーと温度正則化器によるメースパン中心の報酬は将来の状態を推定し、サンプル効率を高める。
BOTSスイート(9ベンチマーク)を使用したNVIDIA Jetson TX2の実験では、HiDVFSと最先端のアプローチを比較している。
マルチシード検証(42, 123, 456)により、HiDVFSはGearDVFSの3.44倍のスピードアップ(14.32+/minus 2.61s)と50.4%のエネルギー削減(63.7 kJ vs 128.4 kJ)で、4.16プラス/minus 0.58s平均メイスパン(L10)で最高の微調整性能を達成する。
すべてのBOTSベンチマークで、HiDVFSは平均3.95倍のスピードアップと47.1%のエネルギー削減を達成した。
関連論文リスト
- Exact Nearest-Neighbor Search on Energy-Efficient FPGA Devices [10.725513609195]
本稿では,FPGAの低レベル構成を同一とする2つの異なるエネルギー効率ソリューションを提案する。
最初のソリューションは、バッチのクエリをストリームデータセット上で並列に処理することで、システムのスループットを最大化する。
2つ目は、各kNN受信クエリをインメモリデータセット上で並列に処理することで、レイテンシを最小限にする。
論文 参考訳(メタデータ) (2025-10-19T07:29:16Z) - Thermal Modeling and Optimal Allocation of Avionics Safety-critical Tasks on Heterogeneous MPSoCs [0.0]
高消費電力とアビオニクスの安全基準が組み合わさって、新しい熱管理の課題をもたらす。
本稿では,不均一MPSoC上での周期的タスクのオフライン熱的アロケーション手法について検討する。
実験的なパワーモデルとILPを統合することで,テスト対象のプラットフォーム上での他の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-28T10:40:47Z) - FlowTS: Time Series Generation via Rectified Flow [67.41208519939626]
FlowTSは、確率空間における直線輸送を伴う整流フローを利用するODEベースのモデルである。
非条件設定では、FlowTSは最先端のパフォーマンスを達成し、コンテキストFIDスコアはStockとETThデータセットで0.019と0.011である。
条件設定では、太陽予測において優れた性能を達成している。
論文 参考訳(メタデータ) (2024-11-12T03:03:23Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - Green AI: A Preliminary Empirical Study on Energy Consumption in DL
Models Across Different Runtime Infrastructures [56.200335252600354]
トレーニング済みのモデルを、ネイティブな開発環境とは異なる環境にデプロイするのは、一般的なプラクティスです。
これにより、インフラを含むONNXや標準フォーマットとして機能するONNXなどの交換フォーマットが導入された。
論文 参考訳(メタデータ) (2024-02-21T09:18:44Z) - Towards General and Efficient Online Tuning for Spark [55.30868031221838]
本稿では,3つの問題を同時に処理できる汎用的で効率的なSparkチューニングフレームワークを提案する。
我々は、このフレームワークを独立したクラウドサービスとして実装し、Tencentのデータプラットフォームに適用しました。
論文 参考訳(メタデータ) (2023-09-05T02:16:45Z) - DVFO: Learning-Based DVFS for Energy-Efficient Edge-Cloud Collaborative
Inference [12.095934624748686]
本稿では,新しいDVFS対応エッジクラウド協調推論フレームワークであるDVFOを提案する。
エッジデバイスのCPU、GPU、メモリの周波数を自動的に最適化し、機能マップをクラウドサーバにオフロードする。
最先端の計画に比べて、エネルギー消費を平均で33%削減する。
論文 参考訳(メタデータ) (2023-06-02T07:00:42Z) - Edge-MoE: Memory-Efficient Multi-Task Vision Transformer Architecture
with Task-level Sparsity via Mixture-of-Experts [60.1586169973792]
M$3$ViTは、Mix-of-experts (MoE)を導入した最新のマルチタスクViTモデルである。
MoEは精度の向上と80%以上の削減計算を実現しているが、FPGAに効率的なデプロイを行う上での課題は残されている。
Edge-MoEと呼ばれる私たちの研究は、アーキテクチャの革新の集合を伴って、マルチタスクのViTのための最初のエンドツーエンドFPGAアクセラレータを導入するという課題を解決します。
論文 参考訳(メタデータ) (2023-05-30T02:24:03Z) - iELAS: An ELAS-Based Energy-Efficient Accelerator for Real-Time Stereo
Matching on FPGA Platform [21.435663827158564]
FPGAプラットフォーム上でのリアルタイムELASステレオマッチングのためのエネルギー効率の高いアーキテクチャを提案する。
当社のFPGA実現は、38.4xと3.32xのフレームレート改善、27.1xと1.13xのエネルギー効率改善を実現します。
論文 参考訳(メタデータ) (2021-04-11T21:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。