論文の概要: What Is the Cost of Energy Monitoring? An Empirical Study on the Overhead of RAPL-Based Tools
- arxiv url: http://arxiv.org/abs/2604.26815v1
- Date: Wed, 29 Apr 2026 15:44:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.469056
- Title: What Is the Cost of Energy Monitoring? An Empirical Study on the Overhead of RAPL-Based Tools
- Title(参考訳): エネルギーモニタリングのコストとは何か? : RAPLツールの先行きに関する実証的研究
- Authors: Jeremy Diamond, Vincenzo Stoico,
- Abstract要約: 本稿では、RAPLベースのツールが高周波(1kHz)エネルギーモニタリングに与える影響を定量化し、緩和戦略について検討する。
既存のユーザ空間ツールでは1kHzで相当な時間オーバーヘッドを発生させることができるが、我々のツールはシステムコールのオーバーヘッドとインライン数学のオーバーヘッドを著しく低減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Running Average Power Limit (RAPL) interface is widely used to estimate software energy consumption via CPU and DRAM counters, but tool design differences and high-frequency polling can introduce measurement overhead, namely, extra time and energy consumed by the tool itself.This paper quantifies the impact of RAPL-based tools on high-frequency (1 kHz) energy monitoring and investigates mitigation strategies. We conduct two controlled experiments: the first evaluates seven tools, including a user-space application and a kernel module developed by the authors, against a no-tool baseline, using six NAS Benchmark functions to quantify overhead. The second experiment isolates and times key functions for polling Model-Specific Registers (MSRs) (rdmsr and sys/proc_read) to estimate their execution latencies and identify potential slowdowns. The results show that existing user-space tools can introduce substantial time overhead at 1 kHz, whereas our tools significantly reduce system call overhead and inline math overhead. The time overhead of existing tools ranges from 0.25% to 46.75%. Our solutions maintain time overhead levels close to the baseline. We also find that system calls are slower than rdmsr, which in turn is slower than traditionally long-running instructions like cpuid. These findings indicate that RAPL-based energy measurement can be substantially improved by simplifying tool design and employing lower-level instructions to access RAPL values. Our findings provide guidance for practitioners on how to develop high-frequency energy profiling tools, show possible situations that can skew energy values, and demonstrate that access to RAPL values can be faster using specific techniques.
- Abstract(参考訳): 平均電力限界(RAPL)インタフェースは、CPUとDRAMカウンタを介してソフトウェアエネルギー消費を推定するために広く利用されているが、ツール設計の違いと高周波ポーリングにより、ツール自体が消費する余分な時間とエネルギーのオーバーヘッドが生じる可能性がある。
ユーザスペースアプリケーションとカーネルモジュールを含む7つのツールを,6つのNASベンチマーク関数を用いて,ノーツールベースラインに対して評価し,オーバヘッドの定量化を行う。
第2の実験では、モデル固有レジスタ(MSR)(rdmsrとsys/proc_read)をポーリングするためのキー関数を分離して、実行遅延を推定し、潜在的なスローダウンを特定する。
その結果,既存のユーザ空間ツールでは1kHzで相当な時間オーバーヘッドを発生させることができるのに対し,我々のツールはシステムコールのオーバーヘッドとインライン数学のオーバーヘッドを著しく低減できることがわかった。
既存のツールのオーバーヘッドは0.25%から46.75%である。
私たちのソリューションは、ベースラインに近い時間オーバーヘッドレベルを維持しています。
また、システムコールがrdmsrよりも遅いことも分かりました。
これらの結果から, RAPLをベースとしたエネルギー測定は, ツール設計を簡略化し, RAPL値へのアクセスに低レベル命令を用いることにより, 大幅に改善できることがわかった。
本研究は、高頻度エネルギープロファイリングツールの開発方法、エネルギー価値を歪ませる可能性のある状況を示すとともに、RAPL値へのアクセスが特定の技術を用いてより高速であることを示すための実践者へのガイダンスを提供する。
関連論文リスト
- SynPlanResearch-R1: Encouraging Tool Exploration for Deep Research with Synthetic Plans [65.19021035010059]
リサーチエージェントは、ユーザークエリに回答するツールを使用して、モデルがWebから情報を集めることができる。
エージェントは、未熟期の終了やツール使用の偏りなど、探索行動に乏しいことが多いことを観察する。
より深い探索を促進するためのツール利用軌跡を合成するフレームワークであるSynPlanResearch-R1を提案する。
論文 参考訳(メタデータ) (2026-03-09T00:05:29Z) - Timely Machine: Awareness of Time Makes Test-Time Scaling Agentic [72.97800570813175]
ウォールタイムとしてテスト時間を再定義するTimely Machineを提案する。
我々は、高頻度ツールコール、低周波ツールコール、時間制約推論にまたがるベンチマークであるTimely-Evalを紹介する。
より小さなモデルでは、より多くのインタラクションを通じて高速なフィードバックが得られ、大きなモデルでは、より優れたインタラクション品質によって、高レイテンシ設定が支配される。
論文 参考訳(メタデータ) (2026-01-23T06:28:52Z) - Tool-R1: Sample-Efficient Reinforcement Learning for Agentic Tool Use [50.02614257515131]
大規模言語モデル(LLM)は、言語理解と推論において強力な能力を示している。
本稿では,LLMの汎用的,構成的,多段階的なツール使用を可能にする強化学習フレームワークであるTool-R1を提案する。
論文 参考訳(メタデータ) (2025-09-16T09:22:21Z) - RT-HCP: Dealing with Inference Delays and Sample Efficiency to Learn Directly on Robotic Platforms [16.18687520299694]
ロボット上でコントローラを直接学習するには、極端なサンプル効率が必要である。
本稿では,RT-HCPを提案する。RT-HCPは,性能,サンプル効率,推論時間に優れたトレードオフを提供するアルゴリズムである。
我々はRT-HCPの優位性を実験で検証し、簡単なが高周波な振り子プラットフォーム上で直接コントローラを学習する実験を行った。
論文 参考訳(メタデータ) (2025-09-08T14:09:33Z) - Attentions Under the Microscope: A Comparative Study of Resource Utilization for Variants of Self-Attention [0.18749305679160366]
GPT-2アーキテクチャのトレーニングにおいて,トレーニング時間,GPUメモリ使用量,FLOPS,CPU使用量,消費電力など,8つの注意機構をベンチマークした。
その結果、最適化されたカーネル実装による注意機構、例えばFlash Attentionは、最高のエネルギー効率を実現していることがわかった。
本研究は、アテンションデザインにおけるエネルギー認識ベンチマークの重要性を強調し、資源効率のメカニズムを選択するための実践的な洞察を提供する。
論文 参考訳(メタデータ) (2025-07-09T19:37:23Z) - Benchmarking Energy and Latency in TinyML: A Novel Method for Resource-Constrained AI [0.0]
この研究は、エネルギーと遅延の測定を統合する代替のベンチマーク手法を導入する。
設定を評価するために、ニューラルネットワークを実行するためのNPUを含むSTM32N6 MCUをテストした。
その結果,コア電圧とクロック周波数の低減により,前処理と後処理の効率が向上することが示唆された。
論文 参考訳(メタデータ) (2025-05-21T15:12:14Z) - Acting Less is Reasoning More! Teaching Model to Act Efficiently [87.28134636548705]
ツール統合推論は、タスクを解決するために外部ツールを呼び出す機能によって、大きな言語モデルを拡張します。
現在のアプローチは、外部ツールの使用効率や必要性を考慮せずに、最終的な正確性のためにのみ最適化されている。
最小限のツールコールで正確な回答をモデルに提示するフレームワークを提案する。
このアプローチでは,ツールコールを最大68.3%削減し,ツールの生産性を最大215.4%向上すると同時に,同等の回答精度を維持している。
論文 参考訳(メタデータ) (2025-04-21T05:40:05Z) - Time-Series Forecasting and Sequence Learning Using Memristor-based Reservoir System [2.6473021051027534]
我々は,効率的な時間的データ処理とオンライン学習を兼ね備えたmemristorベースのエコー状態ネットワークアクセラレータを開発した。
提案した設計は、負荷エネルギー消費と気象条件の予測など、実世界のタスクを含む様々なデータセットを用いてベンチマークされる。
このシステムはデバイス故障に対して10%以下で合理的な堅牢性を示すことが観察された。
論文 参考訳(メタデータ) (2024-05-22T05:07:56Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - An Ensemble Learning Approach for In-situ Monitoring of FPGA Dynamic
Power [20.487660974785943]
FPGAのランタイム動的パワーを正確に推定できる電力監視方式を提案し,評価する。
本稿では,複数のカスタマイズされたベースラーナーに分解可能な,新規で特殊なアンサンブルモデルについて述べる。
実験では,商業ゲートレベルの電力推定ツールの4.51%以内において,単一の決定木モデルが予測誤差を達成できることを最初に示した。
論文 参考訳(メタデータ) (2020-09-03T03:39:14Z) - Gaze-Sensing LEDs for Head Mounted Displays [73.88424800314634]
仮想現実(VR)アプリケーションのための低消費電力の視線トラッカーを作成するために,LEDのセンサ機能を利用する。
我々は,視線推定法が複雑な次元削減技術を必要としないことを示した。
論文 参考訳(メタデータ) (2020-03-18T23:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。