論文の概要: CPINN-ABPI: Physics-Informed Neural Networks for Accurate Power Estimation in MPSoCs
- arxiv url: http://arxiv.org/abs/2505.22469v1
- Date: Wed, 28 May 2025 15:22:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-29 17:35:50.690139
- Title: CPINN-ABPI: Physics-Informed Neural Networks for Accurate Power Estimation in MPSoCs
- Title(参考訳): CPINN-ABPI:MPSoCの高精度電力推定のための物理インフォームニューラルネットワーク
- Authors: Mohamed R. Elshamy, Mehdi Elahi, Ahmad Patooghy, Abdel-Hameed A. Badawy,
- Abstract要約: 代替ブラインドパワー同定(ABPI)は理論的には定常温度への依存を排除している。
ABPIの性能は、実際のハードウェア実装では検証されていない。
本稿では、カスタム物理情報ニューラルネットワーク(CPINN)とABPIの熱モデルを統合する新しいアプローチを提案する。
- 参考スコア(独自算出の注目度): 0.562479170374811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient thermal and power management in modern multiprocessor systems-on-chip (MPSoCs) demands accurate power consumption estimation. One of the state-of-the-art approaches, Alternative Blind Power Identification (ABPI), theoretically eliminates the dependence on steady-state temperatures, addressing a major shortcoming of previous approaches. However, ABPI performance has remained unverified in actual hardware implementations. In this study, we conduct the first empirical validation of ABPI on commercial hardware using the NVIDIA Jetson Xavier AGX platform. Our findings reveal that, while ABPI provides computational efficiency and independence from steady-state temperature, it exhibits considerable accuracy deficiencies in real-world scenarios. To overcome these limitations, we introduce a novel approach that integrates Custom Physics-Informed Neural Networks (CPINNs) with the underlying thermal model of ABPI. Our approach employs a specialized loss function that harmonizes physical principles with data-driven learning, complemented by multi-objective genetic algorithm optimization to balance estimation accuracy and computational cost. In experimental validation, CPINN-ABPI achieves a reduction of 84.7\% CPU and 73.9\% GPU in the mean absolute error (MAE) relative to ABPI, with the weighted mean absolute percentage error (WMAPE) improving from 47\%--81\% to $\sim$12\%. The method maintains real-time performance with 195.3~$\mu$s of inference time, with similar 85\%--99\% accuracy gains across heterogeneous SoCs.
- Abstract(参考訳): 現代のマルチプロセッサシステム(MPSoC)における効率的な熱・電力管理は、正確な消費電力推定を要求する。
最先端のアプローチの1つである代替ブラインドパワー識別(ABPI)は理論的には定常温度への依存を排除し、以前のアプローチの大きな欠点に対処する。
しかし、ABPIの性能は実際のハードウェア実装では検証されていない。
本研究では,NVIDIA Jetson Xavier AGXプラットフォームを用いた商用ハードウェア上でのABPIの実証検証を行った。
以上の結果から,ABPIは定常温度から独立して計算効率を向上するが,実世界のシナリオでは精度に欠けることがわかった。
これらの制約を克服するために、カスタム物理情報ニューラルネットワーク(CPINN)とABPIの熱モデルを統合する新しいアプローチを導入する。
本手法では,推定精度と計算コストのバランスをとるために,多目的遺伝的アルゴリズムの最適化によって補完される,データ駆動学習と物理原理を調和させる特殊な損失関数を用いる。
実験検証において、CPINN-ABPIは、ABPIと比較して平均絶対誤差(MAE)において84.7\% CPUと73.9\% GPUの削減を実現し、重み付き平均絶対パーセンテージ誤差(WMAPE)は47\%-81\%から$\sim$12\%に改善された。
この方法は、195.3~$\mu$sの推論時間でリアルタイムのパフォーマンスを維持し、同様の85\%--99\%の精度を持つ。
関連論文リスト
- Cluster-BPI: Efficient Fine-Grain Blind Power Identification for Defending against Hardware Thermal Trojans in Multicore SoCs [0.562479170374811]
クラスタリングBlind Power Identification (ICBPI) は、従来のBlind Power Identification (BPI) 法の感度と堅牢性を改善するために設計されている。
ICBPIは精度を大幅に向上させ、従来のBPIに比べて77.56%、最先端のBPISS法に比べて68.44%の誤差を減少させる。
論文 参考訳(メタデータ) (2024-09-27T17:11:29Z) - Adaptive Resolution Inference (ARI): Energy-Efficient Machine Learning for Internet of Things [11.802983172874901]
Internet of Thingsデバイスにおける機械学習の実装は、限られたエネルギーと計算資源のために、重大な運用上の問題を引き起こす。
本稿では,エネルギー散逸とモデル性能の新たなトレードオフを評価する新しい手法である適応分解能推論(ARI)を提案する。
論文 参考訳(メタデータ) (2024-08-26T16:00:26Z) - Impacts of floating-point non-associativity on reproducibility for HPC and deep learning applications [0.0]
浮動小数点非連想性に起因する並列プログラムにおける変数の実行は、アルゴリズムに大きな影響を与えることが知られている。
並列プログラミングモデルにおける浮動小数点非連想性の統計的性質について検討する。
我々は、ディープラーニングのためのGPUデプロイメントのコンテキスト内で、最近追加されたPyTorchの決定論的オプションについて検討する。
論文 参考訳(メタデータ) (2024-08-09T16:07:37Z) - Equation Discovery with Bayesian Spike-and-Slab Priors and Efficient Kernels [57.46832672991433]
ケルネル学習とBayesian Spike-and-Slab pres (KBASS)に基づく新しい方程式探索法を提案する。
カーネルレグレッションを用いてターゲット関数を推定する。これはフレキシブルで表現力があり、データ空間やノイズに対してより堅牢である。
我々は,効率的な後部推論と関数推定のための予測伝搬予測最大化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-10-09T03:55:09Z) - Guaranteed Approximation Bounds for Mixed-Precision Neural Operators [83.64404557466528]
我々は、ニューラル演算子学習が本質的に近似誤差を誘導する直感の上に構築する。
提案手法では,GPUメモリ使用量を最大50%削減し,スループットを58%向上する。
論文 参考訳(メタデータ) (2023-07-27T17:42:06Z) - ApproxABFT: Approximate Algorithm-Based Fault Tolerance for Neural Network Processing [7.578258600530223]
アルゴリズムに基づく耐障害性(ABFT)機構は信頼性向上のための有望なソリューションとなっている。
本稿では,適応的エラー許容しきい値を導入し,選択的障害回復を実現するための近似ABFTフレームワークを提案する。
提案した ApproxABFT は,従来の ABFT よりも43.39% の冗長計算オーバーヘッド削減を実現している。
論文 参考訳(メタデータ) (2023-02-21T06:21:28Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。