Fugu-MT 論文翻訳(概要): Automatic Microprocessor Performance Bug Detection

論文の概要: Automatic Microprocessor Performance Bug Detection

arxiv url: http://arxiv.org/abs/2011.08781v2
Date: Thu, 19 Nov 2020 15:39:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-24 18:03:42.152881
Title: Automatic Microprocessor Performance Bug Detection
Title（参考訳）: マイクロプロセッサ性能バグの自動検出
Authors: Erick Carvajal Barboza and Sara Jacob and Mahesh Ketkar and Michael Kishinevsky and Paul Gratz and Jiang Hu
Abstract要約: 本稿では,マイクロプロセッサの性能欠陥を検出するための2段階の機械学習手法を提案する。我々の最良の手法は、ICCの影響が1%を超えるマイクロプロセッサコアのパフォーマンスバグの91.5%を検知する。メモリシステムのバグを評価した結果,偽陽性ゼロで100%検出できることがわかった。
参考スコア（独自算出の注目度）: 3.6462412165522466
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Processor design validation and debug is a difficult and complex task, which consumes the lion's share of the design process. Design bugs that affect processor performance rather than its functionality are especially difficult to catch, particularly in new microarchitectures. This is because, unlike functional bugs, the correct processor performance of new microarchitectures on complex, long-running benchmarks is typically not deterministically known. Thus, when performance benchmarking new microarchitectures, performance teams may assume that the design is correct when the performance of the new microarchitecture exceeds that of the previous generation, despite significant performance regressions existing in the design. In this work, we present a two-stage, machine learning-based methodology that is able to detect the existence of performance bugs in microprocessors. Our results show that our best technique detects 91.5% of microprocessor core performance bugs whose average IPC impact across the studied applications is greater than 1% versus a bug-free design with zero false positives. When evaluated on memory system bugs, our technique achieves 100% detection with zero false positives. Moreover, the detection is automatic, requiring very little performance engineer time.
Abstract（参考訳）: プロセス設計の検証とデバッグは困難で複雑な作業であり、設計プロセスのライオンのシェアを消費します。特に新しいマイクロアーキテクチャでは、その機能よりもプロセッサの性能に影響する設計バグをキャッチするのは特に難しい。これは機能的なバグとは異なり、複雑な長期実行ベンチマークにおける新しいマイクロアーキテクチャの正しいプロセッサ性能が決定論的に知られていないためである。したがって、新しいマイクロアーキテクチャのベンチマークを行う場合、新しいマイクロアーキテクチャのパフォーマンスが前世代の性能を上回る場合、設計に顕著な性能低下があるにもかかわらず、その設計が正しいと仮定することができる。本研究では,マイクロプロセッサの性能欠陥を検出するための2段階の機械学習手法を提案する。その結果,研究対象のアプリケーションの平均IPC影響が1%以上であるマイクロプロセッサコア性能バグの91.5%を,偽陽性ゼロのバグフリー設計と比較して検出した。メモリシステムのバグを評価した結果,偽陽性ゼロで100%検出できることがわかった。さらに、検出は自動で、パフォーマンスエンジニアの時間はほとんど必要ありません。

関連論文リスト

Global Microprocessor Correctness in the Presence of Transient Execution [0.16385815610837165]
我々は、洗練の理論を用いて、正式な仕様の使用を提唱する。我々は、MeltdownやSpectreなど、一時的な実行攻撃に対処するために使用できる正当性の概念を紹介します。
論文参考訳（メタデータ） (2025-06-20T16:56:14Z)
Concorde: Fast and Accurate CPU Performance Modeling with Compositional Analytical-ML Fusion [15.06323814625609]
マイクロアーキテクチャの高速かつ正確な性能モデルを学ぶための新しい方法論であるConcordeを提案する。 Concordeは、異なるマイクロアーキテクチャーコンポーネントの影響を捉えた、コンパクトな性能分布に基づくプログラムの挙動を予測する。実験の結果、Concordeは基準サイクルレベルのシミュレータよりも5桁以上高速であることがわかった。
論文参考訳（メタデータ） (2025-03-29T13:25:20Z)
LowFormer: Hardware Efficient Design for Convolutional Transformer Backbones [10.435069781620957]
効率的な視覚バックボーンの研究は、畳み込みとトランスフォーマーブロックの混合モデルに進化しつつある。我々は、MACではなく、実際のスループットとレイテンシの観点から、一般的なモジュールとアーキテクチャ設計の選択を分析します。マクロデザインとマイクロデザインを組み合わせることで,LowFormerと呼ばれる,ハードウェア効率のよいバックボーンネットワークの新たなファミリを作ります。
論文参考訳（メタデータ） (2024-09-05T12:18:32Z)
Automatic Build Repair for Test Cases using Incompatible Java Versions [7.4881561767138365]
依存性の最小化を行うことで、Javaプロジェクトのテストケースを修復するアプローチを導入します。既存の最先端技術とは異なり、我々の手法はソースレベルで動作し、コンパイル時のエラーを修正できる。
論文参考訳（メタデータ） (2024-04-27T07:55:52Z)
VeriBug: An Attention-based Framework for Bug-Localization in Hardware Designs [2.807347337531008]
近年,様々な用途を対象としたSystem-on-Chip設計の規模と複雑さが指数関数的に増大している。これらのシステムにおける未検出バグのコストは、従来のプロセッサシステムよりもはるかに高い。本稿では,近年のディープラーニングの進歩を活用してレジスタ・トランスファーレベルのデバッグを高速化するVeriBugを提案し,根本原因の可能性のある説明を生成する。
論文参考訳（メタデータ） (2024-01-17T01:33:37Z)
Small Effect Sizes in Malware Detection? Make Harder Train/Test Splits! [51.668411293817464]
業界関係者は、モデルが数億台のマシンにデプロイされているため、マルウェア検出精度の小さな改善に気を配っている。学術研究はしばしば1万のサンプルの順序で公開データセットに制限される。利用可能なサンプルのプールから難易度ベンチマークを生成するためのアプローチを考案する。
論文参考訳（メタデータ） (2023-12-25T21:25:55Z)
PACE: A Program Analysis Framework for Continuous Performance Prediction [0.0]
PACEはプログラム分析フレームワークで、保留中のコード更新のパフォーマンスへの影響を継続的にフィードバックする。コード更新によって機能テストケースの実行時間をマッピングすることで,パフォーマンスのマイクロベンチマークを設計する。我々の実験は、コード性能の予測において、ニューラル表現されたコードスタイメトリーの特徴において、現在の最先端を75%上回る性能を達成した。
論文参考訳（メタデータ） (2023-12-01T20:43:34Z)
FuzzyFlow: Leveraging Dataflow To Find and Squash Program Optimization Bugs [92.47146416628965]
FuzzyFlowはプログラム最適化をテストするために設計されたフォールトローカライゼーションとテストケース抽出フレームワークである。我々は、データフロープログラム表現を活用して、完全に再現可能なシステム状態と最適化のエリア・オブ・エフェクトをキャプチャする。テスト時間を削減するため,テスト入力を最小限に抑えるアルゴリズムを設計し,再計算のためのメモリ交換を行う。
論文参考訳（メタデータ） (2023-06-28T13:00:17Z)
Task-Oriented Over-the-Air Computation for Multi-Device Edge AI [57.50247872182593]
エッジAIをサポートするための6Gネットワークは、AIタスクの効率的かつ効率的な実行に焦点を当てたタスク指向のテクニックを備えている。本稿では,マルチデバイススプリット推論システムにおけるタスク指向オーバー・ザ・エア計算(AirComp)方式を提案する。
論文参考訳（メタデータ） (2022-11-02T16:35:14Z)
GRANITE: A Graph Neural Network Model for Basic Block Throughput Estimation [3.739243122393041]
異なるマイクロアーキテクチャにわたる基本ブロックのスループットを推定する新しい機械学習モデルを導入する。結果は、平均テスト誤差6.9%で、基本ブロック性能推定のための新しい最先端技術を確立する。独立な多層フィードフォワードデコーダネットワークを用いたマルチタスク学習を提案する。
論文参考訳（メタデータ） (2022-10-08T03:03:49Z)
Faster Attention Is What You Need: A Fast Self-Attention Neural Network Backbone Architecture for the Edge via Double-Condensing Attention Condensers [71.40595908386477]
本稿では,2重対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向対向結果のバックボーン(AttendNeXtと呼ぶ)は、組み込みARMプロセッサ上で大幅に高い推論スループットを実現する。これらの有望な結果は、さまざまな効率的なアーキテクチャ設計と自己アテンション機構の探索が、TinyMLアプリケーションのための興味深い新しいビルディングブロックにつながることを実証している。
論文参考訳（メタデータ） (2022-08-15T02:47:33Z)
MAPLE: Microprocessor A Priori for Latency Estimation [81.91509153539566]
現代のディープニューラルネットワークは、低レイテンシとエネルギー消費を示しながら最先端の精度を示す必要がある。評価されたアーキテクチャのレイテンシの測定は、NASプロセスにかなりの時間を加えます。転送学習やドメイン適応に依存しない推定用マイクロプロセッサAプライオリティを提案する。
論文参考訳（メタデータ） (2021-11-30T03:52:15Z)
TinyDefectNet: Highly Compact Deep Neural Network Architecture for High-Throughput Manufacturing Visual Quality Inspection [72.88856890443851]
TinyDefectNetは、高スループット製造の視覚品質検査に適した、非常にコンパクトな深層畳み込みネットワークアーキテクチャである。 TinyDefectNetはAMD EPYC 7R32上にデプロイされ、ネイティブフロー環境を使って7.6倍のスループット、AMD ZenDNNアクセラレーターライブラリを使って9倍のスループットを達成した。
論文参考訳（メタデータ） (2021-11-29T04:19:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。