論文の概要: Understanding Accelerator Compilers via Performance Profiling
- arxiv url: http://arxiv.org/abs/2511.19764v1
- Date: Mon, 24 Nov 2025 22:40:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.197757
- Title: Understanding Accelerator Compilers via Performance Profiling
- Title(参考訳): パフォーマンスプロファイリングによるアクセラレータコンパイラの理解
- Authors: Ayaka Yorihiro, Griffin Berlstein, Pedro Pontes García, Kevin Laeufer, Adrian Sampson,
- Abstract要約: アクセラレータ設計言語(ADL)は、ハードウェアユニットにコンパイルされるハイレベル言語である。
Petalは、コンパイラの判断がパフォーマンスにどのように影響するかを理解するための、サイクルレベルのツールです。
その結果,Petalのサイクルレベルのプロファイルは,既存の設計における性能問題を特定することができることがわかった。
- 参考スコア(独自算出の注目度): 1.1841612917872066
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accelerator design languages (ADLs), high-level languages that compile to hardware units, help domain experts quickly design efficient application-specific hardware. ADL compilers optimize datapaths and convert software-like control flow constructs into control paths. Such compilers are necessarily complex and often unpredictable: they must bridge the wide semantic gap between high-level semantics and cycle-level schedules, and they typically rely on advanced heuristics to optimize circuits. The resulting performance can be difficult to control, requiring guesswork to find and resolve performance problems in the generated hardware. We conjecture that ADL compilers will never be perfect: some performance unpredictability is endemic to the problem they solve. In lieu of compiler perfection, we argue for compiler understanding tools that give ADL programmers insight into how the compiler's decisions affect performance. We introduce Petal, a cycle-level Petal for the Calyx intermediate language (IL). Petal instruments the Calyx code with probes and then analyzes the trace from a register-transfer-level simulation. It maps the events in the trace back to high-level control constructs in the Calyx code to track the clock cycles when each construct was active. Using case studies, we demonstrate that Petal's cycle-level profiles can identify performance problems in existing accelerator designs. We show that these insights can also guide developers toward optimizations that the compiler was unable to perform automatically, including a reduction by 46.9\% of total cycles for one application.
- Abstract(参考訳): ハードウェアユニットにコンパイルするハイレベル言語であるアクセラレータ設計言語(ADL)は、ドメインの専門家が効率的にアプリケーション固有のハードウェアを素早く設計するのに役立つ。
ADLコンパイラはデータパスを最適化し、ソフトウェアのような制御フロー構造を制御パスに変換する。
このようなコンパイラは必ずしも複雑で予測不可能であり、高レベルのセマンティックスとサイクルレベルのスケジュールの間の広いセマンティックスギャップを埋めなければならない。
結果として生じる性能は制御が困難であり、生成したハードウェアの性能問題を推測して解決する必要がある。
ADLコンパイラは決して完璧ではない、と推測する: 性能の予測不可能性は、それらが解決する問題に固有である。
コンパイラの完全性の代わりに、ADLプログラマがコンパイラの決定がパフォーマンスにどのように影響するかを洞察するコンパイラ理解ツールについて議論する。
本稿では,Calyx中間言語(IL)のサイクルレベルPetalであるPetalを紹介する。
Petalは、Calyxコードをプローブで測定し、レジスタ・トランスファーレベルのシミュレーションからトレースを分析する。
トレース内のイベントをCalyxコード内の高レベルな制御構造にマッピングし、各構成がアクティブになったときのクロックサイクルを追跡する。
ケーススタディを用いて、Petalのサイクルレベルのプロファイルが、既存のアクセラレーター設計における性能問題を識別できることを実証する。
これらの洞察は、コンパイラが自動で実行できない最適化に向けても、ひとつのアプリケーションで46.9%のサイクルを削減できることを示す。
関連論文リスト
- Context-Guided Decompilation: A Step Towards Re-executability [50.71992919223209]
バイナリ逆コンパイルは、ソフトウェアセキュリティ分析、リバースエンジニアリング、マルウェア理解において重要な役割を果たす。
大規模言語モデル (LLMs) の最近の進歩により、ニューラルデコンパイルが可能になったが、生成されたコードは一般的に意味論的にのみ使用可能である。
In-context Learning(ICL)を活用して,再実行可能なソースコードを生成するためのILC4Decompを提案する。
論文 参考訳(メタデータ) (2025-11-03T17:21:39Z) - Fun with flags: How Compilers Break and Fix Constant-Time Code [0.0]
コンパイラの最適化が定数時間コードをどのように壊すかを分析する。
キーとなる洞察は、パスの小さなセットが、ほとんどのリークの根元にあるということだ。
ソースコードの変更やカスタムコンパイラを必要としない,オリジナルかつ実践的な緩和を提案する。
論文 参考訳(メタデータ) (2025-07-08T15:52:17Z) - RAG-Based Fuzzing of Cross-Architecture Compilers [0.8302146576157498]
OneAPIは、開発者による最小限の努力で、クロスアーキテクチャなソフトウェア開発をサポートするオープンスタンダードである。
OneAPIはDPC++とC++コンパイラを提供しており、その正確性、信頼性、セキュリティを検証するために徹底的にテストする必要がある。
本稿では,検索拡張生成(RAG)の概念を統合した大規模言語モデル (LLM) ベースのコンパイラファジィツールを提案する。
論文 参考訳(メタデータ) (2025-04-11T20:46:52Z) - Finding Missed Code Size Optimizations in Compilers using LLMs [1.90019787465083]
我々は,大規模言語モデルと一連の差分テスト戦略を組み合わせた新しいテスト手法を開発した。
当社のアプローチでは,実装に150行未満のコードが必要です。
現在までに、本番コンパイラの24のバグが報告されている。
論文 参考訳(メタデータ) (2024-12-31T21:47:46Z) - CompilerDream: Learning a Compiler World Model for General Code Optimization [58.87557583347996]
汎用コード最適化のためのモデルベース強化学習手法であるCompilerDreamを紹介する。
最適化パスの固有の特性を正確にシミュレートするコンパイラの世界モデルと、このモデルで訓練されたエージェントから、効率的な最適化戦略を生成する。
さまざまなデータセットを網羅し、LLVMのビルトイン最適化や、値予測とエンドツーエンドコード最適化の両方の設定における最先端メソッドを超越している。
論文 参考訳(メタデータ) (2024-04-24T09:20:33Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - CompilerGym: Robust, Performant Compiler Optimization Environments for
AI Research [26.06438868492976]
コンパイラ最適化に人工知能(AI)技術を適用することへの関心は急速に高まっている。
しかし、コンパイラー研究は高い参入障壁を持っている。
実世界のコンパイラ最適化タスクのための環境セットであるCompilerGymを紹介する。
また、コンパイラ研究者に新しい最適化タスクを公開するツールキットも導入する。
論文 参考訳(メタデータ) (2021-09-17T01:02:27Z) - StreamBlocks: A compiler for heterogeneous dataflow computing (technical
report) [1.5293427903448022]
この作業では、オープンソースのコンパイラとランタイムであるStreamBlocksを導入し、CALデータフロープログラミング言語を使用して、プラットフォーム間で計算処理を分割する。
StreamBlocksは、最高のハードウェア/ソフトウェアパーティションを特定するためのプロファイル誘導ツールを使用して、デザインスペースの探索をサポートする。
論文 参考訳(メタデータ) (2021-07-20T08:46:47Z) - PolyDL: Polyhedral Optimizations for Creation of High Performance DL
primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。
我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。
また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2020-06-02T06:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。