Fugu-MT 論文翻訳(概要): SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs

論文の概要: SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs

arxiv url: http://arxiv.org/abs/2511.15323v1
Date: Wed, 19 Nov 2025 10:39:45 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-20 15:51:28.764089
Title: SkyEgg: Joint Implementation Selection and Scheduling for Hardware Synthesis using E-graphs
Title（参考訳）: SkyEgg:Eグラフを用いたハードウェア合成のための共同実装選択とスケジューリング
Authors: Youwei Xiao, Yuyang Zou, Yun Liang,
Abstract要約: 実装の選択とスケジューリングを協調的に最適化する新しいハードウェア合成フレームワークSkyEggを提案する。 SkyEggはVitisで平均3.01倍のスピードアップを実現し、複雑な式では5.22倍に改善されている。
参考スコア（独自算出の注目度）: 2.363352915727704
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Hardware synthesis from high-level descriptions remains fundamentally limited by the sequential optimization of interdependent design decisions. Current methodologies, including state-of-the-art high-level synthesis (HLS) tools, artificially separate implementation selection from scheduling, leading to suboptimal designs that cannot fully exploit modern FPGA heterogeneous architectures. Implementation selection is typically performed by ad-hoc pattern matching on operations, a process that does not consider the impact on scheduling. Subsequently, scheduling algorithms operate on fixed selection solutions with inaccurate delay estimates, which misses critical optimization opportunities from appropriately configured FPGA blocks like DSP slices. We present SkyEgg, a novel hardware synthesis framework that jointly optimizes implementation selection and scheduling using the e-graph data structure. Our key insight is that both algebraic transformations and hardware implementation choices can be uniformly represented as rewrite rules within an e-graph, modeling the complete design space of implementation candidates to be selected and scheduled together. First, SkyEgg constructs an e-graph from the input program. It then applies both algebraic and implementation rewrites through equality saturation. Finally, it formulates the joint optimization as a mixed-integer linear programming (MILP) problem on the saturated e-graph. We provide both exact MILP solving and an efficient ASAP heuristic for scalable synthesis. Our evaluation on benchmarks from diverse applications targeting Xilinx Kintex UltraScale+ FPGAs demonstrates that SkyEgg achieves an average speedup of 3.01x over Vitis HLS, with improvements up to 5.22x for complex expressions.
Abstract（参考訳）: 高レベルの記述からのハードウェア合成は、相互依存設計決定の逐次最適化によって、基本的に制限されている。現状の高レベル合成(HLS)ツールを含む現在の手法では、スケジューリングから実装選択を人工的に分離し、現代のFPGAヘテロジニアスアーキテクチャを完全に活用できない準最適設計に繋がる。実装の選択は通常、スケジューリングへの影響を考慮しない操作においてアドホックなパターンマッチングによって実行される。その後、スケジューリングアルゴリズムは不正確な遅延推定を伴う固定選択ソリューションで動作し、DSPスライスのような適切な構成のFPGAブロックから重要な最適化の機会を逃す。我々は,電子グラフデータ構造を用いた実装選択とスケジューリングを協調的に最適化する,新しいハードウェア合成フレームワークSkyEggを提案する。我々の重要な洞察は、代数変換とハードウェア実装の選択の両方を電子グラフ内の書き直し規則として一様に表現することができ、実装候補の完全な設計空間をモデル化し、一緒に選択し、スケジュールすることです。まず、SkyEggは入力プログラムから電子グラフを構築する。その後、等式飽和により代数的および実装的書き直しを施す。最後に、飽和電子グラフ上での混合整数線形プログラミング(MILP)問題として結合最適化を定式化する。我々は、MILPの正確な解法と、スケーラブルな合成のための効率的なASAPヒューリスティックの両方を提供する。 Xilinx Kintex UltraScale+ FPGAをターゲットとした様々なアプリケーションによるベンチマーク評価の結果、SkyEggはVitis HLSよりも平均3.01倍の高速化を実現し、複雑な表現では5.22倍に向上した。

関連論文リスト

PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。 PT$2$-LLMを提案する。その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文参考訳（メタデータ） (2025-09-27T03:01:48Z)
AI-Driven Optimization of Hardware Overlay Configurations [0.0]
本稿では,FPGAオーバレイ構成を最適化するAI駆動方式を提案する。機械学習技術を活用することで、ハードウェアコンパイル前のさまざまな構成の実現可能性と効率を予測する。
論文参考訳（メタデータ） (2025-03-08T22:34:47Z)
Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations [92.1840862558718]
実用的な分散システムでは、労働者は概して均質ではなく、非常に多様な処理時間を持つ。本稿では、任意に遅い計算を扱うための新しい並列手法Freyaを提案する。 Freyaは従来の手法と比較して,複雑性の保証が大幅に向上していることを示す。
論文参考訳（メタデータ） (2024-05-24T13:33:30Z)
All-to-all reconfigurability with sparse and higher-order Ising machines [0.0]
オール・ツー・オールのネットワーク機能をエミュレートする多重アーキテクチャを導入する。適応並列テンパリングアルゴリズムの実行は、競合するアルゴリズムと事前ファクターの利点を示す。 pビットIMのスケールされた磁気バージョンは、汎用最適化のための最先端技術よりも桁違いに改善される可能性がある。
論文参考訳（メタデータ） (2023-11-21T20:27:02Z)
Performance Embeddings: A Similarity-based Approach to Automatic Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文参考訳（メタデータ） (2023-03-14T15:51:35Z)
Matching Pursuit Based Scheduling for Over-the-Air Federated Learning [67.59503935237676]
本稿では,フェデレートラーニング手法を用いて,オーバー・ザ・エアラーニングのための低複雑さデバイススケジューリングアルゴリズムのクラスを開発する。最先端の提案方式と比較すると,提案方式は極めて低効率なシステムである。提案手法の有効性は,CIFARデータセットを用いた実験により確認した。
論文参考訳（メタデータ） (2022-06-14T08:14:14Z)
End-to-end Mapping in Heterogeneous Systems Using Graph Representation Learning [13.810753108848582]
本稿では,エンドツーエンドでプログラム可能なグラフ表現学習フレームワークを提案する。高レベルのプログラムの複雑さを普遍的な中間表現にマイニングし、特定の計算パターンを抽出し、特定のコア上でどのコードセグメントがベストに動作するかを予測できる。評価では、スレッドベースの実行と比較して最大速度が6.42倍、最先端技術と比較して2.02倍であることを示す。
論文参考訳（メタデータ） (2022-04-25T22:13:13Z)
A Graph Deep Learning Framework for High-Level Synthesis Design Space Exploration [11.154086943903696]
High-Level Synthesisは、アプリケーション固有の高速プロトタイピングのためのソリューションである。本稿では,加速性能とハードウェアコストを共同で予測するグラフニューラルネットワークHLSを提案する。提案手法は,一般的なシミュレータと同等の精度で予測できることを示す。
論文参考訳（メタデータ） (2021-11-29T18:17:45Z)
Automatic Mapping of the Best-Suited DNN Pruning Schemes for Real-Time Mobile Acceleration [71.80326738527734]
本稿では,汎用的,きめ細かな構造化プルーニング手法とコンパイラの最適化を提案する。提案手法は,より微細な構造化プルーニング手法とともに,最先端のDNN最適化フレームワークよりも優れていることを示す。
論文参考訳（メタデータ） (2021-11-22T23:53:14Z)
High-performance symbolic-numerics via multiple dispatch [52.77024349608834]
Symbolics.jlは拡張可能なシンボルシステムで、動的多重ディスパッチを使用してドメインのニーズに応じて振る舞いを変更する。実装に依存しないアクションでジェネリックapiを形式化することで、システムに最適化されたデータ構造を遡及的に追加できることを示します。従来の用語書き換えシンプリファイアと電子グラフベースの用語書き換えシンプリファイアをスワップする機能を実証する。
論文参考訳（メタデータ） (2021-05-09T14:22:43Z)
GraphACT: Accelerating GCN Training on CPU-FPGA Heterogeneous Platforms [1.2183405753834562]
グラフ畳み込みネットワーク(GCN)は、グラフ上での表現学習のための最先端のディープラーニングモデルとして登場した。実質的かつ不規則なデータ通信のため、GCNの訓練を加速することは困難である。我々はCPU-FPGAヘテロジニアスシステム上でGCNをトレーニングするための新しいアクセラレータを設計する。
論文参考訳（メタデータ） (2019-12-31T21:19:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。