論文の概要: A Hybrid, Knowledge-Guided Evolutionary Framework for Personalized Compiler Auto-Tuning
- arxiv url: http://arxiv.org/abs/2510.14292v1
- Date: Thu, 16 Oct 2025 04:31:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-17 21:15:14.720463
- Title: A Hybrid, Knowledge-Guided Evolutionary Framework for Personalized Compiler Auto-Tuning
- Title(参考訳): パーソナライズされたコンパイラ自動チューニングのためのハイブリッドな知識誘導型進化型フレームワーク
- Authors: Haolin Pan, Hongbin Zhang, Mingjie Xing, Yanjun Wu,
- Abstract要約: 本稿では,ハイブリッドな知識指導型進化的フレームワークを提案する。
このフレームワークは、大規模なオフライン分析フェーズから抽出した知識を用いて、オンラインでパーソナライズされた最適化をインテリジェントにガイドする。
オンラインの段階では、Bespokeの遺伝的アルゴリズムは、特別に設計された知識を注入した遺伝オペレーターを通じて、この豊富な知識ベースを活用する。
- 参考スコア(独自算出の注目度): 11.527479356386706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compiler pass auto-tuning is critical for enhancing software performance, yet finding the optimal pass sequence for a specific program is an NP-hard problem. Traditional, general-purpose optimization flags like -O3 and -Oz adopt a one-size-fits-all approach, often failing to unlock a program's full performance potential. To address this challenge, we propose a novel Hybrid, Knowledge-Guided Evolutionary Framework. This framework intelligently guides online, personalized optimization using knowledge extracted from a large-scale offline analysis phase. During the offline stage, we construct a comprehensive compilation knowledge base composed of four key components: (1) Pass Behavioral Vectors to quantitatively capture the effectiveness of each optimization; (2) Pass Groups derived from clustering these vectors based on behavior similarity; (3) a Synergy Pass Graph to model beneficial sequential interactions; and (4) a library of Prototype Pass Sequences evolved for distinct program types. In the online stage, a bespoke genetic algorithm leverages this rich knowledge base through specially designed, knowledge-infused genetic operators. These operators transform the search by performing semantically-aware recombination and targeted, restorative mutations. On a suite of seven public datasets, our framework achieves an average of 11.0% additional LLVM IR instruction reduction over the highly-optimized opt -Oz baseline, demonstrating its state-of-the-art capability in discovering personalized, high-performance optimization sequences.
- Abstract(参考訳): コンパイラパスの自動チューニングは、ソフトウェアの性能向上に不可欠であるが、特定のプログラムの最適なパスシーケンスを見つけることは、NPハード問題である。
従来、-O3や-Ozのような汎用的な最適化フラグは、一大のアプローチを採用しており、しばしばプログラムの完全なパフォーマンスの可能性を解き放たない。
この課題に対処するため,我々はHybrid, Knowledge-Guided Evolutionary Frameworkを提案する。
このフレームワークは、大規模なオフライン分析フェーズから抽出した知識を用いて、オンラインでパーソナライズされた最適化をインテリジェントにガイドする。
オフラインの段階では,(1) それぞれの最適化の有効性を定量的に把握するパス行動ベクトル,(2) 行動類似性に基づいてこれらのベクトルをクラスタリングしたパスグループ,(3) 有意義な逐次的相互作用をモデル化するシナジーパスグラフ,(4) プログラムタイプごとに進化したプロトタイプパスシーケンスのライブラリの4つの主要なコンポーネントからなる総合的なコンパイル知識ベースを構築した。
オンラインの段階では、Bespokeの遺伝的アルゴリズムは、特別に設計された知識を注入した遺伝オペレーターを通じて、この豊富な知識ベースを活用する。
これらの演算子は、意味論的に認識された組換えと標的となる再帰突然変異を実行することによって探索を変換する。
7つの公開データセットのスイート上で、我々のフレームワークは、高度に最適化されたOp-Ozベースラインに対して平均11.0%のLLVM IR命令を削減し、パーソナライズされた高性能な最適化シーケンスを見つけるための最先端の能力を実証する。
関連論文リスト
- GRACE: Globally-Seeded Representation-Aware Cluster-Specific Evolution for Compiler Auto-Tuning [10.225578019039506]
本稿では,LLVM IR命令数最適化のためのコンパイラ自動チューニングフレームワーク GRACE を紹介する。
GRACEは、パスシナジーと重み付けされたスコアリング法を利用して、探索空間を効果的に削減し、初期品質の高い候補シーケンスとパスプールを生成する。
次に、パスシーケンスベースのデータ拡張を使用してコントラスト学習を使用して、類似性を認識したクラスタリングを容易にするプログラム埋め込みを生成する。
論文 参考訳(メタデータ) (2025-10-15T06:01:19Z) - AwareCompiler: Agentic Context-Aware Compiler Optimization via a Synergistic Knowledge-Data Driven Framework [42.57224438231615]
本稿では,コンパイラ最適化のためのエージェントフレームワークである textbfAwareCompiler を紹介する。
構造化知識統合とデータセット構築、知識駆動適応パス生成、データ駆動ハイブリッドトレーニングパイプラインの3つの重要なイノベーション。
標準ベンチマークの実験結果は、AwareCompilerがパフォーマンスと効率の両方で既存のベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-10-13T02:02:36Z) - CALM: Co-evolution of Algorithms and Language Model for Automatic Heuristic Design [11.639825726501659]
大規模言語モデル(LLM)は、従来のコストのごく一部で自律的にハイパフォーマンスを発見できる。
本稿では,言語指導と数値指導を組み合わせたハイブリッドフレームワークを提案する。
本手法は,様々な最適化タスクにおいて,SOTA(State-of-the-art)ベースラインを上回っている。
論文 参考訳(メタデータ) (2025-05-18T07:48:47Z) - Inverse-Transpilation: Reverse-Engineering Quantum Compiler Optimization Passes from Circuit Snapshots [2.348041867134616]
本稿では,オリジナル回路とコンパイル回路間の構造的差異を利用して,基礎となる最適化手法を推論する,シンプルなMLベースのフレームワークを提案する。
評価の結果、ニューラルネットワークは最適化パスの検出において最善を尽くし、個々のパスF1スコアは最大0.96に到達した。
論文 参考訳(メタデータ) (2025-04-27T05:25:12Z) - Revisiting Zeroth-Order Optimization for Memory-Efficient LLM Fine-Tuning: A Benchmark [166.40879020706151]
本稿では、微調整時のメモリコスト低減のためのソリューションとして、BPフリーゼロオーダー最適化(ZO)への移行を提案する。
従来のZO-SGD法とは異なり、我々の研究はより広い範囲のZO最適化手法に探索を広げる。
本研究は,タスクアライメントの重要性,前方勾配法の役割,アルゴリズムの複雑さと微調整性能のバランスについて,これまで見過ごされてきた最適化原理を明らかにした。
論文 参考訳(メタデータ) (2024-02-18T14:08:48Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - Massively Parallel Genetic Optimization through Asynchronous Propagation
of Populations [50.591267188664666]
Propulateは、グローバル最適化のための進化的最適化アルゴリズムとソフトウェアパッケージである。
提案アルゴリズムは, 選択, 突然変異, 交叉, 移動の変種を特徴とする。
Propulateは解の精度を犠牲にすることなく、最大で3桁高速であることがわかった。
論文 参考訳(メタデータ) (2023-01-20T18:17:34Z) - AutoBERT-Zero: Evolving BERT Backbone from Scratch [94.89102524181986]
そこで本稿では,提案するハイブリッドバックボーンアーキテクチャを自動検索するOP-NASアルゴリズムを提案する。
提案するOP-NASの効率を向上させるために,探索アルゴリズムと候補モデルの評価を最適化する。
実験の結果、検索されたアーキテクチャ(AutoBERT-Zero)は、様々な下流タスクにおいてBERTとそのバリエーションの異なるモデル容量を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-07-15T16:46:01Z) - Static Neural Compiler Optimization via Deep Reinforcement Learning [1.458855293397494]
本稿では,位相整合問題に対する深層強化学習手法を用いる。
LLVMのO3シークエンスを構成するサブシーケンスを用いて、エージェントはトレーニングに使用するソースコードのセット上でO3シークエンスより優れていることを学習する。
我々は、我々のアプローチを用いて訓練されたモデルは、ニューラル最適化エージェントとして現代のコンパイラに統合できると考えている。
論文 参考訳(メタデータ) (2020-08-20T13:16:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。