論文の概要: Synergy-Guided Compiler Auto-Tuning of Nested LLVM Pass Pipelines
- arxiv url: http://arxiv.org/abs/2510.13184v1
- Date: Wed, 15 Oct 2025 06:14:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.519311
- Title: Synergy-Guided Compiler Auto-Tuning of Nested LLVM Pass Pipelines
- Title(参考訳): ネストしたLLVMパスパイプラインのSynergy-Guidedコンパイラ自動チューニング
- Authors: Haolin Pan, Jinyuan Dong, Mingjie Xing, Yanjun Wu,
- Abstract要約: 我々は、New Pass Managerのためにゼロから構築された新しい自動チューニングフレームワークを提示する。
我々は,これらの森林を直接操作する構造認識型遺伝的アルゴリズムを開発した。
LLVM 18.1.6を用いて7つのベンチマークデータセットに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 10.570484818376537
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Compiler optimization relies on sequences of passes to improve program performance. Selecting and ordering these passes automatically, known as compiler auto-tuning, is challenging due to the large and complex search space. Existing approaches generally assume a linear sequence of passes, a model compatible with legacy compilers but fundamentally misaligned with the hierarchical design of the LLVM New Pass Manager. This misalignment prevents them from guaranteeing the generation of syntactically valid optimization pipelines. In this work, we present a new auto-tuning framework built from the ground up for the New Pass Manager. We introduce a formal grammar to define the space of valid nested pipelines and a forest-based data structure for their native representation. Upon this foundation, we develop a structure-aware Genetic Algorithm whose operators manipulate these forests directly, ensuring that all candidate solutions are valid by construction. The framework first mines synergistic pass relationships to guide the search. An optional refinement stage further explores subtle performance variations arising from different valid structural arrangements. We evaluate our approach on seven benchmark datasets using LLVM 18.1.6. The discovered pipelines achieve an average of 13.62% additional instruction count reduction compared to the standard opt -Oz optimization level, showing that our framework is capable of navigating this complex, constrained search space to identify valid and effective pass pipelines.
- Abstract(参考訳): コンパイラの最適化は、プログラムのパフォーマンスを改善するためにパスのシーケンスに依存する。
コンパイラ自動チューニングと呼ばれるパスの自動選択と順序付けは、大規模で複雑な検索スペースのために困難である。
既存のアプローチは一般的に、レガシコンパイラと互換性のあるモデルであるが、LLVM New Pass Managerの階層設計と基本的には一致していないパスの線形シーケンスを仮定する。
このミスアライメントにより、構文的に有効な最適化パイプラインの生成が保証されなくなる。
本稿では、New Pass Managerのためにゼロから構築された新しい自動チューニングフレームワークを提案する。
有効なネストパイプラインの空間を定義するための形式文法と,それらの表現のための森林ベースのデータ構造を導入する。
そこで我々は,これらの森林を直接操作し,すべての候補解が構築によって有効であることを保証する構造認識型遺伝的アルゴリズムを開発した。
このフレームワークはまず、検索を導くために相乗的パス関係を掘り下げる。
任意の改良段階は、異なる有効な構造配置から生じる微妙な性能変化をさらに探求する。
LLVM 18.1.6を用いて7つのベンチマークデータセットに対するアプローチを評価した。
検出したパイプラインは,Oz最適化レベルと比較して平均13.62%の命令数削減を実現し,この複雑な制約付き探索空間をナビゲートし,有効かつ有効なパスパイプラインを識別できることを示す。
関連論文リスト
- TreeLoRA: Efficient Continual Learning via Layer-Wise LoRAs Guided by a Hierarchical Gradient-Similarity Tree [52.44403214958304]
本稿では階層的な勾配の類似性を利用して階層型アダプタを構築する新しい手法であるTreeLoRAを紹介する。
タスク類似度推定の計算負担を軽減するために,より低い信頼度境界に基づくアルゴリズムを開発するために,バンド手法を用いる。
視覚変換器 (ViTs) と大規模言語モデル (LLMs) の両方を用いた実験により, 提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2025-06-12T05:25:35Z) - NiaAutoARM: Automated generation and evaluation of Association Rule Mining pipelines [0.8848340429852071]
本稿では,ルールマイニングパイプライン全体を構築するための新しい機械学習手法であるNiaAutoARMを提案する。
また,提案手法の理論的表現とともに,包括的実験評価を行った。
論文 参考訳(メタデータ) (2024-12-30T20:48:51Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Performance Embeddings: A Similarity-based Approach to Automatic
Performance Optimization [71.69092462147292]
パフォーマンス埋め込みは、アプリケーション間でパフォーマンスチューニングの知識伝達を可能にする。
本研究では, 深層ニューラルネットワーク, 密度およびスパース線形代数合成, および数値風速予測ステンシルのケーススタディにおいて, この伝達チューニング手法を実証する。
論文 参考訳(メタデータ) (2023-03-14T15:51:35Z) - Towards Personalized Preprocessing Pipeline Search [52.59156206880384]
ClusterP3Sは、Clusteringを介してパイプライン検索をパーソナライズする新しいフレームワークである。
本稿では,クラスタを協調的に学習し,最適なパイプラインを探索するための階層的探索手法を提案する。
ベンチマーク分類データセットの実験では、機能的に前処理可能なパイプライン探索の有効性が示されている。
論文 参考訳(メタデータ) (2023-02-28T05:45:05Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - Naive Automated Machine Learning [0.0]
事前に定義されたパイプラインスキームの異なるアルゴリズムを分離して最適化します。
孤立した一般化は、探索空間を著しく減少させる。
論文 参考訳(メタデータ) (2021-11-29T13:12:54Z) - Designing Machine Learning Pipeline Toolkit for AutoML Surrogate
Modeling Optimization [18.82755278152806]
我々は、複雑な機械学習パイプライン構造の作成と評価を容易にするAMLPツールキットを作成する。
AMLPを使って最適なパイプラインシグネチャを見つけ、それらをデータマイニングし、これらのデータマイニング機能を使って学習と予測を高速化します。
我々は、AMLP計算時間5分未満で4時間の予算で他のAutoMLアプローチよりも優れたサロゲートモデリングを備えた2段階パイプライン最適化をAMLPで作成した。
論文 参考訳(メタデータ) (2021-07-02T20:06:40Z) - Incremental Search Space Construction for Machine Learning Pipeline
Synthesis [4.060731229044571]
automated machine learning(automl)は、マシンラーニング(ml)パイプラインの自動構築を目的とする。
パイプライン構築のためのメタ機能に基づくデータ中心アプローチを提案する。
確立されたAutoMLベンチマークで使用した28データセットに対して,アプローチの有効性と競争性を実証する。
論文 参考訳(メタデータ) (2021-01-26T17:17:49Z) - AutoWeka4MCPS-AVATAR: Accelerating Automated Machine Learning Pipeline
Composition and Optimisation [13.116806430326513]
本稿では,サロゲートモデル(AVATAR)を用いて,実行せずにMLパイプラインの有効性を評価する手法を提案する。
AVATARは、データセットの特徴に対するMLアルゴリズムの機能と効果を自動的に学習することで、知識ベースを生成する。
AVATARはその妥当性を評価するためにオリジナルのMLパイプラインを実行する代わりに、MLパイプラインコンポーネントの機能と効果によって構築されたサロゲートモデルを評価する。
論文 参考訳(メタデータ) (2020-11-21T14:05:49Z) - AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。
テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。
実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2020-03-14T06:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。