論文の概要: AI-PROPELLER: Warehouse-Scale Interprocedural Code Layout Optimization with AlphaEvolve
- arxiv url: http://arxiv.org/abs/2606.00131v1
- Date: Thu, 28 May 2026 20:43:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:27.990131
- Title: AI-PROPELLER: Warehouse-Scale Interprocedural Code Layout Optimization with AlphaEvolve
- Title(参考訳): AI-PROPELLER:AlphaEvolveによるウェアハウススケールの相互運用コードレイアウト最適化
- Authors: Chaitanya Mamatha Ananda, Rajiv Gupta, Mircea Trofin, Aiden Grossman, Sriraman Tallam, Xinliang David Li, Amir Yazdanbakhsh,
- Abstract要約: ポストリンク(PLO)は、高度に最適化されたバイナリから、正確なプロファイル誘導コードレイアウトを抽出できることを実証している。
Ai-PROPELLERは倉庫規模の大規模アプリケーションを含むいくつかのベンチマークで評価されている。
実験では、最先端のFDOとPLOで最適化された0.23%から1.6%のパフォーマンス改善が示されている。
- 参考スコア(独自算出の注目度): 6.621027271025645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Post-link optimizers (PLOs) such as Propeller and BOLT have demonstrated that precise, profile-guided code layout can extract significant performance gains from heavily optimized binaries. However, these systems are currently restricted to intraprocedural techniques, leaving the global potential of interprocedural layout largely untapped. Interprocedural code layout is historically difficult due to a combinatorially intractable search space and complex call-return semantics that are challenging to model. Consequently, the performance potential of fine-grained interprocedural layout remains unproven in practice. AI-PROPELLER uses Magellan, an agentic workflow that evolves the compiler heuristic in Propeller into a fine-grained interprocedural optimizer and fine-tunes the resulting policy hyperparameters. To ensure high-fidelity, we move away from approximate static cost models and the agentic workflow generates multiple layout variants that are executed on actual hardware to measure real performance counters, providing a precise reward signal for the evolutionary loop. AI-PROPELLER has been evaluated on several benchmarks including large warehouse-scale applications and experiments show performance improvements of 0.23% to 1.6% optimized with state-of-the-art FDO and PLO which is significant for real-world binaries. This is the first time ever that large warehouse-scale applications in industrial settings have been optimized with fine-grained interprocedural code layout.
- Abstract(参考訳): PropellerやBOLTのようなポストリンクオプティマイザ(PLO)は、正確なプロファイル誘導コードレイアウトが高度に最適化されたバイナリから大幅なパフォーマンス向上を引き出すことができることを示した。
しかし、これらのシステムは現在プロシージャ内技術に制限されており、プロシージャ間レイアウトのグローバルな可能性はほとんど残っていない。
言語間のコードレイアウトは、結合的に難解な検索空間と、モデル化が難しい複雑なコール・リターンセマンティクスのため、歴史的に困難である。
その結果、微粒な相互配置の性能は、実際には証明されていない。
AI-PROPELLERはエージェントワークフローであるMagellanを使用し、Propellerのコンパイラヒューリスティックを微粒な命令間オプティマイザに進化させ、結果のポリシハイパーパラメータを微調整する。
高忠実性を確保するため、近似静的コストモデルから離れ、エージェントワークフローは実際のハードウェア上で実行され、実際の性能カウンタを測定するために複数のレイアウト変種を生成し、進化ループの正確な報酬信号を提供する。
AI-PROPELLERは、大規模な倉庫規模のアプリケーションを含むいくつかのベンチマークで評価されており、実世界のバイナリにとって重要な最先端のFDOとPLOで最適化された0.23%から1.6%のパフォーマンス改善が示されている。
産業環境における大規模な倉庫規模のアプリケーションが、きめ細かいプログラム間コードレイアウトで最適化されたのは、これが初めてです。
関連論文リスト
- Agent Factories for High Level Synthesis: How Far Can General-Purpose Coding Agents Go in Hardware Optimization? [8.899459735174174]
本稿では,汎用符号化エージェントが高レベルのアルゴリズム仕様からハードウェア設計をいかに最適化できるかを実証研究する。
複数の自律的最適化エージェントの構築と調整を行う2段階パイプラインであるエージェントファクトリを導入する。
AMD Vitis HLS を用いた Claude Code (Opus4.5/4.6) を用いた HLS-Eval と Rodinia-HLS の 12 個のカーネルに対するアプローチの評価を行った。
論文 参考訳(メタデータ) (2026-03-26T17:57:50Z) - AdaFuse: Accelerating Dynamic Adapter Inference via Token-Level Pre-Gating and Fused Kernel Optimization [84.25316984309725]
動的スパース構造とパラメータ効率のよいアダプタ(例えばLoRA)の統合は、大規模言語モデル(LLM)を拡張するための強力な技術である。
計算負荷は最小限に抑えられるが、計算のレイテンシが急上昇し、復号速度が2.5倍以上遅くなる。
AdaFuseはアルゴリズムと基盤となるハードウェアシステムとの緊密な協調設計に基づいて構築されたフレームワークで、効率的な動的アダプタ実行を実現する。
論文 参考訳(メタデータ) (2026-03-12T12:46:42Z) - ProAct: Agentic Lookahead in Interactive Environments [56.50613398808361]
ProActは、2段階のトレーニングパラダイムを通じて、エージェントが正確なルックアヘッド推論を内部化することを可能にするフレームワークである。
そこでは,環境に基づく探索から得られたトラジェクトリの微調整をエージェントが行うGLAD(Grounded LookAhead Distillation)を紹介する。
また,政策段階のアルゴリズムを改良する補助値推定器であるモンテカルロ批判(MC-Critic)を提案する。
論文 参考訳(メタデータ) (2026-02-05T05:45:16Z) - CLIDD: Cross-Layer Independent Deformable Description for Efficient and Discriminative Local Feature Representation [6.478456907626643]
CLIDD (Cross-Layer Independent Deformable Description) は、独立な特徴階層から直接サンプリングすることで、優れた特徴性を実現する手法である。
リアルタイム性能を確保するため,ハードウェア対応のカーネル融合戦略を実装した。
軽量アーキテクチャとトレーニングプロトコルを統合するスケーラブルなフレームワークを開発する。
論文 参考訳(メタデータ) (2026-01-14T07:03:01Z) - PT$^2$-LLM: Post-Training Ternarization for Large Language Models [52.4629647715623]
大きな言語モデル(LLM)は、様々なタスクにまたがる印象的な機能を示しているが、その大きなメモリと計算能力は、デプロイメントを妨げている。
PT$2$-LLMを提案する。
その中核は2段精製パイプラインを備えた非対称3次量子化器である。
論文 参考訳(メタデータ) (2025-09-27T03:01:48Z) - LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.35609820607923]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。
LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。
LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文 参考訳(メタデータ) (2025-08-16T02:00:57Z) - syftr: Pareto-Optimal Generative AI [40.80352098169579]
syftrはエージェントと非エージェントのRAG構成の広い領域で効率的な多目的探索を行うフレームワークである。
Syftrは、最も正確な流れの正確さを保ちながら、平均して9倍のコストで流れを見つける。
論文 参考訳(メタデータ) (2025-05-26T17:43:13Z) - Large language models as uncertainty-calibrated optimizers for experimental discovery [4.968931211284832]
本稿では,従来の最適化手法の不確実性を考慮した言語モデルのトレーニングにより,自然言語インタフェースによる信頼度向上が実現可能であることを示す。
提案手法は, 高収率反応条件の発見率を24%から43%にほぼ倍増させる。
論文 参考訳(メタデータ) (2025-04-08T17:59:57Z) - Global Optimization of Gaussian processes [52.77024349608834]
少数のデータポイントで学習したガウス過程を訓練した空間定式化を提案する。
このアプローチはまた、より小さく、計算的にもより安価なサブソルバを低いバウンディングに導く。
提案手法の順序の順序による時間収束を,総じて低減する。
論文 参考訳(メタデータ) (2020-05-21T20:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。