論文の概要: Optimas: An Intelligent Analytics-Informed Generative AI Framework for Performance Optimization
- arxiv url: http://arxiv.org/abs/2604.23892v1
- Date: Sun, 26 Apr 2026 21:34:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.665782
- Title: Optimas: An Intelligent Analytics-Informed Generative AI Framework for Performance Optimization
- Title(参考訳): Optimas: パフォーマンス最適化のためのIntelligent Analytics-Informed Generative AI Framework
- Authors: Mohammad Zaeed, Tanzima Z. Islam, Vladimir Indic,
- Abstract要約: Optimasは、マルチエージェントワークフロー上に構築された、モジュール化された、完全に自動化されたエンドツーエンドのAI生成フレームワークである。
パフォーマンス診断を、確立された文献ベースのコード変換にマッピングする。
100%正しいコードを生成し、98.82%以上の実験で性能を向上させる。
- 参考スコア(独自算出の注目度): 0.6117371161379209
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) show promise for automated code optimization. However, without performance context, they struggle to produce correct and effective code transformations. Existing performance tools can identify bottlenecks but stop short of generating actionable code changes. Consequently, performance optimization continues to be a time-intensive and manual endeavor, typically undertaken only by experts with detailed architectural understanding. To bridge this gap, we introduce Optimas, a modular, fully automated, end-to-end generative AI framework built on a multi-agent workflow. Optimas uses LLMs to map performance diagnostics from multiple reports to established, literature-backed code transformations, while unifying insight extraction, code generation, execution, and validation within a single pipeline. Across 3,410 real-world experiments on 10 benchmarks and two HPC mini-applications, Optimas generates 100% correct code and improves performance in over 98.82% of those experiments, achieving average gains of 8.02%-79.09% on NVIDIA GPUs.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自動化されたコードの最適化を約束する。
しかし、パフォーマンスのコンテキストがなければ、正しい効果的なコード変換を生成するのに苦労する。
既存のパフォーマンスツールはボトルネックを特定することができるが、実行可能なコード変更の生成を止めることができる。
結果として、パフォーマンスの最適化は時間集約的で手作業的な取り組みであり続けており、通常は詳細なアーキテクチャ理解を持つ専門家によって行われる。
このギャップを埋めるために、マルチエージェントワークフロー上に構築されたモジュール化された、完全に自動化されたエンドツーエンドの生成AIフレームワークであるOptimasを紹介します。
OptimasはLLMを使用して、複数のレポートから確立された文献ベースのコード変換へのパフォーマンス診断をマッピングすると同時に、洞察抽出、コード生成、実行、バリデーションを単一のパイプライン内で統一する。
10のベンチマークと2つのHPCミニアプリケーションに関する実世界の3,410回にわたる実験で、Optimasは100%正しいコードを生成し、98.82%以上でパフォーマンスを改善し、GPUGPUの平均ゲインは8.02%-79.09%に達した。
関連論文リスト
- FasterPy: An LLM-based Code Execution Efficiency Optimization Framework [11.766544835516974]
コードはしばしばパフォーマンスのバグに悩まされる。
従来のルールベースのメソッドは、特定のパフォーマンスバグに対するルールを手動で設計し、保守することに依存しています。
我々は,Pythonコードの実行効率を最適化するために,大規模言語モデルを適用するフレームワークであるFasterPyを提案する。
論文 参考訳(メタデータ) (2025-12-28T07:43:08Z) - PerfCoder: Large Language Models for Interpretable Code Performance Optimization [15.79612555952707]
PerfCoderは、ソースコードからパフォーマンス向上したコードを生成するために設計された、大規模な言語モデル(LLM)のファミリーである。
PerfCoderは、人間が読めるアノテーションで、現実世界の最適化トラジェクトリのキュレートされたコレクションに微調整されている。
PerfCoderは、実行時のスピードアップと効率的な最適化率の両方で、既存のモデルをすべて上回っている。
論文 参考訳(メタデータ) (2025-12-16T02:30:04Z) - SWE-fficiency: Can Language Models Optimize Real-World Repositories on Real Workloads? [22.075705411944895]
SWE-fficiencyは、実際のワークロードにおけるリポジトリレベルのパフォーマンス最適化を評価するためのベンチマークである。
私たちのスイートには、9つの広く使用されているデータサイエンス、機械学習、HPCリポジトリにわたる498のタスクが含まれています。
論文 参考訳(メタデータ) (2025-11-08T17:55:09Z) - Fake Runs, Real Fixes -- Analyzing xPU Performance Through Simulation [4.573673188291683]
機械コードレベルでMLモデルを分析するための詳細な方法論であるxPU-Sharkを提案する。
xPU-Sharkは、アクセラレータ上で動作する運用デプロイメントのトレースをキャプチャして、修正されたマイクロアーキテクチャシミュレータで再生する。
共通通信集合を最大15%まで最適化し、トークン生成遅延を最大4.1%削減する。
論文 参考訳(メタデータ) (2025-03-18T23:15:02Z) - A Problem-Oriented Perspective and Anchor Verification for Code Optimization [43.28045750932116]
大規模言語モデル(LLM)は、様々なプログラミングタスクを解く際、顕著な能力を示している。
本稿では,LLMが最小実行時間に最適化する能力について検討する。
論文 参考訳(メタデータ) (2024-06-17T16:10:10Z) - CompilerDream: Learning a Compiler World Model for General Code Optimization [58.87557583347996]
汎用コード最適化のためのモデルベース強化学習手法であるCompilerDreamを紹介する。
最適化パスの固有の特性を正確にシミュレートするコンパイラの世界モデルと、このモデルで訓練されたエージェントから、効率的な最適化戦略を生成する。
さまざまなデータセットを網羅し、LLVMのビルトイン最適化や、値予測とエンドツーエンドコード最適化の両方の設定における最先端メソッドを超越している。
論文 参考訳(メタデータ) (2024-04-24T09:20:33Z) - Learning Performance-Improving Code Edits [107.21538852090208]
本稿では,大規模言語モデル(LLM)を高レベルプログラム最適化に適用するためのフレームワークを提案する。
まず、競争力のある77,000以上のC++プログラミングサブミッションペアによる、人間のプログラマによるパフォーマンス改善編集のデータセットをキュレートする。
提案手法は,検索をベースとした少数ショットプロンプトとチェーン・オブ・シンクレットを提案し,その微調整には,自己再生に基づく性能条件付き生成と合成データ拡張が含まれる。
論文 参考訳(メタデータ) (2023-02-15T18:59:21Z) - VeLO: Training Versatile Learned Optimizers by Scaling Up [67.90237498659397]
私たちは、ディープラーニングの成功の背後にある同じスケーリングアプローチを活用して、汎用性を学びます。
私たちは、パラメータの更新を取り込み出力する小さなニューラルネットワークであるディープラーニングのためのインジェクションをトレーニングします。
学習したメタトレーニングコード、関連するトレインテストデータ、およびvelo-code.ioのベースラインを備えた広範なベンチマークスイートをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2022-11-17T18:39:07Z) - Learning to Superoptimize Real-world Programs [79.4140991035247]
本稿では,ニューラルシークエンス・ツー・シーケンス・モデルを用いて,実世界のプログラムを最適化するフレームワークを提案する。
我々は、x86-64アセンブリでオープンソースプロジェクトから抽出された25万以上の実世界の関数からなるデータセットであるBig Assemblyベンチマークを紹介した。
論文 参考訳(メタデータ) (2021-09-28T05:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。