論文の概要: Evolution of Kernels: Automated RISC-V Kernel Optimization with Large Language Models
- arxiv url: http://arxiv.org/abs/2509.14265v1
- Date: Sun, 14 Sep 2025 08:11:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:52.895108
- Title: Evolution of Kernels: Automated RISC-V Kernel Optimization with Large Language Models
- Title(参考訳): カーネルの進化:大規模言語モデルを用いたRISC-Vカーネルの自動最適化
- Authors: Siyuan Chen, Zhichao Lu, Qingfu Zhang,
- Abstract要約: 大規模言語モデル(LLM)は、自動化されたカーネル最適化の約束を示し、包括的な技術ドキュメントと成熟した不足を伴うドメインの成功を示している。
本稿では,LLMベースの進化的プログラム検索フレームワークであるEvolution of Kernels(EoK)について紹介する。
EoKは中央値1.27倍のスピードアップを達成した。
- 参考スコア(独自算出の注目度): 26.985412258634256
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated kernel design is critical for overcoming software ecosystem barriers in emerging hardware platforms like RISC-V. While large language models (LLMs) have shown promise for automated kernel optimization, demonstrating success in CUDA domains with comprehensive technical documents and mature codebases, their effectiveness remains unproven for reference-scarce domains like RISC-V. We present Evolution of Kernels (EoK), a novel LLM-based evolutionary program search framework that automates kernel design for domains with limited reference material. EoK mitigates reference scarcity by mining and formalizing reusable optimization ideas (general design principles + actionable thoughts) from established kernel libraries' development histories; it then guides parallel LLM explorations using these ideas, enriched via Retrieval-Augmented Generation (RAG) with RISC-V-specific context, prioritizing historically effective techniques. Empirically, EoK achieves a median 1.27x speedup, surpassing human experts on all 80 evaluated kernel design tasks and improving upon prior LLM-based automated kernel design methods by 20%. These results underscore the viability of incorporating human experience into emerging domains and highlight the immense potential of LLM-based automated kernel optimization.
- Abstract(参考訳): 自動カーネル設計は、RISC-Vのような新興ハードウェアプラットフォームにおけるソフトウェアエコシステムの障壁を克服するために重要である。
大規模言語モデル(LLM)は、カーネルの自動最適化を約束し、包括的な技術ドキュメントと成熟したコードベースを持つCUDAドメインの成功を証明しているが、RISC-Vのような参照スカースドメインでは、その有効性は証明されていない。
本稿では,LLMベースの進化的プログラム検索フレームワークであるEvolution of Kernels(EoK)について紹介する。
EoKは、確立されたカーネルライブラリの開発履歴から再利用可能な最適化のアイデア(一般的な設計原則と実行可能な思想)をマイニングし、形式化することで、参照不足を緩和する。
実証的には、EoKは中央値1.27倍のスピードアップを達成し、評価された80のカーネル設計タスクに関する専門家を抜いて、以前のLLMベースの自動カーネル設計手法を20%改善した。
これらの結果は、人間の経験を新興ドメインに組み込むことの可能性を浮き彫りにして、LLMベースの自動カーネル最適化の潜在可能性を強調している。
関連論文リスト
- Composable OS Kernel Architectures for Autonomous Intelligence [0.0]
本研究では、カーネルを静的リソースマネージャからAI統合プラットフォームに変換する、インテリジェントシステムのための新しいOSカーネルアーキテクチャを提案する。
主なコントリビューションは、LKM(Loadable Kernel Modules)を、カーネル空間における高速な知覚および認知処理のためのAI指向ユニットとして扱うこと、(2)Linuxカーネルを、組み込みのディープラーニング推論、浮動小数点加速度、効率的なMLワークロードのためのリアルタイム適応スケジューリングを備えたAIネイティブ環境に拡張すること、などである。
論文 参考訳(メタデータ) (2025-08-01T13:07:16Z) - GPU Kernel Scientist: An LLM-Driven Framework for Iterative Kernel Optimization [0.0]
本稿では,アクセルカーネルを反復精製する自動化手法を提案する。
本手法は多段階進化過程においてLLMを用いる。
このアプローチがAMD MI300ターゲットアーキテクチャの課題をどのようにナビゲートするかを詳述する。
論文 参考訳(メタデータ) (2025-06-25T19:59:34Z) - Blind Super-Resolution via Meta-learning and Markov Chain Monte Carlo Simulation [46.5310645609264]
本稿では,メタラーニングとマルコフ・チェイン・モンテカルロに基づくSISRアプローチを提案する。
軽量ネットワークがカーネルジェネレータとして採用され、ランダムガウス分布のMCMCシミュレーションから学習することで最適化される。
カーネルジェネレータと画像復元器を最適化するために,メタラーニングに基づく交互最適化手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T07:50:15Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - Optimization-Inspired Learning with Architecture Augmentations and
Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。
フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。
低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文 参考訳(メタデータ) (2020-12-10T03:24:53Z) - PolyScientist: Automatic Loop Transformations Combined with Microkernels
for Optimization of Deep Learning Primitives [55.79741270235602]
深層学習カーネル開発のためのハイブリッドソリューションを開発する。
我々は、高度な多面体技術を用いて、パフォーマンスのために外部ループを自動的に調整する。
論文 参考訳(メタデータ) (2020-02-06T08:02:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。