論文の概要: Adapting AlphaEvolve to Optimize Fully Homomorphic Encryption on TPUs
- arxiv url: http://arxiv.org/abs/2605.14718v1
- Date: Thu, 14 May 2026 11:39:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.799115
- Title: Adapting AlphaEvolve to Optimize Fully Homomorphic Encryption on TPUs
- Title(参考訳): 完全同型暗号化を最適化するAlphaEvolveのTPUへの適応
- Authors: Shruthi Gorantala, Jianming Tong, Asra Ali, Baiyu Li, Jonathan Katz, Jeremy Kun, Thomas Steinke, Abhradeep Thakurta, Julian Walker, Amir Yazdanbakhsh,
- Abstract要約: 我々はAlphaEvolveを使ってハードウェア対応暗号-カーネル最適化の探索を自動化する。
Google Cloud TPUv5e上でTFHE(Jaxite)とCKKS(CROSS)のFHEスキームのプリミティブに対するAlphaEvolve最適化を評価する。
自動探索から24時間以内に、AlphaEvolveはTFHEブートストラップのレイテンシを2.5倍に、CKKSローテーションと乗算のレイテンシを1.31倍に改善する実装レベルの最適化を発見した。
- 参考スコア(独自算出の注目度): 22.823899868762364
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of Fully Homomorphic Encryption (FHE) at scale is hindered due to its heavy computational overhead. While specialized hardware accelerators like Google Tensor Processing Units (TPUs) can help, mapping complex cryptographic kernels onto such architectures remains a challenge. Efficient execution requires co-optimization between the systolic array-based Matrix Multiplication Unit (MXU) and Vector Processing Units (VPUs), as well as the orchestration of data movement across the vector register files. Existing compiler stacks often abstract low-level hardware utilization, requiring developers to adopt a manual trial-and-error process that often results in fragmented execution and underutilized resources. To accelerate this development process, we use AlphaEvolve to automate the exploration of hardware-aware cryptographic-kernel optimizations. We frame optimization as an evolutionary search problem, utilizing the closed-loop system provided by AlphaEvolve, that leverages LLM-driven code generation. We use real-world feedback from hardware execution and rigorous correctness testing to guide the evolution process. We evaluate AlphaEvolve optimization on primitives for both the TFHE (Jaxite) and CKKS (CROSS) FHE schemes on Google Cloud TPUv5e, a contemporary TPU architecture. Within 24 hours of automated exploration, AlphaEvolve discovered implementation-level optimizations that improve TFHE bootstrap latency by 2.5x and CKKS rotation and multiplication latency by 1.31x and 1.18x, respectively, relative to human-engineered state of the art. These results demonstrate that AlphaEvolve can be used to enable researchers to navigate the optimization trade-offs between cryptography, compilers, and hardware accelerators.
- Abstract(参考訳): FHE(Fully Homomorphic Encryption)の大規模展開は、計算オーバーヘッドが重いために妨げられている。
Google Tensor Processing Units(TPU)のような特殊なハードウェアアクセラレーターは役に立つが、複雑な暗号カーネルをそのようなアーキテクチャにマッピングすることは依然として困難である。
効率的な実行には、systolic array-based Matrix Multiplication Unit (MXU) と Vector Processing Units (VPU) の同時最適化と、ベクトルレジスタファイル間のデータ移動のオーケストレーションが必要である。
既存のコンパイラスタックは、しばしば低レベルのハードウェア利用を抽象化し、開発者は手動による試行錯誤プロセスを採用する必要がある。
この開発プロセスの高速化のために、AlphaEvolveを使用してハードウェア対応の暗号カーネル最適化の探索を自動化する。
我々は、LLM駆動コード生成を利用するAlphaEvolveが提供するクローズドループシステムを利用して、進化的探索問題として最適化を行う。
ハードウェア実行からの現実的なフィードバックと厳密な正当性テストを使って進化過程をガイドしています。
我々は、現在のTPUアーキテクチャであるGoogle Cloud TPUv5e上でTFHE(Jaxite)とCKKS(CROSS)のFHEスキームのプリミティブに対するAlphaEvolve最適化を評価する。
自動探索から24時間以内に、AlphaEvolveはTFHEブートストラップのレイテンシを2.5倍、CKKSローテーションと乗算のレイテンシを1.31倍と1.18倍改善する実装レベルの最適化を発見した。
これらの結果は、AlphaEvolveを使うことで、研究者が暗号、コンパイラ、ハードウェアアクセラレータ間のトレードオフを最適化できることを示している。
関連論文リスト
- Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts [25.264078143000045]
現在の自動カーネル最適化手法は、科学計算におけるスパースマトリクス操作のようなより広い領域を見渡しながら、機械学習アプリケーションに焦点を当てている。
本稿では,MSBenchを導入したマルチシナリオ設定の体系的評価の欠如に対処する。
このベンチマークに基づいて、GPUプロファイリング情報を活用し、完全なコンパイルおよび実行ツールチェーンを自動構築する、カーネル最適化のためのハードウェア対応システムであるMSMasterを紹介する。
論文 参考訳(メタデータ) (2026-03-07T12:22:43Z) - K-Search: LLM Kernel Generation via Co-Evolving Intrinsic World Model [57.440609834690385]
既存のアプローチでは、進化ループ内の高速コードジェネレータとして、LLM(Large Language Models)を扱います。
我々は,共進化的世界モデルによる検索を提案し,この手法に基づいてK-Searchを構築する。
GQA, MLA, MoE カーネルを含む多種多様な複雑なカーネル上で K-Search を評価する。
論文 参考訳(メタデータ) (2026-02-22T11:06:22Z) - PEAK: A Performance Engineering AI-Assistant for GPU Kernels Powered by Natural Language Transformations [0.8699280339422538]
我々は、自然言語変換を利用したカーネルのためのパフォーマンスエンジニアリングAIアシストであるPEAKを紹介する。
実装が利用可能な場合、ベンダーライブラリと競合し、(ライブラリなしで)HLSLについては、ドキュメント化されたFLOPSです。
論文 参考訳(メタデータ) (2025-12-22T04:15:24Z) - AlphaEvolve: A coding agent for scientific and algorithmic discovery [63.13852052551106]
我々は,最先端LLMの能力を大幅に向上させる進化的符号化エージェントAlphaEvolveを提案する。
AlphaEvolveはLLMの自律パイプラインを編成し、そのタスクはコードを直接変更することでアルゴリズムを改善することである。
本稿では,多くの重要な計算問題に適用することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2025-06-16T06:37:18Z) - Leveraging ASIC AI Chips for Homomorphic Encryption [12.209134343914537]
ホモモルフィック暗号化(HE)は強力なプライバシー保証を提供するが、平文での計算よりもはるかに多くのリソースを必要とする。
このレイテンシ問題を緩和するためにアクセラレータが登場したが、ASICのコストが高い。
HEプリミティブは、すでにクラウドに広くデプロイされているTPUのような既存のASIC AIアクセラレータ上で、AIオペレータに変換され、アクセラレーションされることを示す。
論文 参考訳(メタデータ) (2025-01-13T04:08:14Z) - Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。
1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。
我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-25T05:04:44Z) - evosax: JAX-based Evolution Strategies [0.0]
evosaxは進化最適化アルゴリズムのJAXベースのライブラリです。
evosaxは30の進化最適化アルゴリズムを実装している。
モジュラー方式で設計されており、シンプルなRequest-evaluate-tell APIを通じてフレキシブルな使用を可能にする。
論文 参考訳(メタデータ) (2022-12-08T10:34:42Z) - PolyScientist: Automatic Loop Transformations Combined with Microkernels
for Optimization of Deep Learning Primitives [55.79741270235602]
深層学習カーネル開発のためのハイブリッドソリューションを開発する。
我々は、高度な多面体技術を用いて、パフォーマンスのために外部ループを自動的に調整する。
論文 参考訳(メタデータ) (2020-02-06T08:02:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。