Fugu-MT 論文翻訳(概要): CryptOpt: Automatic Optimization of Straightline Code

関連論文リスト

Accelerating the Tesseract Decoder for Quantum Error Correction [1.0037458982330154]
Tesseractは量子エラー補正のための新しいMLEデコーダである本稿では,低レベル性能向上によるTesseractデコーダの最適化手法を提案する。
論文参考訳（メタデータ） (2026-02-03T01:46:51Z)
Decryption Through Polynomial Ambiguity: Noise-Enhanced High-Memory Convolutional Codes for Post-Quantum Cryptography [0.0]
本稿では,雑音強調高メモリ畳み込み符号の直接復号化を利用したポスト量子暗号への新しいアプローチを提案する。提案手法は、構造攻撃を効果的に隠蔽し抵抗するランダムな発電機行列を生成する。
論文参考訳（メタデータ） (2025-12-02T14:30:03Z)
OpenQudit: Extensible and Accelerated Numerical Quantum Compilation via a JIT-Compiled DSL [0.4264192013842096]
本稿では,量子演算を象徴的に定義できるコンパイルフレームワークOpenQuditを紹介する。 OpenQuditの事前コンパイルではテンソルネットワーク表現とeグラフベースのパスを使ってシンボリックな単純化を行っている。評価の結果、このシンボリックアプローチは非常に効果的であり、一般的な量子回路合成問題に対して最大$mathtsim20times$でコアインスタンス化タスクを加速することが示された。
論文参考訳（メタデータ） (2025-11-20T17:37:42Z)
The Fast for the Curious: How to accelerate fault-tolerant quantum applications [101.46859364118622]
我々は、フォールトトレラント量子計算の実行時間を削減するための戦略を評価する。ハードウェア,フォールトトレランス,アルゴリズム的サブルーチンの共設計が実行時間を短縮する方法について論じる。
論文参考訳（メタデータ） (2025-10-30T02:27:55Z)
Towards a Functionally Complete and Parameterizable TFHE Processor [3.907410857035328]
TFHEは高速トーラスベースの完全同型暗号方式である。これは、他のどのFHEスキームよりも高速なブートストラップ動作性能を提供する。ホモモルフィック回路の評価には計算オーバーヘッドがかなり高い。本稿では,同相回路評価のためのFPGAベースのハードウェアアクセラレータを提案する。
論文参考訳（メタデータ） (2025-10-27T16:16:40Z)
Autocomp: LLM-Driven Code Optimization for Tensor Accelerators [7.384883165968798]
Autocompは、アクセラレータープログラマがドメイン知識とハードウェアフィードバックを利用してコードを最適化することを可能にするアプローチである。我々はAutocomp最適化コードがベンダーが提供するライブラリよりも高速に5.6倍(GEMM)と2.7倍(畳み込み)を実行することを示した。
論文参考訳（メタデータ） (2025-05-24T07:35:34Z)
Constant-time hybrid compilation of Shor's algorithm with quantum just-in-time compilation [0.0]
この研究は、PennyLaneとCatalystを使って素量子ゲートにコンパイルされたShorのファクタリングアルゴリズムの実装を提供する。 QJITコンパイルでは,回路生成に$N$固有の最適化を適用した場合でも,そのアルゴリズムは1ビットあたり$N$でコンパイルされることを示す。実装は32ビット$N$までベンチマークされ、コンパイルされたプログラムのサイズと純粋なコンパイル時間の両方が一定であることが判明した。
論文参考訳（メタデータ） (2025-04-16T19:30:10Z)
Cheddar: A Swift Fully Homomorphic Encryption Library for CUDA GPUs [2.613335121517245]
FHE(Fully homomorphic encryption)は、クラウドコンピューティングにおけるセキュリティとプライバシの問題を解決するための暗号化技術である。 FHEは、暗号化されたデータを処理するための膨大な計算オーバーヘッドを導入し、FHEワークロードは暗号化されていないワークロードよりも2～6桁遅くなりました。本稿では,GPUのFHEライブラリであるCheddarを提案する。
論文参考訳（メタデータ） (2024-07-17T23:49:18Z)
Fast Chain-of-Thought: A Glance of Future from Parallel Decoding Leads to Answers Faster [61.83949316226113]
FastCoTは並列デコーディングに基づくモデルに依存しないフレームワークである。我々は、FastCoTが通常のアプローチと比較して、無視できる性能低下だけで、推論時間を20%近く削減できることを示します。
論文参考訳（メタデータ） (2023-11-14T15:56:18Z)
LoopTune: Optimizing Tensor Computations with Reinforcement Learning [43.82827359317833]
LoopTuneは、CPUのディープラーニングモデルにおけるテンソル計算を最適化するコンパイラである。グラフベースの新しい表現とアクション空間により、LoopTuneはLoopNestを3.2倍高速化し、TVMより桁違いに高速なコードを生成し、MetaScheduleより2.8倍速く、AutoTVMより1.08倍高速なコードを生成する。
論文参考訳（メタデータ） (2023-09-04T21:30:15Z)
Harnessing Deep Learning and HPC Kernels via High-Level Loop and Tensor Abstractions on CPU Architectures [67.47328776279204]
この研究は、効率的でポータブルなDeep LearningとHigh Performance Computingカーネルを開発するためのフレームワークを導入している。 1)プロセッシングプリミティブ(TPP)を用いた計算コアの表現と,2)高レベルな宣言的手法でTPPのまわりの論理ループの表現の2つのステップでカーネルの開発を分解する。我々は、スタンドアロンカーネルと、さまざまなCPUプラットフォームにおける最先端実装よりも優れたエンドツーエンドワークロードを使用して、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2023-04-25T05:04:44Z)
DeepGEMM: Accelerated Ultra Low-Precision Inference on CPU Architectures using Lookup Tables [49.965024476651706]
DeepGEMMはSIMDハードウェア上で超高精度畳み込みニューラルネットワークを実行するためのルックアップテーブルベースのアプローチである。実装は、x86プラットフォーム上で、対応する8ビット整数カーネルを最大1.74倍の性能で上回る。
論文参考訳（メタデータ） (2023-04-18T15:13:10Z)
Practical Conformer: Optimizing size, speed and flops of Conformer for on-Device and cloud ASR [67.63332492134332]
我々は、デバイス上の制約を満たすのに十分小さく、TPUを高速に推論できる最適化されたコンバータを設計する。提案するエンコーダは、デバイス上では強力なスタンドアロンエンコーダとして、また高性能なASRパイプラインの第1部として利用することができる。
論文参考訳（メタデータ） (2023-03-31T23:30:48Z)
Learning Performance-Improving Code Edits [107.21538852090208]
本稿では,大規模言語モデル(LLM)を高レベルプログラム最適化に適用するためのフレームワークを提案する。まず、競争力のある77,000以上のC++プログラミングサブミッションペアによる、人間のプログラマによるパフォーマンス改善編集のデータセットをキュレートする。提案手法は,検索をベースとした少数ショットプロンプトとチェーン・オブ・シンクレットを提案し,その微調整には,自己再生に基づく性能条件付き生成と合成データ拡張が含まれる。
論文参考訳（メタデータ） (2023-02-15T18:59:21Z)
A High Performance Compiler for Very Large Scale Surface Code Computations [38.26470870650882]
大規模量子誤り訂正のための最初の高性能コンパイラを提案する。任意の量子回路を格子手術に基づく表面符号演算に変換する。コンパイラは、物理デバイスのリアルタイム操作に向けられた速度で、ストリーミングパイプラインを使用して数百万のゲートを処理することができる。
論文参考訳（メタデータ） (2023-02-05T19:06:49Z)
CryptOpt: Verified Compilation with Randomized Program Search for Cryptographic Primitives (full version) [12.790826917588575]
暗号は例外であり、多くのパフォーマンスクリティカルなルーチンがアセンブリで直接書かれてきた。 CryptOptは、GCCやClangが生成するものよりもはるかに高速なアセンブリコードに高レベルの暗号関数プログラムを専門とする、最初のコンパイルパイプラインである。形式検証の面では、FiatOptフレームワーク(関数型プログラムをCライクなIRコードに変換する)に接続し、新たに公式に認証されたプログラム等価チェッカーで拡張する。
論文参考訳（メタデータ） (2022-11-19T11:07:39Z)
Securing Optimized Code Against Power Side Channels [1.589424114251205]
セキュリティエンジニアは、コンパイラの最適化をオフにしたり、ローカルでコンパイル後の変換を実行することで、コードの効率を犠牲にすることが多い。本稿では,最適化されたセキュアなコードを生成する制約ベースのコンパイラであるSecConCGを提案する。
論文参考訳（メタデータ） (2022-07-06T12:06:28Z)
PolyDL: Polyhedral Optimizations for Creation of High Performance DL primitives [55.79741270235602]
本稿では,Deep Learningプリミティブの高性能実装を自動的に生成するコンパイラアルゴリズムを提案する。我々は多面体モデルを用いた新しいデータ再利用分析アルゴリズムを開発した。また、このようなハイブリッドコンパイラとライブラリ使用の最小限のアプローチが、最先端のパフォーマンスをもたらすことを示す。
論文参考訳（メタデータ） (2020-06-02T06:44:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: CryptOpt: Automatic Optimization of Straightline Code

関連論文リスト