論文の概要: Algorithms for Improving the Automatically Synthesized Instruction Set of an Extensible Processor
- arxiv url: http://arxiv.org/abs/2401.00772v1
- Date: Mon, 1 Jan 2024 14:33:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 12:57:08.125540
- Title: Algorithms for Improving the Automatically Synthesized Instruction Set of an Extensible Processor
- Title(参考訳): 拡張性プロセッサの自動合成命令セット改善のためのアルゴリズム
- Authors: Peter Sovietov,
- Abstract要約: 本稿では、既知のアプローチに加えて、使用可能なアルゴリズムを検討し、合成された命令セットを改善する。
Magma暗号テストでは、共通オペレーションクラスタリングアルゴリズムにより、コンパイルされたコードのサイズを10%削減できる。
AES暗号テストでは、置換関数アルゴリズムにより、合成した命令セットの拡張サイズを2.5倍に削減できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Processors with extensible instruction sets are often used today as programmable hardware accelerators for various domains. When extending RISC-V and other similar extensible processor architectures, the task of designing specialized instructions arises. This task can be solved automatically by using instruction synthesis algorithms. In this paper, we consider algorithms that can be used in addition to the known approaches and improve the synthesized instruction sets by recomputing common operations (the result of which is consumed by multiple operations) of a program inside clustered synthesized instructions (common operations clustering algorithm), and by identifying redundant (which have equivalents among the other instructions) synthesized instructions (subsuming functions algorithm). Experimental evaluations of the developed algorithms are presented for the tests from the domains of cryptography and three-dimensional graphics. For Magma cipher test, the common operations clustering algorithm allows reducing the size of the compiled code by 9%, and the subsuming functions algorithm allows reducing the synthesized instruction set extension size by 2 times. For AES cipher test, the common operations clustering algorithm allows reducing the size of the compiled code by 10%, and the subsuming functions algorithm allows reducing the synthesized instruction set extension size by 2.5 times. Finally, for the instruction set extension from Volume Ray-Casting test, the additional use of subsuming functions algorithm allows reducing problem-specific instruction extension set size from 5 to only 2 instructions without losing its functionality.
- Abstract(参考訳): 拡張可能な命令セットを持つプロセッサは、今日では様々なドメインのプログラム可能なハードウェアアクセラレータとしてよく使われている。
RISC-Vや他の拡張可能なプロセッサアーキテクチャを拡張する際には、特別な命令を設計するタスクが発生する。
このタスクは、命令合成アルゴリズムを用いて自動的に解決できる。
本稿では、クラスタ化された合成命令(共通操作クラスタリングアルゴリズム)内のプログラムの共通操作(複数の操作によって消費される結果)を再計算し、冗長な(他の命令と等価な)合成命令(仮定関数アルゴリズム)を同定することにより、既知のアプローチに加えて使用可能なアルゴリズムを検討し、合成命令セットを改善する。
開発したアルゴリズムの実験的評価を,暗号と3次元グラフィックの領域で行った。
Magma 暗号テストでは、共通演算クラスタリングアルゴリズムはコンパイルされたコードのサイズを9%削減し、置換関数アルゴリズムは合成された命令セットの拡張サイズを2倍削減できる。
AES暗号テストでは、共通演算クラスタリングアルゴリズムはコンパイルされたコードのサイズを10%削減し、置換関数アルゴリズムは合成された命令セットの拡張サイズを2.5倍削減できる。
最後に,Volume Ray-Castingテストからの命令セット拡張に対して,代入関数アルゴリズムを用いることで,機能を失うことなく,問題固有の命令拡張セットのサイズを5から2に減らすことができる。
関連論文リスト
- A High-Speed Hardware Algorithm for Modulus Operation and its Application in Prime Number Calculation [0.0]
提案アルゴリズムは加算演算,減算演算,論理演算,ビットシフト演算のみを用いる。
暗号化アプリケーションにおけるスケーラビリティの課題に対処する。
このアルゴリズムを50,000までの素数計算に適用すると、実用性と性能上の利点が示される。
論文 参考訳(メタデータ) (2024-07-17T13:24:52Z) - A Method for Efficient Heterogeneous Parallel Compilation: A Cryptography Case Study [8.06660833012594]
本稿では,多様なハードウェアアーキテクチャにまたがるデータ管理と並列計算を最適化するために,ハイパーという新しいMLIRベースの方言を提案する。
HETOCompilerは,複数のハッシュアルゴリズムを実装し,不均一なシステム上での実行を可能にする,暗号に着目したコンパイラのプロトタイプである。
論文 参考訳(メタデータ) (2024-07-12T15:12:51Z) - GreedyML: A Parallel Algorithm for Maximizing Submodular Functions [2.9998889086656586]
分散メモリマルチプロセッサ上での単調部分モジュラ関数の最大化のための並列近似アルゴリズムについて述べる。
我々の研究は、データ要約、機械学習、グラフスカラー化といった分野における実践的な応用のために、大規模データセットのサブモジュラー最適化問題を解決する必要性によって動機付けられている。
論文 参考訳(メタデータ) (2024-03-15T14:19:09Z) - Deep Learning Assisted Multiuser MIMO Load Modulated Systems for
Enhanced Downlink mmWave Communications [68.96633803796003]
本稿では, マルチユーザ負荷変調アレイ (MU-LMA) に着目し, マイクロウェーブ (mmWave) マルチインプット・マルチアウトプット (MIMO) システムにおいて, マルチユーザ負荷変調アレイ (MU-LMA) の小型化とコスト削減を図っている。
ダウンリンクMU-LMAの既存のプリコーディングアルゴリズムは、自由度と複雑なシステム構成の低下に悩まされるサブアレイ構造化(SAS)送信機に依存している。
本稿では,FAS (Full-array Structured) 送信機を用いたMU-LMAシステムを提案し,それに応じて2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-11-08T08:54:56Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Efficient algorithms to solve atom reconfiguration problems. II. The
assignment-rerouting-ordering (aro) algorithm [51.02512563152503]
原子再構成問題は原子の問題を迅速かつ効率的に解く必要がある。
原子再構成問題を解決する典型的なアプローチは、どの原子をどのトラップに移動させるかを決定する代入アルゴリズムを使用することである。
このアプローチは、置換原子の数や各原子が置換される回数を最適化しない。
原子再構成問題の解法において,代入型アルゴリズムの性能を向上させるために,代入型順序付けアルゴリズム(aro)を提案する。
論文 参考訳(メタデータ) (2022-12-11T19:48:25Z) - Accelerating ERM for data-driven algorithm design using output-sensitive techniques [26.32088674030797]
データ駆動型アルゴリズム設計のための効率的な学習アルゴリズムを開発するための技術について研究する。
提案手法は,超平面の集合によって誘導されるポリトープを列挙する出力感受性アルゴリズムである。
本稿では、価格問題、リンクベースのクラスタリング、動的プログラミングに基づくシーケンスアライメントのアルゴリズムを提供することにより、我々の技術を説明する。
論文 参考訳(メタデータ) (2022-04-07T17:27:18Z) - Practical, Provably-Correct Interactive Learning in the Realizable
Setting: The Power of True Believers [12.09273192079783]
我々は、対話型学習を実現可能な設定で検討し、最適な腕の識別からアクティブな分類に至るまでの問題に対処する一般的な枠組みを開発する。
我々は,最小限の値と対数係数とを一致させる,計算効率のよい新しいアルゴリズムを設計する。
論文 参考訳(メタデータ) (2021-11-09T02:33:36Z) - Provably Faster Algorithms for Bilevel Optimization [54.83583213812667]
バイレベル最適化は多くの重要な機械学習アプリケーションに広く適用されている。
両レベル最適化のための2つの新しいアルゴリズムを提案する。
両アルゴリズムが$mathcalO(epsilon-1.5)$の複雑さを達成し,既存のアルゴリズムを桁違いに上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-08T21:05:30Z) - Refined bounds for algorithm configuration: The knife-edge of dual class
approximability [94.83809668933021]
トレーニングセットが、トレーニングセット上でのパラメータの平均メトリックのパフォーマンスが、予想される将来的なパフォーマンスに最も近いことを保証するために、どの程度の規模が必要かを調査する。
この近似が L-無限ノルムの下で成り立つなら、強いサンプル複雑性境界を与えることができる。
我々は、コンピュータ科学において最も強力なツールの一つである整数プログラミングの文脈において、我々の限界を実証的に評価する。
論文 参考訳(メタデータ) (2020-06-21T15:32:21Z) - Automatic Differentiation in ROOT [62.997667081978825]
数学と計算機代数において、自動微分 (AD) は、コンピュータプログラムによって指定された関数の微分を評価するための一連の技術である。
本稿では、任意のC/C++関数の導関数を生成するために、ClingがサポートするROOTで利用可能なAD技術を提案する。
論文 参考訳(メタデータ) (2020-04-09T09:18:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。