Fugu-MT 論文翻訳(概要): A Unified Learning Platform for Dynamic Frequency Scaling in Pipelined Processors

論文の概要: A Unified Learning Platform for Dynamic Frequency Scaling in Pipelined Processors

arxiv url: http://arxiv.org/abs/2006.07450v1
Date: Fri, 12 Jun 2020 20:07:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-22 04:44:18.370518
Title: A Unified Learning Platform for Dynamic Frequency Scaling in Pipelined Processors
Title（参考訳）: パイプラインプロセッサにおける動的周波数スケーリングのための統一学習プラットフォーム
Authors: Arash Fouman Ajirlou and Inna Partin-Vaisband
Abstract要約: 個別命令の伝搬遅延に基づいてクロック周波数を動的に調整する機械学習(ML)設計フレームワークを提案する。ランダムフォレストモデルは、リアルタイムで伝搬遅延を分類するために訓練される。トレーニングされたモデルは、ベースラインプロセッサ内のパイプラインステージとしてVerilogで実装されている。
参考スコア（独自算出の注目度）: 1.1602089225841632
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: A machine learning (ML) design framework is proposed for dynamically adjusting clock frequency based on propagation delay of individual instructions. A Random Forest model is trained to classify propagation delays in real-time, utilizing current operation type, current operands, and computation history as ML features. The trained model is implemented in Verilog as an additional pipeline stage within a baseline processor. The modified system is simulated at the gate-level in 45 nm CMOS technology, exhibiting a speed-up of 68% and energy reduction of 37% with coarse-grained ML classification. A speed-up of 95% is demonstrated with finer granularities at additional energy costs.
Abstract（参考訳）: 個別命令の伝搬遅延に基づいてクロック周波数を動的に調整する機械学習(ML)設計フレームワークを提案する。ランダムフォレストモデルを用いて、現在の動作タイプ、現在のオペランド、計算履歴をml特徴として活用し、伝播遅延をリアルタイムに分類する。トレーニングされたモデルは、ベースラインプロセッサ内のパイプラインステージとしてVerilogで実装されている。修正されたシステムは45nmのcmos技術でゲートレベルでシミュレートされ、68%のスピードアップと37%のエネルギー削減と粗粒mlの分類を示す。 95%のスピードアップは、さらなるエネルギーコストでより微細な粒度で示される。

関連論文リスト

Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。 FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文参考訳（メタデータ） (2026-02-12T18:54:57Z)
Fast and Accurate RFIC Performance Prediction via Pin Level Graph Neural Networks and Probabilistic Flow [0.5599792629509228]
本研究は,アクティブRF回路の重要な性能指標を予測するために,軽量かつデータ効率,トポロジ対応グラフニューラルネットワーク(GNN)モデルを提案する。回路はデバイス-端末レベルでモデル化され、データ要求を減らしながらスケーラブルなメッセージパッシングを可能にする。データセットの実験では、対称平均絶対パーセンテージ誤差(sMAPE)と平均相対誤差(MRE)はそれぞれ平均2.40%と2.91%と高い予測精度を示している。
論文参考訳（メタデータ） (2025-08-22T14:06:21Z)
Efficient Memristive Spiking Neural Networks Architecture with Supervised In-Situ STDP Method [0.0]
時間的スパイクエンコーディングを備えたメムリスタベースのスパイキングニューラルネットワーク(SNN)は、超低エネルギー計算を可能にする。本稿では,新しい教師付きin-situ学習アルゴリズムを用いて学習した回路レベルのメムリシブスパイクニューラルネットワーク(SNN)アーキテクチャを提案する。
論文参考訳（メタデータ） (2025-07-28T17:09:48Z)
A Stable Whitening Optimizer for Efficient Neural Network Training [101.89246340672246]
アルゴリズムのシャンプー系をベースとして,3つの重要な問題を同定・緩和し,SPlus法を提案する。まず,行列逆が長期にわたってキャッシュされる場合,素早いシャンプーは分岐しがちであることがわかった。第二に、ネットワーク幅をまたいで学習率の伝達を可能にするために、形状認識スケーリングを適用する。第3に,高い学習率によってパラメータノイズが大きくなり,より高速な学習をブロックする簡単な反復学習方式を提案する。
論文参考訳（メタデータ） (2025-06-08T18:43:31Z)
m4: A Learned Flow-level Network Simulator [14.802940782072122]
フローレベルのシミュレータは、動的に割り当てられた送信速度を持つ連続フローとしてトラフィックを抽象化する。機械学習を用いて関心のネットワークのダイナミクスを学習する,正確でスケーラブルなフローレベルシミュレータであるm4を提案する。
論文参考訳（メタデータ） (2025-03-03T17:51:08Z)
Techniques for Enhancing Memory Capacity of Reservoir Computing [0.7421845364041001]
Reservoir Computing(RC)は、バイオインスパイアされた機械学習フレームワークである。 RCにおけるメモリ容量と非線形性の間にはトレードオフがある。本研究では,貯水池モデルのメモリ容量を改善する手法を提案する。
論文参考訳（メタデータ） (2025-02-25T07:38:58Z)
FM-TS: Flow Matching for Time Series Generation [71.31148785577085]
本稿では、時系列生成のための修正フローマッチングベースのフレームワークFM-TSを紹介する。 FM-TSは、トレーニングと推論の点でより効率的である。我々は、太陽予測とMuJoCo計算タスクにおいて優れた性能を達成した。
論文参考訳（メタデータ） (2024-11-12T03:03:23Z)
Analog Spiking Neuron in CMOS 28 nm Towards Large-Scale Neuromorphic Processors [0.8426358786287627]
本研究では,TSMCの28nmCMOS技術を用いた低消費電力Leaky Integrate- and-Fireニューロンの設計を提案する。製造されたニューロンは1.61 fJ/スパイクを消費し、34$mu m2$の活性領域を占有し、最大スパイク周波数は250mVで300kHzである。
論文参考訳（メタデータ） (2024-08-14T17:51:20Z)
ADC/DAC-Free Analog Acceleration of Deep Neural Networks with Frequency Transformation [2.7488316163114823]
本稿では,アナログ領域の周波数ベーステンソル変換を用いた周波数領域ニューラルネットワークのエネルギー効率向上手法を提案する。提案手法は,変換行列のトレーニング可能なパラメータを不要にすることで,よりコンパクトなセルを実現する。 16$times$16のクロスバーで8ビット入力処理を行い,Watt当たりの1602テラ演算のエネルギー効率を実現する。
論文参考訳（メタデータ） (2023-09-04T19:19:39Z)
Physics Informed Neural Networks for Phase Locked Loop Transient Stability Assessment [0.0]
相ロックループ(PLL)のような電力電子制御器を用いて、グリッドとグリッドの同期性を維持することで、グリッドの故障時に高速な過渡的な動作を引き起こす。本稿では,少ないラベル付きトレーニングデータを用いて,故障時のコントローラの過渡的ダイナミクスを正確に予測するニューラルネットワークアルゴリズムを提案する。このアルゴリズムの性能は、CIGREベンチマークモデルC4.49のPSCADにおけるROMとEMTシミュレーションと比較され、グリッドインピーダンスの異なるコントローラの軌道とROAを正確に近似する能力を示している。
論文参考訳（メタデータ） (2023-03-21T18:09:20Z)
Quantized Neural Networks for Low-Precision Accumulation with Guaranteed Overflow Avoidance [68.8204255655161]
本稿では,推定時のアキュムレータの精度を下げる際に,数値オーバーフローを回避する量子化学習アルゴリズムを提案する。本手法は,浮動小数点点ベースラインに対するモデル精度を維持しつつ,アキュムレータの精度を低減できることを示す。
論文参考訳（メタデータ） (2023-01-31T02:46:57Z)
Liquid Structural State-Space Models [106.74783377913433]
Liquid-S4はLong-Range Arenaベンチマークで平均87.32%の性能を達成した。全生音声コマンド認識では、データセットLiquid-S4は96.78%の精度で、S4と比較してパラメータ数が30%減少している。
論文参考訳（メタデータ） (2022-09-26T18:37:13Z)
Feasibility Layer Aided Machine Learning Approach for Day-Ahead Operations [0.5076419064097734]
デイアヘッド演算は、ジェネレータのコミットスケジュールとディスパッチを決定する、複雑で計算集約的な最適化プロセスを含む。過去の情報における既存のパターンは、セキュリティ制約単位コミットメント(SCUC)のモデル削減に活用できる。提案手法は,IEEE 24-Busシステム,IEEE-73バスシステム,IEEE 118-Busシステム,500-Busシステム,ポーランド2383-Busシステムなど,いくつかの試験システムで検証されている。
論文参考訳（メタデータ） (2022-08-13T22:44:42Z)
RF-Photonic Deep Learning Processor with Shannon-Limited Data Movement [0.0]
光ニューラルネットワーク(ONN)は、超低レイテンシとエネルギー消費を持つ有望な加速器である。我々は、周波数領域のデータを符号化する乗法的アナログ周波数変換ONN(MAFT-ONN)を導入する。我々は、生のRF信号で完全にアナログのディープラーニングを演算する最初のハードウェアアクセラレータを実験的に実証した。
論文参考訳（メタデータ） (2022-07-08T16:37:13Z)
Adaptive Machine Learning for Time-Varying Systems: Low Dimensional Latent Space Tuning [91.3755431537592]
本稿では,時間変化システムを対象とした適応機械学習手法を提案する。我々は,エンコーダデコーダCNNのエンコーダ部出力において,非常に高次元(N>100k)の入力を低次元(N2)潜在空間にマッピングする。そこで本手法では,割り込みを伴わないフィードバックに基づいて,内部の相関関係を学習し,その進化をリアルタイムで追跡する。
論文参考訳（メタデータ） (2021-07-13T16:05:28Z)
Wake Word Detection with Streaming Transformers [72.66551640048405]
提案したトランスフォーマーモデルでは,同じ偽アラームレートで,平均25%の誤り拒否率でベースライン畳み込みネットワークを性能的に上回ることを示す。 Mobvoiのウェイクワードデータセットに関する実験により,提案したTransformerモデルはベースライン畳み込みネットワークを25%上回る性能を示した。
論文参考訳（メタデータ） (2021-02-08T19:14:32Z)
Fast and differentiable simulation of driven quantum systems [58.720142291102135]
我々は、ダイソン展開に基づく半解析手法を導入し、標準数値法よりもはるかに高速に駆動量子系を時間発展させることができる。回路QEDアーキテクチャにおけるトランスモン量子ビットを用いた2量子ゲートの最適化結果を示す。
論文参考訳（メタデータ） (2020-12-16T21:43:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。