論文の概要: Taming Wild Branches: Overcoming Hard-to-Predict Branches using the Bullseye Predictor
- arxiv url: http://arxiv.org/abs/2506.06773v1
- Date: Sat, 07 Jun 2025 11:50:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 21:10:47.052763
- Title: Taming Wild Branches: Overcoming Hard-to-Predict Branches using the Bullseye Predictor
- Title(参考訳): 野生の枝のモデリング - Bullseye 予測器を用いて予測の難しい枝を克服する
- Authors: Emet Behrendt, Shing Wai Pun, Prashant J. Nair,
- Abstract要約: 我々は,Bulseye予測器と呼ばれる28KBのH2Pターゲットサブシステムを備えた159KBのTAGE-SC-L予測器を拡張した。
セット連想型H2P識別表(HIT)を用いて問題のあるPCを特定し、2つの枝特異的パーセプトロンの1つに分類する。
これにより平均MPKIは3.4045、CycWpPKIは145.09となる。
- 参考スコア(独自算出の注目度): 1.0514231683620516
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Branch prediction is key to the performance of out-of-order processors. While the CBP-2016 winner TAGE-SC-L combines geometric-history tables, a statistical corrector, and a loop predictor, over half of its remaining mispredictions stem from a small set of hard-to-predict (H2P) branches. These branches occur under diverse global histories, causing repeated thrashing in TAGE and eviction before usefulness counters can mature. Prior work shows that simply enlarging the tables offers only marginal improvement. We augment a 159 KB TAGE-SC-L predictor with a 28 KB H2P-targeted subsystem called the Bullseye predictor. It identifies problematic PCs using a set-associative H2P Identification Table (HIT) and steers them to one of two branch-specific perceptrons, one indexed by hashed local history and the other by folded global history. A short trial phase tracks head-to-head accuracy in an H2P cache. A branch becomes perceptron-resident only if the perceptron's sustained accuracy and output magnitude exceed dynamic thresholds, after which TAGE updates for that PC are suppressed to reduce pollution. The HIT, cache, and perceptron operate fully in parallel with TAGE-SC-L, providing higher fidelity on the H2P tail. This achieves an average MPKI of 3.4045 and CycWpPKI of 145.09.
- Abstract(参考訳): 分岐予測は、アウトオブオーダプロセッサのパフォーマンスの鍵となる。
CBP-2016の勝者であるTAGE-SC-Lは幾何履歴表、統計修正器、ループ予測器を組み合わせたが、残りの予測ミスの半分以上は、予測の難しい小さな枝(H2P)に由来する。
これらの枝は、多種多様な世界史の下で発生し、有用性カウンタが成熟する前に、TAGEとエビクションの繰り返しスラッシングを引き起こす。
以前の研究は、単にテーブルを拡大すれば限界的な改善しか得られないことを示している。
我々は,Bulseye予測器と呼ばれる28KBのH2Pターゲットサブシステムを備えた159KBのTAGE-SC-L予測器を拡張した。
セット連想型H2P識別表(HIT)を用いて問題のあるPCを特定し、それらを2つの分岐固有パーセプトロンの1つに分類する。
短い試行フェーズは、H2Pキャッシュにおけるヘッド・ツー・ヘッドの精度を追跡する。
パーセプトロンの持続精度と出力大きさがダイナミックしきい値を超えると、分岐はパーセプトロン抵抗となり、その後PCのTAGE更新が抑制され、汚染が軽減される。
HIT、キャッシュ、パーセプトロンはTAGE-SC-Lと完全に並列に動作し、H2Pテールの忠実度が高い。
これにより平均MPKIは3.4045、CycWpPKIは145.09となる。
関連論文リスト
- Exploiting Inaccurate Branch History in Side-Channel Attacks [54.218160467764086]
本稿では,リソース共有と競合が広く実装されているが文書化されていない2つの特徴,バイアスフリー分岐予測と分岐履歴推定にどのように影響するかを検討する。
これらの機能は、ブランチ履歴バッファ(BHB)の更新動作を不注意に修正し、悪意のある誤定義を引き起こす新しいプリミティブを作成することができる。
2つのSpectre攻撃、すなわちSpectre-BSEとSpectre-BHSと、BiasScopeと呼ばれるクロスプライマリ制御フローサイドチャネル攻撃である。
論文 参考訳(メタデータ) (2025-06-08T19:46:43Z) - Debiasing CLIP: Interpreting and Correcting Bias in Attention Heads [29.880490526874876]
我々は,刺激的な注意を識別し,ターゲットアブレーションによって軽減する,コントラスト的なフレームワークであるtextsc-Then-Correct (LTC) を導入する。
我々は,背景性バイアスのあるベンチマークでLCCを評価し,非トレーニング後ベースラインと比較して,最低グループ精度が50%以上向上した。
我々は,選択した頭部の表現を可視化し,提示された解釈が,刺激的な頭部と快楽な頭部の両方を識別するコントラスト的なメカニズムを裏付けていることを見出した。
論文 参考訳(メタデータ) (2025-05-23T03:13:42Z) - Exponential Convergence of CAVI for Bayesian PCA [0.7929564340244416]
確率的主成分分析(PCA)とそのベイズ変種(BPCA)は、機械学習と統計の次元削減に広く用いられている。
本稿では,モデルが1つの主成分(PC)を使用する場合において,精度の高い指数収束結果を示す。
また,PCを数えるモデルに対してCAVIの指数収束性を証明するために,最近のツールを活用している。
論文 参考訳(メタデータ) (2025-05-22T02:44:00Z) - Prune Spatio-temporal Tokens by Semantic-aware Temporal Accumulation [89.88214896713846]
STAスコアは、時間的冗長性と意味的重要性の2つの重要な要因を考慮に入れている。
市販のビデオトランスフォーマーとビデオウィンにSTAモジュールを適用する。
結果: Kinetics-400 と something-Something V2 は 30% のオーバーシェルフ削減を実現し,0.2% の精度低下を実現した。
論文 参考訳(メタデータ) (2023-08-08T19:38:15Z) - Align-DETR: Enhancing End-to-end Object Detection with Aligned Loss [35.11300328598727]
本稿では,モデル内の2つの重要な相違点を同定する。
両課題間の相違を解決するために,Align Lossと呼ばれる新たな損失関数を導入する。
提案手法は,ResNet-50バックボーンを用いたH-DETRベースライン上で49.3% (+0.6) APを実現する。
論文 参考訳(メタデータ) (2023-04-15T10:24:51Z) - Patch-level Gaze Distribution Prediction for Gaze Following [49.93340533068501]
トレーニング後の視線に対するパッチ分布予測(PDP)手法を提案する。
本モデルでは,アノテーションの差が大きい画像上でのより優れたヒートマップ分布を予測することにより,MSE損失の正則化を図っている。
実験により,ターゲット予測とイン/アウト予測サブタスクのギャップを埋めるモデルが得られた。
論文 参考訳(メタデータ) (2022-11-20T19:25:15Z) - Taming Overconfident Prediction on Unlabeled Data from Hindsight [50.9088560433925]
ラベルのないデータに対する予測の不確実性を最小化することは、半教師付き学習において優れた性能を達成するための鍵となる要素である。
本稿では,アダプティブシャーニング(Adaptive Sharpening, ADS)と呼ばれる2つのメカニズムを提案する。
ADSは、プラグインにすることで最先端のSSLメソッドを大幅に改善する。
論文 参考訳(メタデータ) (2021-12-15T15:17:02Z) - Feature Importance in Gradient Boosting Trees with Cross-Validation
Feature Selection [11.295032417617454]
偏りのある基礎学習者がグラディエント・ブースティング・マシン(GBM)の特徴的重要度(FI)測定に与える影響について検討した。
クロスバリデード(CV)非バイアスベース学習者を利用して,この欠陥を比較的低い計算コストで修正する。
提案手法を各種の合成・実世界の構成で実証し, 予測精度を比較的同等に保ちつつ, 全GBM FI尺度に有意な改善が見られた。
論文 参考訳(メタデータ) (2021-09-12T09:32:43Z) - Semi-supervised Contrastive Learning with Similarity Co-calibration [72.38187308270135]
SsCL(Semi-supervised Contrastive Learning)と呼ばれる新しいトレーニング戦略を提案する。
ssclは、自己教師付き学習におけるよく知られたコントラスト損失と、半教師付き学習におけるクロスエントロピー損失を組み合わせる。
SsCLはより差別的な表現を生じさせ,ショット学習に有益であることを示す。
論文 参考訳(メタデータ) (2021-05-16T09:13:56Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。