論文の概要: SGDP: A Stream-Graph Neural Network Based Data Prefetcher
- arxiv url: http://arxiv.org/abs/2304.03864v2
- Date: Wed, 11 Oct 2023 07:50:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-16 04:04:37.848993
- Title: SGDP: A Stream-Graph Neural Network Based Data Prefetcher
- Title(参考訳): SGDP: ストリームグラフニューラルネットワークに基づくデータプレファー
- Authors: Yiyuan Yang, Rongshang Li, Qiquan Shi, Xijun Li, Gang Hu, Xing Li and
Mingxuan Yuan
- Abstract要約: 本稿では,SGDP(Stream-Graph Neural Network-based Data Prefetcher)を提案する。
SGDPは、LBAデルタ間の相互作用関係を表現するために重み付き有向グラフ構造を用いたLBAデルタストリームをモデル化する。
実験の結果、SGDPがSOTA法を6.21%、有効プレフェッチ率7.00%で上回り、平均3.13倍の速さで上回っていることが確認された。
- 参考スコア(独自算出の注目度): 19.990422170963324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data prefetching is important for storage system optimization and access
performance improvement. Traditional prefetchers work well for mining access
patterns of sequential logical block address (LBA) but cannot handle complex
non-sequential patterns that commonly exist in real-world applications. The
state-of-the-art (SOTA) learning-based prefetchers cover more LBA accesses.
However, they do not adequately consider the spatial interdependencies between
LBA deltas, which leads to limited performance and robustness. This paper
proposes a novel Stream-Graph neural network-based Data Prefetcher (SGDP).
Specifically, SGDP models LBA delta streams using a weighted directed graph
structure to represent interactive relations among LBA deltas and further
extracts hybrid features by graph neural networks for data prefetching. We
conduct extensive experiments on eight real-world datasets. Empirical results
verify that SGDP outperforms the SOTA methods in terms of the hit ratio by
6.21%, the effective prefetching ratio by 7.00%, and speeds up inference time
by 3.13X on average. Besides, we generalize SGDP to different variants by
different stream constructions, further expanding its application scenarios and
demonstrating its robustness. SGDP offers a novel data prefetching solution and
has been verified in commercial hybrid storage systems in the experimental
phase. Our codes and appendix are available at
https://github.com/yyysjz1997/SGDP/.
- Abstract(参考訳): データプリフェッチはストレージシステムの最適化とアクセス性能の向上に重要である。
従来のプリフェッチは、シーケンシャル論理ブロックアドレス(LBA)のアクセスパターンのマイニングには適しているが、現実世界のアプリケーションで一般的に見られる複雑な非シーケンスパターンは扱えない。
最先端(SOTA)学習ベースのプレフェッチは、より多くのLBAアクセスをカバーする。
しかし、LBAデルタ間の空間的相互依存性を十分に考慮していないため、性能やロバスト性が制限される。
本稿では,SGDP(Stream-Graph Neural Network-based Data Prefetcher)を提案する。
具体的には、重み付き有向グラフ構造を用いてLBAデルタストリームをモデル化し、LBAデルタ間の相互関係を表現し、データプリフェッチのためのグラフニューラルネットワークによりハイブリッド特徴を抽出する。
我々は8つの実世界のデータセットについて広範な実験を行う。
実験の結果、SGDPがSOTA法を6.21%、有効プレフェッチ率7.00%で上回り、平均3.13倍の速さで上回っていることが確認された。
さらに、SGDPを異なるストリーム構造によって異なる変種に一般化し、アプリケーションシナリオをさらに拡張し、その堅牢性を示す。
SGDPは、新しいデータプリフェッチソリューションを提供し、実験段階の商用ハイブリッドストレージシステムで検証されている。
私たちのコードと付録はhttps://github.com/yysjz1997/SGDP/で公開されています。
関連論文リスト
- A Bayesian Approach to Data Point Selection [24.98069363998565]
データポイントの選択(DPS)は、ディープラーニングにおいて重要なトピックになりつつある。
既存のDPSへのアプローチは、主にバイレベル最適化(BLO)の定式化に基づいている。
DPSに対する新しいベイズ的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-06T09:04:13Z) - DocMamba: Efficient Document Pre-training with State Space Model [56.84200017560988]
本稿では,状態空間モデルに基づく新しいフレームワークDocMambaを紹介する。
グローバルなモデリング能力を保ちながら、計算複雑性を線形に減らすように設計されている。
HRDocの実験では、DocMambaの長さ外挿の可能性が確認された。
論文 参考訳(メタデータ) (2024-09-18T11:34:28Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - 4DBInfer: A 4D Benchmarking Toolbox for Graph-Centric Predictive Modeling on Relational DBs [67.47600679176963]
RDBは、相互接続されたテーブルにまたがる膨大な量のリッチで情報的なデータを格納する。
予測機械学習モデルの進歩は、コンピュータビジョンや自然言語処理といった他の領域の進歩に遅れをとっている。
マルチテーブルデータセットをグラフに変換することを前提としたベースラインモデルのクラスを探索する。
大規模RDBデータセットと (ii) 同時予測タスクの多様なコレクションを組み立てる。
論文 参考訳(メタデータ) (2024-04-28T15:04:54Z) - A Meta-Learning Approach to Predicting Performance and Data Requirements [163.4412093478316]
本稿では,モデルが目標性能に達するために必要なサンプル数を推定する手法を提案する。
モデル性能を推定するデファクト原理であるパワー法則が,小さなデータセットを使用する場合の誤差が大きいことが判明した。
本稿では,2つのデータを異なる方法で処理するPPL法について紹介する。
論文 参考訳(メタデータ) (2023-03-02T21:48:22Z) - Simple and Effective Augmentation Methods for CSI Based Indoor
Localization [37.3026733673066]
物理的考察により,チャネル状態情報に基づく屋内位置推定のための2つのアルゴリズムを提案する。
オリジナルのデータセットのサイズの10%は、オリジナルのデータセットと同じパフォーマンスを得るのに十分です。
提案手法によりさらにデータセットを増大させると、テスト精度は3倍以上に向上する。
論文 参考訳(メタデータ) (2022-11-19T20:27:46Z) - GFlowCausal: Generative Flow Networks for Causal Discovery [27.51595081346858]
本稿では,GFlowCausalと呼ばれる観測データからDAG(Directed Acyclic Graph)を学習するための新しい手法を提案する。
GFlowCausalは、事前定義された報酬に比例した確率を持つシーケンシャルアクションによって、ハイリワードDAGを生成するための最良のポリシーを学ぶことを目的としている。
合成データセットと実データセットの両方について広範な実験を行い、提案手法が優れていることを示すとともに、大規模環境での良好な性能を示す。
論文 参考訳(メタデータ) (2022-10-15T04:07:39Z) - CascadER: Cross-Modal Cascading for Knowledge Graph Link Prediction [22.96768147978534]
本稿では,効率を向上しつつ,完全アンサンブルのランキング精度を維持するための階層型ランキングアーキテクチャCascaderを提案する。
CascadER は LM を用いて、より効率的な KGE の出力を再現し、KGE の精度向上を最大化しつつ、LM を最小限に呼び出すための適応的なサブセット選択方式に依存している。
実験により, モデル間の多様性と個々のモデルの信頼性信号の保存がカスケーダの有効性を説明するのに有効であることがわかった。
論文 参考訳(メタデータ) (2022-05-16T22:55:45Z) - JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。
GP-UCBに類似した条件下では, 応答が得られないことを示す。
実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文 参考訳(メタデータ) (2021-06-02T05:03:38Z) - HiPPO: Recurrent Memory with Optimal Polynomial Projections [93.3537706398653]
本稿では,連続信号と離散時系列をベースに投影してオンライン圧縮するための一般フレームワーク(HiPPO)を提案する。
過去の各時間ステップの重要性を示す尺度が与えられた場合、HiPPOは自然なオンライン関数近似問題に対する最適解を生成する。
このフォーマルなフレームワークは、すべての履歴を記憶するために時間をかけてスケールする新しいメモリ更新メカニズム(HiPPO-LegS)を提供する。
論文 参考訳(メタデータ) (2020-08-17T23:39:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。