論文の概要: SMART: A Surrogate Model for Predicting Application Runtime in Dragonfly Systems
- arxiv url: http://arxiv.org/abs/2511.11111v1
- Date: Fri, 14 Nov 2025 09:39:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.522148
- Title: SMART: A Surrogate Model for Predicting Application Runtime in Dragonfly Systems
- Title(参考訳): SMART: Dragonflyシステムにおけるアプリケーションランタイム予測のためのサロゲートモデル
- Authors: Xin Wang, Pietro Lodi Rizzini, Sourav Medya, Zhiling Lan,
- Abstract要約: 本稿では,グラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)を組み合わせて,ポートレベルのルータデータから空間的および時間的パターンを抽出する代理モデルを提案する。
我々のモデルは、既存の統計と機械学習のベースラインを上回り、正確なランタイム予測を可能にし、Dragonflyネットワークの効率的なハイブリッドシミュレーションをサポートする。
- 参考スコア(独自算出の注目度): 13.688119091055244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Dragonfly network, with its high-radix and low-diameter structure, is a leading interconnect in high-performance computing. A major challenge is workload interference on shared network links. Parallel discrete event simulation (PDES) is commonly used to analyze workload interference. However, high-fidelity PDES is computationally expensive, making it impractical for large-scale or real-time scenarios. Hybrid simulation that incorporates data-driven surrogate models offers a promising alternative, especially for forecasting application runtime, a task complicated by the dynamic behavior of network traffic. We present \ourmodel, a surrogate model that combines graph neural networks (GNNs) and large language models (LLMs) to capture both spatial and temporal patterns from port level router data. \ourmodel outperforms existing statistical and machine learning baselines, enabling accurate runtime prediction and supporting efficient hybrid simulation of Dragonfly networks.
- Abstract(参考訳): Dragonflyネットワークは、その高放射率と低径構造を持ち、高性能コンピューティングにおける主要な相互接続である。
大きな課題は、共有ネットワークリンクにおけるワークロードの干渉である。
並列離散イベントシミュレーション(PDES)は、ワークロードの干渉を分析するために一般的に用いられる。
しかし、高忠実度PDESは計算コストが高く、大規模なシナリオやリアルタイムシナリオでは実用的ではない。
データ駆動サロゲートモデルを組み込んだハイブリッドシミュレーションは、特にアプリケーションランタイムの予測において、ネットワークトラフィックの動的な振る舞いによって複雑になるタスクに対して、有望な代替手段を提供する。
本稿では,グラフニューラルネットワーク(GNN)と大規模言語モデル(LLM)を組み合わせて,ポートレベルのルータデータから空間的および時間的パターンをキャプチャする代理モデルであるShaurmodelを提案する。
\ourmodelは既存の統計と機械学習のベースラインを上回り、正確なランタイム予測を可能にし、Dragonflyネットワークの効率的なハイブリッドシミュレーションをサポートする。
関連論文リスト
- HN-MVTS: HyperNetwork-based Multivariate Time Series Forecasting [2.4409745336261457]
HN-MVTSは、ハイパーネットワークベースの生成を任意のニューラルネットワーク予測モデルと統合した、新しいアーキテクチャである。
新しいパラメータの数を制限するために、ハイパーネットワークはターゲット予測ネットワークの最後のレイヤの重みを生成することを学習する。
8つのベンチマークデータセットの実験では、最先端モデルへのHN-MVTSの適用が典型的にパフォーマンスを向上させることが示されている。
論文 参考訳(メタデータ) (2025-11-11T15:17:15Z) - A Wireless Foundation Model for Multi-Task Prediction [50.21098141769079]
多様な予測区間をサポートする無線ネットワークにおけるマルチタスク予測のための統合基盤モデルを提案する。
大規模データセットをトレーニングした後、提案した基礎モデルは、新しいタスクにおいて、目に見えないシナリオとゼロショットのパフォーマンスに強力な一般化を示す。
論文 参考訳(メタデータ) (2025-07-08T12:37:55Z) - Decoupling Spatio-Temporal Prediction: When Lightweight Large Models Meet Adaptive Hypergraphs [12.867023510751787]
STH-SepNetは、時間的および空間的表現性を効率と精度の両方に分離する新しいフレームワークである。
S-SepNetは、現実世界のアプリケーションにおける時間予測のための実用的でスケーラブルなソリューションを提供する。
この作業は、計算要求の削減と予測性能の向上を目的とした、時間的予測のための有望な軽量フレームワークを提供する可能性がある。
論文 参考訳(メタデータ) (2025-05-26T07:37:39Z) - World Model-Based Learning for Long-Term Age of Information Minimization in Vehicular Networks [53.98633183204453]
本稿では,車載ネットワークにおけるパケット完全性認識情報(CAoI)の年齢を最小化するために,新しい世界モデルに基づく学習フレームワークを提案する。
mmWave V2X環境の動的モデルを共同で学習し、リンクスケジューリングの方法を学ぶための軌跡を想像するために使用する世界モデルフレームワークを提案する。
特に、長期的な政策は環境相互作用の代わりに、異なる想像軌道で学習される。
論文 参考訳(メタデータ) (2025-05-03T06:23:18Z) - RACH Traffic Prediction in Massive Machine Type Communications [5.416701003120508]
本稿では,ALOHAネットワークにおけるバーストトラフィック予測に適した機械学習ベースのフレームワークを提案する。
我々は,mMTCネットワークから頻繁に収集されたデータを活用することでLSTMネットワークの状態を更新する,新しい低複雑さオンライン予測アルゴリズムを開発した。
本研究では,単一基地局と数千のデバイスを異なるトラフィック発生特性を持つグループに編成したネットワーク上でのフレームワークの性能を評価する。
論文 参考訳(メタデータ) (2024-05-08T17:28:07Z) - Runtime Construction of Large-Scale Spiking Neuronal Network Models on
GPU Devices [0.0]
本稿では,GPUメモリ上で対話的,動的,直接的にネットワーク接続を作成する新しい手法を提案する。
我々は,2つの神経科学的なモデルを用いて,コンシューマとデータセンタのGPUによるシミュレーション性能を検証する。
ネットワーク構築時間とシミュレーション時間は、他の最先端のシミュレーション技術と同等か短い。
論文 参考訳(メタデータ) (2023-06-16T14:08:27Z) - Online Evolutionary Neural Architecture Search for Multivariate
Non-Stationary Time Series Forecasting [72.89994745876086]
本研究は、オンラインニューロ進化に基づくニューラルアーキテクチャサーチ(ONE-NAS)アルゴリズムを提案する。
ONE-NASは、オンライン予測タスクのためにリカレントニューラルネットワーク(RNN)を自動設計し、動的にトレーニングする新しいニューラルネットワーク探索手法である。
その結果、ONE-NASは従来の統計時系列予測法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-20T22:25:47Z) - An advanced spatio-temporal convolutional recurrent neural network for
storm surge predictions [73.4962254843935]
本研究では, 人工ニューラルネットワークモデルを用いて, 嵐の軌跡/規模/強度履歴に基づいて, 強風をエミュレートする能力について検討する。
本研究では, 人工嵐シミュレーションのデータベースを用いて, 強風を予測できるニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2022-04-18T23:42:18Z) - Action-Conditional Recurrent Kalman Networks For Forward and Inverse
Dynamics Learning [17.80270555749689]
ロボットのモデルベース制御において、正確な前方および逆ダイナミクスモデルの推定が重要な要素である。
本稿では,フォワードモデル学習のためのアーキテクチャと,逆モデル学習のためのアーキテクチャを提案する。
どちらのアーキテクチャも、予測性能の点で、既存のモデル学習フレームワークと分析モデルを大きく上回っている。
論文 参考訳(メタデータ) (2020-10-20T11:28:25Z) - Model Fusion via Optimal Transport [64.13185244219353]
ニューラルネットワークのための階層モデル融合アルゴリズムを提案する。
これは、不均一な非i.d.データに基づいてトレーニングされたニューラルネットワーク間での"ワンショット"な知識伝達に成功していることを示す。
論文 参考訳(メタデータ) (2019-10-12T22:07:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。