論文の概要: Time-Series Learning for Proactive Fault Prediction in Distributed Systems with Deep Neural Structures
- arxiv url: http://arxiv.org/abs/2505.20705v1
- Date: Tue, 27 May 2025 04:31:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.405262
- Title: Time-Series Learning for Proactive Fault Prediction in Distributed Systems with Deep Neural Structures
- Title(参考訳): 深部神経構造を有する分散システムにおける前向き故障予測のための時系列学習
- Authors: Yang Wang, Wenxuan Zhu, Xuehui Quan, Heyi Wang, Chang Liu, Qiyuan Wu,
- Abstract要約: 本稿では,分散システムにおける障害予測と遅延応答の課題に対処する。
時間とともにシステム状態の進化をモデル化するために、Gated Recurrent Unitを使用します。
次に、注意機構を適用して、重要な時間セグメントを強化し、潜在的な欠陥を識別するモデルの能力を向上させる。
- 参考スコア(独自算出の注目度): 5.572536027964037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the challenges of fault prediction and delayed response in distributed systems by proposing an intelligent prediction method based on temporal feature learning. The method takes multi-dimensional performance metric sequences as input. We use a Gated Recurrent Unit (GRU) to model the evolution of system states over time. An attention mechanism is then applied to enhance key temporal segments, improving the model's ability to identify potential faults. On this basis, a feedforward neural network is designed to perform the final classification, enabling early warning of system failures. To validate the effectiveness of the proposed approach, comparative experiments and ablation analyses were conducted using data from a large-scale real-world cloud system. The experimental results show that the model outperforms various mainstream time-series models in terms of Accuracy, F1-Score, and AUC. This demonstrates strong prediction capability and stability. Furthermore, the loss function curve confirms the convergence and reliability of the training process. It indicates that the proposed method effectively learns system behavior patterns and achieves efficient fault detection.
- Abstract(参考訳): 本稿では,時間的特徴学習に基づくインテリジェントな予測手法を提案することにより,分散システムにおける障害予測と遅延応答の課題に対処する。
この方法は、多次元のパフォーマンスメトリックシーケンスを入力とする。
時間とともにシステム状態の進化をモデル化するために、GRU(Gated Recurrent Unit)を使用します。
次に、注意機構を適用して、重要な時間セグメントを強化し、潜在的な欠陥を識別するモデルの能力を向上させる。
このベースで、フィードフォワードニューラルネットワークは最終分類を実行するように設計されており、システム障害の早期警告を可能にする。
提案手法の有効性を検証するため,大規模な実世界のクラウドシステムからのデータを用いて比較実験とアブレーション解析を行った。
実験結果から,本モデルは,精度,F1スコア,AUCの点で,主流の時系列モデルよりも優れていることがわかった。
これは強い予測能力と安定性を示す。
さらに、損失関数曲線は、トレーニングプロセスの収束と信頼性を確認する。
提案手法は,システム動作パターンを効果的に学習し,効率的な故障検出を実現する。
関連論文リスト
- Cloud-Based AI Systems: Leveraging Large Language Models for Intelligent Fault Detection and Autonomous Self-Healing [1.819979627431298]
本稿では,クラウドシステムにおけるインテリジェントな障害検出と自己修復機構を実現するために,LLM(Massive Language Model)に基づく新しいAIフレームワークを提案する。
提案手法は, 故障検出精度, システムダウンタイム低減, 復旧速度の観点から, 従来の故障検出システムよりも有意に優れている。
論文 参考訳(メタデータ) (2025-05-16T23:02:57Z) - Adaptive Fault Tolerance Mechanisms of Large Language Models in Cloud Computing Environments [5.853391005435494]
本研究では,クラウドコンピューティングシナリオにおける大規模言語モデルの信頼性と可用性を確保するため,新しい適応型耐故障機構を提案する。
チェックポイント、冗長性、状態遷移といった既知のフォールトトレラントメカニズムに基づいて構築され、動的リソース割り当てとリアルタイムパフォーマンスメトリクスに基づく障害予測が導入されている。
論文 参考訳(メタデータ) (2025-03-15T18:45:33Z) - Causal Interventional Prediction System for Robust and Explainable Effect Forecasting [14.104665282086339]
AIに基づく予測システムの堅牢性と説明可能性について検討する。
我々は、変分オートエンコーダと多重計算の完全条件仕様に基づく因果介入予測システム(CIPS)を設計する。
論文 参考訳(メタデータ) (2024-07-29T04:16:45Z) - Root Causing Prediction Anomalies Using Explainable AI [3.970146574042422]
本稿では,機械学習モデルにおける根源的性能劣化に対する説明可能なAI(XAI)の新たな応用法を提案する。
単一機能の破損は、カスケード機能、ラベル、コンセプトドリフトを引き起こす可能性がある。
我々は、パーソナライズされた広告に使用されるモデルの信頼性を向上させるために、この手法をうまく応用した。
論文 参考訳(メタデータ) (2024-03-04T19:38:50Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Cloud Failure Prediction with Hierarchical Temporary Memory: An
Empirical Assessment [64.73243241568555]
Hierarchical Temporary Memory (HTM) は、新皮質の特徴にインスパイアされた教師なし学習アルゴリズムである。
本稿では,障害予測の文脈でHTMを評価する最初の体系的研究について述べる。
論文 参考訳(メタデータ) (2021-10-06T07:09:45Z) - Improving Uncertainty Calibration via Prior Augmented Data [56.88185136509654]
ニューラルネットワークは、普遍関数近似器として機能することで、複雑なデータ分布から学習することに成功した。
彼らはしばしば予測に自信過剰であり、不正確で誤った確率的予測に繋がる。
本稿では,モデルが不当に過信である特徴空間の領域を探索し,それらの予測のエントロピーをラベルの以前の分布に対して条件的に高める手法を提案する。
論文 参考訳(メタデータ) (2021-02-22T07:02:37Z) - Stochastically forced ensemble dynamic mode decomposition for
forecasting and analysis of near-periodic systems [65.44033635330604]
本稿では,観測力学を強制線形系としてモデル化した新しい負荷予測手法を提案する。
固有線型力学の利用は、解釈可能性やパーシモニーの観点から、多くの望ましい性質を提供することを示す。
電力グリッドからの負荷データを用いたテストケースの結果が提示される。
論文 参考訳(メタデータ) (2020-10-08T20:25:52Z) - A comprehensive study on the prediction reliability of graph neural
networks for virtual screening [0.0]
本稿では,モデルアーキテクチャ,正規化手法,損失関数が分類結果の予測性能および信頼性に与える影響について検討する。
その結果,高い成功率を達成するためには,正則化と推論手法の正しい選択が重要であることが明らかとなった。
論文 参考訳(メタデータ) (2020-03-17T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。