論文の概要: Robust Failure Diagnosis of Microservice System through Multimodal Data
- arxiv url: http://arxiv.org/abs/2302.10512v2
- Date: Wed, 31 May 2023 14:53:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 13:17:16.527936
- Title: Robust Failure Diagnosis of Microservice System through Multimodal Data
- Title(参考訳): マルチモーダルデータによるマイクロサービスシステムのロバスト故障診断
- Authors: Shenglin Zhang, Pengxiang Jin, Zihan Lin, Yongqian Sun, Bicheng Zhang,
Sibo Xia, Zhengdan Li, Zhenyu Zhong, Minghua Ma, Wa Jin, Dai Zhang, Zhenyu
Zhu, Dan Pei
- Abstract要約: マルチモーダルデータを用いた堅牢な故障診断手法であるDagFusionを提案する。
評価の結果,DagFusion はルート原因インスタンスの局所化や障害タイプ決定の点で既存手法よりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 14.720995687799668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic failure diagnosis is crucial for large microservice systems.
Currently, most failure diagnosis methods rely solely on single-modal data
(i.e., using either metrics, logs, or traces). In this study, we conduct an
empirical study using real-world failure cases to show that combining these
sources of data (multimodal data) leads to a more accurate diagnosis. However,
effectively representing these data and addressing imbalanced failures remain
challenging. To tackle these issues, we propose DiagFusion, a robust failure
diagnosis approach that uses multimodal data. It leverages embedding techniques
and data augmentation to represent the multimodal data of service instances,
combines deployment data and traces to build a dependency graph, and uses a
graph neural network to localize the root cause instance and determine the
failure type. Our evaluations using real-world datasets show that DiagFusion
outperforms existing methods in terms of root cause instance localization
(improving by 20.9% to 368%) and failure type determination (improving by 11.0%
to 169%).
- Abstract(参考訳): 大規模なマイクロサービスシステムには,自動障害診断が不可欠だ。
現在、ほとんどの障害診断方法は単一のモーダルデータのみに依存している(メトリクス、ログ、トレースを使用する)。
本研究では,実世界の障害事例を用いて経験的研究を行い,これらのデータ(マルチモーダルデータ)の組み合わせがより正確な診断につながることを示す。
しかし、これらのデータを効果的に表現し、不均衡な障害に対処することは依然として困難である。
このような問題に対処するため,マルチモーダルデータを用いた堅牢な故障診断手法であるDiagFusionを提案する。
サービスインスタンスのマルチモーダルデータを表現するために組み込み技術とデータ拡張を利用し、デプロイデータとトレースを組み合わせて依存性グラフを構築し、グラフニューラルネットワークを使用して根本原因インスタンスをローカライズし、障害タイプを決定する。
実世界のデータセットを用いた評価では、DagFusionはルート原因インスタンスのローカライゼーション(20.9%から368%)と障害型判定(11.0%から169%)で既存手法よりも優れていた。
関連論文リスト
- TVDiag: A Task-oriented and View-invariant Failure Diagnosis Framework with Multimodal Data [11.373761837547852]
マイクロサービスベースのシステムは、複雑なインタラクションとスケールの拡大によって、信頼性上の問題に悩まされることが多い。
単一モードのデータを使用する従来の障害診断方法は、制限された情報のため、すべての障害シナリオをほとんどカバーできない。
我々は,マルチモーダルな障害診断フレームワークである textitTVDiag を提案する。
論文 参考訳(メタデータ) (2024-07-29T05:26:57Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。
このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文 参考訳(メタデータ) (2024-01-29T03:42:37Z) - Robust Multimodal Failure Detection for Microservice Systems [32.25907616511765]
AnoFusionは、マイクロサービスシステムに対する教師なしの障害検出アプローチである。
異種マルチモーダルデータの相関を学習し、グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Unit)を統合する。
これはそれぞれ0.857と0.922のF1スコアを達成し、最先端の故障検出手法より優れている。
論文 参考訳(メタデータ) (2023-05-30T12:39:42Z) - Heterogeneous Anomaly Detection for Software Systems via Semi-supervised
Cross-modal Attention [29.654681594903114]
ヘテロジニアスデータに基づいてシステム異常を識別する,最初のエンドツーエンドの半教師付きアプローチであるHadesを提案する。
当社のアプローチでは,ログセマンティクスとメトリックパターンを融合させることで,システムステータスのグローバルな表現を学ぶために階層的アーキテクチャを採用している。
我々はHuawei Cloudの大規模シミュレーションデータとデータセットに基づいてHadesを広範囲に評価する。
論文 参考訳(メタデータ) (2023-02-14T09:02:11Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate
Time Series Data [13.864161788250856]
TranADはディープトランスネットワークに基づく異常検出および診断モデルである。
注意に基づくシーケンスエンコーダを使用して、データ内のより広い時間的傾向の知識を迅速に推論する。
TranADは、データと時間効率のトレーニングによる検出と診断のパフォーマンスにおいて、最先端のベースラインメソッドよりも優れています。
論文 参考訳(メタデータ) (2022-01-18T19:41:29Z) - A graph representation based on fluid diffusion model for multimodal
data analysis: theoretical aspects and enhanced community detection [14.601444144225875]
流体拡散に基づくグラフ定義の新しいモデルを提案する。
本手法は,マルチモーダルデータ解析において,コミュニティ検出のための最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-12-07T16:30:03Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。