論文の概要: TVDiag: A Task-oriented and View-invariant Failure Diagnosis Framework with Multimodal Data
- arxiv url: http://arxiv.org/abs/2407.19711v1
- Date: Mon, 29 Jul 2024 05:26:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 14:56:26.235350
- Title: TVDiag: A Task-oriented and View-invariant Failure Diagnosis Framework with Multimodal Data
- Title(参考訳): TVDiag:マルチモーダルデータを用いたタスク指向・ビュー不変の故障診断フレームワーク
- Authors: Shuaiyu Xie, Jian Wang, Hanbin He, Zhihao Wang, Yuqi Zhao, Neng Zhang, Bing Li,
- Abstract要約: マイクロサービスベースのシステムは、複雑なインタラクションとスケールの拡大によって、信頼性上の問題に悩まされることが多い。
単一モードのデータを使用する従来の障害診断方法は、制限された情報のため、すべての障害シナリオをほとんどカバーできない。
我々は,マルチモーダルな障害診断フレームワークである textitTVDiag を提案する。
- 参考スコア(独自算出の注目度): 11.373761837547852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Microservice-based systems often suffer from reliability issues due to their intricate interactions and expanding scale. With the rapid growth of observability techniques, various methods have been proposed to achieve failure diagnosis, including root cause localization and failure type identification, by leveraging diverse monitoring data such as logs, metrics, or traces. However, traditional failure diagnosis methods that use single-modal data can hardly cover all failure scenarios due to the restricted information. Several failure diagnosis methods have been recently proposed to integrate multimodal data based on deep learning. These methods, however, tend to combine modalities indiscriminately and treat them equally in failure diagnosis, ignoring the relationship between specific modalities and different diagnostic tasks. This oversight hinders the effective utilization of the unique advantages offered by each modality. To address the limitation, we propose \textit{TVDiag}, a multimodal failure diagnosis framework for locating culprit microservice instances and identifying their failure types (e.g., Net-packets Corruption) in microservice-based systems. \textit{TVDiag} employs task-oriented learning to enhance the potential advantages of each modality and establishes cross-modal associations based on contrastive learning to extract view-invariant failure information. Furthermore, we develop a graph-level data augmentation strategy that randomly inactivates the observability of some normal microservice instances during training to mitigate the shortage of training data. Experimental results show that \textit{TVDiag} outperforms state-of-the-art methods in multimodal failure diagnosis, achieving at least a 55.94\% higher $HR@1$ accuracy and over a 4.08\% increase in F1-score across two datasets.
- Abstract(参考訳): マイクロサービスベースのシステムは、複雑なインタラクションとスケールの拡大によって、信頼性上の問題に悩まされることが多い。
観測可能性技術の急速な成長に伴い、ログやメトリクス、トレースといった多様なモニタリングデータを活用することにより、根本原因のローカライゼーションや障害タイプ識別など、さまざまな障害診断を実現する方法が提案されている。
しかし、単一モーダルデータを使用する従来の障害診断手法では、制限された情報のため、すべての障害シナリオをほとんどカバーできない。
近年,深層学習に基づくマルチモーダルデータ統合のための故障診断手法が提案されている。
しかしながら、これらの手法は、特定のモダリティと異なる診断タスクとの関係を無視して、非差別的にモダリティを結合し、障害診断においてそれらを等しく扱う傾向にある。
この監視は、各モダリティが提供するユニークな利点の有効利用を妨げる。
この制限に対処するため、我々は、マイクロサービスベースのシステムにおいて、犯人のマイクロサービスインスタンスを特定し、それらの障害タイプ(Net-packets Corruptionなど)を特定するためのマルチモーダルな障害診断フレームワークである、‘textit{TVDiag}’を提案する。
\textit{TVDiag} はタスク指向学習を用いて各モダリティの潜在的な優位性を高め、対照的な学習に基づくクロスモーダルなアソシエーションを確立し、ビュー不変の障害情報を抽出する。
さらに、トレーニング中の通常のマイクロサービスインスタンスの可観測性をランダムに不活性化するグラフレベルのデータ拡張戦略を開発し、トレーニングデータの不足を軽減する。
実験結果によると、‘textit{TVDiag} はマルチモーダル故障診断における最先端の手法よりも優れており、2つのデータセットで F1スコアが4.08 %以上上昇し、少なくとも55.94 %高いHR@1$精度を達成した。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Self-Supervised Time-Series Anomaly Detection Using Learnable Data Augmentation [37.72735288760648]
本稿では,学習可能なデータ拡張に基づく時系列異常検出(LATAD)手法を提案する。
LATADは、比較学習を通じて時系列データから識別的特徴を抽出する。
その結果、LATADは最先端の異常検出評価に匹敵する、あるいは改善された性能を示した。
論文 参考訳(メタデータ) (2024-06-18T04:25:56Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Active Foundational Models for Fault Diagnosis of Electrical Motors [0.5999777817331317]
電気モーターの故障検出と診断は、産業システムの安全かつ信頼性の高い運転を保証する上で最も重要である。
マシン故障診断のための既存のデータ駆動ディープラーニングアプローチは、大量のラベル付きサンプルに大きく依存している。
ラベル付きサンプルを少ない量で活用する基礎モデルに基づくアクティブラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-27T03:25:12Z) - Dynamic Multimodal Information Bottleneck for Multimodality
Classification [26.65073424377933]
本稿では,頑健な融合特徴表現を実現するための動的マルチモーダル情報ボトルネックフレームワークを提案する。
具体的には、情報ボトルネックモジュールは、融合機能におけるタスク関連情報やノイズをフィルタリングするのに役立ちます。
提案手法は最先端の手法を超越し, 大規模ノイズチャネルが存在する場合, 性能を維持できる唯一の手法である。
論文 参考訳(メタデータ) (2023-11-02T08:34:08Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Robust Multimodal Failure Detection for Microservice Systems [32.25907616511765]
AnoFusionは、マイクロサービスシステムに対する教師なしの障害検出アプローチである。
異種マルチモーダルデータの相関を学習し、グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Unit)を統合する。
これはそれぞれ0.857と0.922のF1スコアを達成し、最先端の故障検出手法より優れている。
論文 参考訳(メタデータ) (2023-05-30T12:39:42Z) - Robust Failure Diagnosis of Microservice System through Multimodal Data [14.720995687799668]
マルチモーダルデータを用いた堅牢な故障診断手法であるDagFusionを提案する。
評価の結果,DagFusion はルート原因インスタンスの局所化や障害タイプ決定の点で既存手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-21T08:28:28Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。