論文の概要: DiagNet: towards a generic, Internet-scale root cause analysis solution
- arxiv url: http://arxiv.org/abs/2004.03343v1
- Date: Tue, 7 Apr 2020 13:21:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 22:27:38.475902
- Title: DiagNet: towards a generic, Internet-scale root cause analysis solution
- Title(参考訳): DiagNet: ジェネリックでインターネット規模の根本原因分析ソリューションを目指して
- Authors: Lo\"ick Bonniot (WIDE), Christoph Neumann, Fran\c{c}ois Ta\"iani
(WIDE)
- Abstract要約: 我々は、インターネット規模の根本原因分析において、異なる機械学習技術がどのように使用できるかを示す。
当社のソリューションであるDiagNetは、画像処理研究の概念を応用して、ネットワークおよびシステムメトリクスを処理する。
推定時にのみ導入される原因を含む73.9%のリコールで有望な根本原因解析能力を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diagnosing problems in Internet-scale services remains particularly difficult
and costly for both content providers and ISPs. Because the Internet is
decentralized, the cause of such problems might lie anywhere between an
end-user's device and the service datacenters. Further, the set of possible
problems and causes is not known in advance, making it impossible in practice
to train a classifier with all combinations of problems, causes and locations.
In this paper, we explore how different machine learning techniques can be used
for Internet-scale root cause analysis using measurements taken from end-user
devices. We show how to build generic models that (i) are agnostic to the
underlying network topology, (ii) do not require to define the full set of
possible causes during training, and (iii) can be quickly adapted to diagnose
new services. Our solution, DiagNet, adapts concepts from image processing
research to handle network and system metrics. We evaluate DiagNet with a
multi-cloud deployment of online services with injected faults and emulated
clients with automated browsers. We demonstrate promising root cause analysis
capabilities, with a recall of 73.9% including causes only being introduced at
inference time.
- Abstract(参考訳): インターネット規模のサービスの診断は、コンテンツプロバイダとISPの両方にとって、特に困難でコストがかかる。
インターネットは分散化されているため、そのような問題の原因はエンドユーザのデバイスとサービスデータセンタの間にある可能性がある。
さらに、考えられる問題と原因のセットは事前には分かっておらず、問題、原因、場所のあらゆる組み合わせで分類器を訓練することは事実上不可能である。
本稿では,エンドユーザーデバイスからの計測値を用いて,インターネットスケールの根本原因分析に機械学習手法をどのように利用するかを検討する。
汎用モデルを構築する方法を示します
i) 基盤となるネットワークトポロジとは無関係である。
(二)訓練中に起こりうる原因の完全なセットを定義する必要はなく、
(iii) 新しいサービスの診断に迅速に適応することができる。
当社のソリューションであるDiagNetは、画像処理研究の概念を応用して、ネットワークおよびシステムメトリクスを処理する。
オンラインサービスのマルチクラウド展開によるDiagNetの評価と,自動ブラウザによるクライアントのエミュレートを行った。
推定時にのみ導入される原因を含む73.9%のリコールで有望な根本原因解析能力を示す。
関連論文リスト
- Don't Treat the Symptom, Find the Cause! Efficient
Artificial-Intelligence Methods for (Interactive) Debugging [0.0]
現代の世界では、私たちは、より高度な洗練のシステムに常用し、活用し、交流し、頼りにしています。
本論では、モデルに基づく診断の話題を紹介し、この分野の課題を指摘し、これらの課題に対処する研究からのアプローチの選択について論じる。
論文 参考訳(メタデータ) (2023-06-22T12:44:49Z) - Enabling Inter-organizational Analytics in Business Networks Through
Meta Machine Learning [0.0]
センシティブな情報を開示すると同時に、交換が必要なデータの量の多さが、効果的なシステムワイドソリューションの創出の鍵となるインヒビターである。
本稿では,これらの障害に対処し,ビジネスネットワーク内の包括的分析を可能にするメタ機械学習手法を提案する。
論文 参考訳(メタデータ) (2023-03-28T09:06:28Z) - Learning to Detect Critical Nodes in Sparse Graphs via Feature Importance Awareness [53.351863569314794]
クリティカルノード問題(CNP)は、削除が残余ネットワークのペア接続性を最大に低下させるネットワークから臨界ノードの集合を見つけることを目的としている。
本研究は,ノード表現のための特徴重要度対応グラフアテンションネットワークを提案する。
ダブルディープQネットワークと組み合わせて、初めてCNPを解くエンドツーエンドのアルゴリズムを作成する。
論文 参考訳(メタデータ) (2021-12-03T14:23:05Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - Analyzing Machine Learning Approaches for Online Malware Detection in
Cloud [0.0]
プロセスレベルのパフォーマンス指標に基づいてオンラインマルウェア検出を行い、異なる機械学習モデルの有効性を解析する。
我々の分析では、ニューラルネットワークモデルは、クラウド上の仮想マシンのプロセスレベル機能に最も正確なマルウェアを検出できると結論付けている。
論文 参考訳(メタデータ) (2021-05-19T17:28:12Z) - Machine Learning for Massive Industrial Internet of Things [69.52379407906017]
モノのインターネット(IIoT)は、モノのインターネット技術を産業環境に統合することで、将来の製造施設に革命をもたらします。
大規模なIIoTデバイスのデプロイでは、無線ネットワークがさまざまなQoS(Quality-of-Service)要件でユビキタス接続をサポートすることは困難である。
まず、一般的な非クリティカルかつクリティカルなIIoTユースケースの要件を要約します。
次に、大規模なIIoTシナリオと対応する機械学習ソリューションのユニークな特性を、その制限と潜在的な研究方向で識別します。
論文 参考訳(メタデータ) (2021-03-10T20:10:53Z) - Anytime Diagnosis for Reconfiguration [52.77024349608834]
我々は、いつでも直接診断できるflexdiagを紹介し分析する。
特徴モデルの領域からの構成ベンチマークと自動車領域からの産業構成知識ベースを使用して、性能および診断品質に関するアルゴリズムを評価します。
論文 参考訳(メタデータ) (2021-02-19T11:45:52Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Tomography Based Learning for Load Distribution through Opaque Networks [9.923523030849836]
オーバー・ザ・トップ(OTT)サービスプロバイダにとって重要なタスクは、遅延を最小限に抑えるため、ネットワークを通してトラフィックを送信することだ。
この問題は、トラフィックがブラックボックスネットワークに入る一連の入力をトラフィックソースが選択できる一般的な設定で検討する。
この問題を解決するための主要な技術的課題は、問題の高次元性と、ネットワークに固有の制約を扱うことである。
論文 参考訳(メタデータ) (2020-07-18T21:52:21Z) - Neuromorphic AI Empowered Root Cause Analysis of Faults in Emerging
Networks [3.710841042000923]
我々は、完全に自動化された自己修復システムに向けた重要なステップを提供する、AIベースの障害診断ソリューションを提案する。
提案手法の性能を,文学における最先端解と比較する。
その結果,ニューロモルフィック・コンピューティング・モデルは,他のモデルと比較して高い分類精度が得られた。
論文 参考訳(メタデータ) (2020-05-04T13:26:56Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。