Fugu-MT 論文翻訳(概要): A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection

論文の概要: A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection

arxiv url: http://arxiv.org/abs/2307.16714v2
Date: Mon, 20 May 2024 12:23:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-22 00:40:21.347862
Title: A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection
Title（参考訳）: ログベース異常検出のための機械学習手法に関する総合的研究
Authors: Shan Ali, Chaima Boufaied, Domenico Bianculli, Paula Branco, Lionel Briand,
Abstract要約: システム複雑性の増大により、ログベースの異常検出専用の自動化技術の必要性が高まっている。現在の評価は検出精度の評価に大きく依存している。本稿では,教師付き,半教師付き,従来型,深層ML技術の評価を行う総合的な実証的研究について述べる。
参考スコア（独自算出の注目度）: 2.8211470326790606
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Growth in system complexity increases the need for automated techniques dedicated to different log analysis tasks such as Log-based Anomaly Detection (LAD). The latter has been widely addressed in the literature, mostly by means of a variety of deep learning techniques. Despite their many advantages, that focus on deep learning techniques is somewhat arbitrary as traditional Machine Learning (ML) techniques may perform well in many cases, depending on the context and datasets. In the same vein, semi-supervised techniques deserve the same attention as supervised techniques since the former have clear practical advantages. Further, current evaluations mostly rely on the assessment of detection accuracy. However, this is not enough to decide whether or not a specific ML technique is suitable to address the LAD problem in a given context. Other aspects to consider include training and prediction times as well as the sensitivity to hyperparameter tuning, which in practice matters to engineers. In this paper, we present a comprehensive empirical study, in which we evaluate supervised and semi-supervised, traditional and deep ML techniques w.r.t. four evaluation criteria: detection accuracy, time performance, sensitivity of detection accuracy and time performance to hyperparameter tuning. The experimental results show that supervised traditional and deep ML techniques fare similarly in terms of their detection accuracy and prediction time. Moreover, overall, sensitivity analysis to hyperparameter tuning w.r.t. detection accuracy shows that supervised traditional ML techniques are less sensitive than deep learning techniques. Further, semi-supervised techniques yield significantly worse detection accuracy than supervised techniques.
Abstract（参考訳）: システム複雑性の増大により、ログベースの異常検出(LAD)など、さまざまなログ分析タスクに特化した自動化技術の必要性が高まっている。後者は文学で広く取り上げられており、主に様々な深層学習技術によって研究されている。ディープラーニング技術には多くの利点があるが、従来の機械学習(ML)技術は多くのケースにおいて、コンテキストやデータセットによってうまく機能する可能性があるため、ある程度は任意である。半監督的技法は、前者が明確な実践上の優位性を持っているため、半監督的技法と同一の注意を払っている。さらに、現在の評価は検出精度の評価に大きく依存している。しかし、特定のMLテクニックが与えられたコンテキストにおけるLAD問題に対処するのに適したかどうかを決定するのに十分ではない。その他の考慮すべき側面としては、トレーニングや予測時間、ハイパーパラメータチューニングに対する感度などがあります。本稿では,教師付き,半教師付き,従来型,深層ML技術の4つの評価基準として,検出精度,時間性能,検出精度の感度,ハイパーパラメータチューニングに対する時間性能の4つの評価基準を提案する。実験結果から,従来のML手法と深部ML手法は,検出精度と予測時間に類似していることがわかった。さらに、総合的に、ハイパーパラメータチューニングw.r.t.検出精度に対する感度解析は、教師付き従来のML技術がディープラーニング技術よりも感度が低いことを示している。さらに、半教師技術は教師技術よりも検出精度が著しく低い。

関連論文リスト

Hyperspectral Anomaly Detection Methods: A Survey and Comparative Study [1.074960192271861]
ハイパースペクトル異常検出(ハイパースペクトル異常検出、英: Hyperspectral Anomaly Detection、HAD)は、超スペクトルシーンやターゲットスペクトルに関する事前情報なしで、そのようなデータ中の異常なターゲットを特定し、位置を特定する技術である。本研究では,様々なHAD手法を包括的に比較し,統計モデル,表現ベース手法,古典的機械学習手法,ディープラーニングモデルに分類する。その結果,ディープラーニングモデルは検出精度が最も高かったのに対し,統計モデルは全データセットで例外的な速度を示した。
論文参考訳（メタデータ） (2025-07-08T07:23:24Z)
Probing Deep into Temporal Profile Makes the Infrared Small Target Detector Much Better [63.567886330598945]
赤外線小目標(IRST)検出は、精度、普遍性、堅牢性、効率的な性能を同時に達成する上で困難である。現在の学習に基づく手法は、空間的領域と短期的領域の両方から"より多くの情報を活用する。本稿では、IRST検出のための時間次元でのみ計算を行う効率的な深部プローブネットワーク(DeepPro)を提案する。
論文参考訳（メタデータ） (2025-06-15T08:19:32Z)
Benchmarking Machine Learning Methods for Distributed Acoustic Sensing [0.7366405857677227]
分散音響センシング(DAS)技術は、光ファイバーに沿った微小な摂動を検出することによって、リアルタイムの音響信号監視を可能にする。本研究では,DASデータ認識・解釈の文脈における古典的機械学習手法と最先端ディープラーニングモデルの比較性能特性を批判的に検討する。
論文参考訳（メタデータ） (2025-03-26T16:17:22Z)
Automated Flow Pattern Classification in Multi-phase Systems Using AI and Capacitance Sensing Techniques [0.9374652839580183]
本研究では,従来の技術と比較して,容量センサとAI駆動型分類手法を統合した新しいプラットフォームを提案する。実験の結果,提案手法は1D SENet深層学習モデルを用いて,実験ベースデータセットでは85%以上の精度,パターンベースデータセットでは71%以上の精度を実現している。この作業は、リアルタイムフロー監視と予測モデリングのためのトランスフォーメーションパスを提供し、産業アプリケーションにおける重要な課題に対処する。
論文参考訳（メタデータ） (2025-02-23T04:11:29Z)
What Really Matters for Learning-based LiDAR-Camera Calibration [50.2608502974106]
本稿では,学習に基づくLiDAR-Cameraキャリブレーションの開発を再考する。我々は、広く使われているデータ生成パイプラインによる回帰ベースの手法の限界を識別する。また,入力データ形式と前処理操作がネットワーク性能に与える影響についても検討する。
論文参考訳（メタデータ） (2025-01-28T14:12:32Z)
Optimizing Multispectral Object Detection: A Bag of Tricks and Comprehensive Benchmarks [49.84182981950623]
RGBおよびTIR(熱赤外)変調を利用したマルチスペクトル物体検出は,課題として広く認識されている。モダリティと堅牢な融合戦略の両方から特徴を効果的に抽出するだけでなく、スペクトルの相違といった問題に対処する能力も必要である。本稿では,高パフォーマンス単一モードモデルのシームレスな最適化が可能な,効率的かつ容易にデプロイ可能なマルチスペクトルオブジェクト検出フレームワークを提案する。
論文参考訳（メタデータ） (2024-11-27T12:18:39Z)
Vulnerability Detection via Topological Analysis of Attention Maps [0.0]
本研究では,トポロジカルデータ解析(TDA)のツールを用いた脆弱性検出手法を提案する。その結果,従来の機械学習(ML)技術は,これらの注意行列から抽出したトポロジ的特徴を訓練することで,事前学習言語モデル(LLM)と競争的に動作できることが判明した。これは、永続的ホモロジーを含むTDAツールが、脆弱性を特定するために重要な意味情報を効果的にキャプチャできることを示している。
論文参考訳（メタデータ） (2024-10-04T14:40:11Z)
Semantic-Guided RL for Interpretable Feature Engineering [0.0]
SMARTはセマンティック技術を用いて解釈可能な特徴の生成を誘導するハイブリッドアプローチである。公開データセットを用いた実験により,SMARTは高い解釈性を確保しつつ予測精度を大幅に向上することを示した。
論文参考訳（メタデータ） (2024-10-03T14:28:05Z)
Machine Learning, Deep Learning and Data Preprocessing Techniques for Detection, Prediction, and Monitoring of Stress and Stress-related Mental Disorders: A Scoping Review [0.0]
メンタルストレスとそれに伴う精神障害(MD)は、公衆衛生上の重要な問題である。機械学習(ML)の出現により、これらの問題を理解し、対処するための計算技術を活用する可能性がある。本研究の目的は,精神ストレスとMDの検出,予測,分析に使用されるML方法論のスコープを検討することである。
論文参考訳（メタデータ） (2023-08-08T22:47:12Z)
Efficient Deep Reinforcement Learning Requires Regulating Overfitting [91.88004732618381]
本稿では,高時間差(TD)誤差が深部RLアルゴリズムの性能に悪影響を及ぼす主要な原因であることを示す。検証TDエラーをターゲットとした簡単なオンラインモデル選択法は,状態ベースDMCおよびGymタスク間で有効であることを示す。
論文参考訳（メタデータ） (2023-04-20T17:11:05Z)
MGTBench: Benchmarking Machine-Generated Text Detection [54.81446366272403]
本稿では,強力な大規模言語モデル(LLM)に対するMGT検出のための最初のベンチマークフレームワークを提案する。一般に単語が多ければ多いほど性能が向上し,ほとんどの検出手法はトレーニングサンプルをはるかに少なくして同様の性能が得られることを示す。本研究は, テキスト属性タスクにおいて, モデルに基づく検出手法が依然として有効であることを示す。
論文参考訳（メタデータ） (2023-03-26T21:12:36Z)
Harnessing the Speed and Accuracy of Machine Learning to Advance Cybersecurity [0.0]
従来のシグネチャベースのマルウェア検出方法は、複雑な脅威を検出するのに制限がある。近年、機械学習はマルウェアを効果的に検出する有望なソリューションとして出現している。 MLアルゴリズムは、大規模なデータセットを分析し、人間が識別するのが困難なパターンを特定することができる。
論文参考訳（メタデータ） (2023-02-24T02:42:38Z)
Detecting Shortcut Learning for Fair Medical AI using Shortcut Testing [62.9062883851246]
機械学習は医療の改善に大いに貢献するが、その利用が健康格差を広めたり増幅したりしないことを確実にすることは重要である。アルゴリズムの不公平性の潜在的な要因の1つ、ショートカット学習は、トレーニングデータにおける不適切な相関に基づいてMLモデルが予測した時に発生する。マルチタスク学習を用いて,臨床MLシステムの公平性評価の一環として,ショートカット学習の評価と緩和を行う手法を提案する。
論文参考訳（メタデータ） (2022-07-21T09:35:38Z)
Transfer Learning for Autonomous Chatter Detection in Machining [0.9281671380673306]
大振幅のシャッター振動は加工過程において最も重要な現象の1つである。業界全体でのチャット検出に機械学習を適用する上で、3つの課題が特定できる。これら3つの課題は、移行学習の傘の下でグループ化することができる。
論文参考訳（メタデータ） (2022-04-11T20:46:06Z)
Forecast Evaluation for Data Scientists: Common Pitfalls and Best Practices [4.2951168699706646]
本稿では,全体予測プロセスにおける最も重要なステップの1つ,すなわち評価について,チュートリアルライクにまとめる。非正規性や非定常性といった時系列の異なる問題特性について詳述する。予測評価のベストプラクティスは、データのパーティショニング、エラー計算、統計的テストなど、さまざまなステップについて概説されている。
論文参考訳（メタデータ） (2022-03-21T03:24:46Z)
Unsupervised deep learning techniques for powdery mildew recognition based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文参考訳（メタデータ） (2021-12-20T13:29:13Z)
Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文参考訳（メタデータ） (2021-11-09T13:30:34Z)
Semantic Perturbations with Normalizing Flows for Improved Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文参考訳（メタデータ） (2021-08-18T03:20:00Z)
Signal Processing and Machine Learning Techniques for Terahertz Sensing: An Overview [89.09270073549182]
テラヘルツ(THz)信号生成と放射法は、無線システムの未来を形作っている。 THz 固有の信号処理技術は、THz 帯域の効率的な利用のために、この THz センシングへの関心を補う必要がある。本稿では,信号前処理に着目した手法の概要を示す。また,THz帯で有望な知覚能力を探索し,深層学習の有効性についても検討した。
論文参考訳（メタデータ） (2021-04-09T01:38:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。