論文の概要: Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets
- arxiv url: http://arxiv.org/abs/2210.01707v1
- Date: Tue, 4 Oct 2022 16:02:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:00:58.764526
- Title: Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets
- Title(参考訳): 逐次実世界データセット上の異常検出のための複数インスタンス学習
- Authors: Parastoo Kamranfar, David Lattanzi, Amarda Shehu, Daniel Barbar\'a
- Abstract要約: MIL(Multiple Instance Learning)は、トレーニングデータセットにおけるラベルの不完全な知識に関する問題に対して有効であることが示されている。
MILに基づく定式化と,異なる設計決定に基づいて,このフレームワークの様々なアルゴリズムのインスタンス化を提案する。
このフレームワークは、さまざまな現実世界のアプリケーションドメインから生じる多様なデータセットをうまく一般化する。
- 参考スコア(独自算出の注目度): 2.427831679672374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting anomalies over real-world datasets remains a challenging task. Data
annotation is an intensive human labor problem, particularly in sequential
datasets, where the start and end time of anomalies are not known. As a result,
data collected from sequential real-world processes can be largely unlabeled or
contain inaccurate labels. These characteristics challenge the application of
anomaly detection techniques based on supervised learning. In contrast,
Multiple Instance Learning (MIL) has been shown effective on problems with
incomplete knowledge of labels in the training dataset, mainly due to the
notion of bags. While largely under-leveraged for anomaly detection, MIL
provides an appealing formulation for anomaly detection over real-world
datasets, and it is the primary contribution of this paper. In this paper, we
propose an MIL-based formulation and various algorithmic instantiations of this
framework based on different design decisions for key components of the
framework. We evaluate the resulting algorithms over four datasets that capture
different physical processes along different modalities. The experimental
evaluation draws out several observations. The MIL-based formulation performs
no worse than single instance learning on easy to moderate datasets and
outperforms single-instance learning on more challenging datasets. Altogether,
the results show that the framework generalizes well over diverse datasets
resulting from different real-world application domains.
- Abstract(参考訳): 現実世界のデータセット上の異常を検出することは、依然として難しい課題だ。
データアノテーションは集中的な人的労働問題であり、特に連続したデータセットでは、異常の開始と終了が分かっていない。
その結果、シーケンシャルな実世界のプロセスから収集されたデータは、ほとんどラベル付けされないか、不正確なラベルを含むことができる。
これらの特徴は教師付き学習に基づく異常検出手法の適用に挑戦する。
対照的に、MIL(Multiple Instance Learning)は、主にバッグの概念のため、トレーニングデータセットにおけるラベルの不完全な知識の問題に有効であることが示されている。
MILは, 異常検出にはあまり役に立たないが, 実世界のデータセット上での異常検出に魅力的な定式化を提供する。
本稿では,MIL ベースの定式化と,フレームワークのキーコンポーネントに対する異なる設計決定に基づく様々なアルゴリズムインスタンス化を提案する。
得られたアルゴリズムを4つのデータセット上で評価し,様々な物理プロセスを異なるモダリティに沿ってキャプチャする。
実験ではいくつかの観察結果が得られた。
MILベースの定式化は、容易に適度なデータセットでシングルインスタンス学習をし、より困難なデータセットでシングルインスタンス学習を上回ります。
その結果,実世界の異なるアプリケーションドメインから得られる多種多様なデータセットに対して,フレームワークが十分に一般化していることが判明した。
関連論文リスト
- See it, Think it, Sorted: Large Multimodal Models are Few-shot Time Series Anomaly Analyzers [23.701716999879636]
時系列データの急激な増加に伴い,時系列異常検出(TSAD)はますます重要になりつつある。
本稿では,TMA(Time Series Anomaly Multimodal Analyzer)と呼ばれる先駆的なフレームワークを導入し,異常の検出と解釈を両立させる。
論文 参考訳(メタデータ) (2024-11-04T10:28:41Z) - Approaching Metaheuristic Deep Learning Combos for Automated Data Mining [0.5419570023862531]
本研究では,メタヒューリスティック手法を従来の分類器やニューラルネットワークと組み合わせて自動データマイニングを行う手法を提案する。
手書き文字認識のためのMNISTデータセットの実験を行った。
根拠真理ラベル付きデータセットの検証精度は、これまで見つからなかった他のデータインスタンスのラベルを修正するのに不十分である、という実証的な観察がなされた。
論文 参考訳(メタデータ) (2024-10-16T10:28:22Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - Binary Quantification and Dataset Shift: An Experimental Investigation [54.14283123210872]
量子化は教師付き学習タスクであり、未学習データの集合のクラス有病率の予測器を訓練する。
定量化と他のタイプのデータセットシフトの関係は、いまだ大きく、未調査のままである。
本稿では,これらのシフトに影響を受けるデータセットの生成プロトコルを確立することにより,データセットシフトの種類を詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T20:11:27Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Comparative Analysis of Extreme Verification Latency Learning Algorithms [3.3439097577935213]
本稿では、EVLアルゴリズムのいくつかの弱点と強みを指摘するための総合的な調査と比較分析を行う。
この研究は、この分野の既存のアルゴリズムのレビューを研究コミュニティに提供するための、非常に最初の取り組みである。
論文 参考訳(メタデータ) (2020-11-26T16:34:56Z) - Out-Of-Bag Anomaly Detection [0.9449650062296822]
データ異常は、実世界のデータセットでユビキタスであり、機械学習(ML)システムに悪影響を及ぼす可能性がある。
本稿では,新しいモデルに基づく異常検出手法を提案し,その手法をアウト・オブ・バグ検出と呼ぶ。
本手法は,家庭評価のケーススタディを通じて,データ前処理のステップとして,MLシステムの精度と信頼性を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-09-20T06:01:52Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z) - Meta Learning for Causal Direction [29.00522306460408]
小型データ設定における原因と効果の区別を可能にする新しい生成モデルを提案する。
提案手法は, 各種合成データと実世界のデータを用いて実証し, 種々のデータセットサイズにおける方向検出の精度を高い精度で維持可能であることを示す。
論文 参考訳(メタデータ) (2020-07-06T15:12:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。