論文の概要: Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets
- arxiv url: http://arxiv.org/abs/2210.01707v1
- Date: Tue, 4 Oct 2022 16:02:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 15:00:58.764526
- Title: Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets
- Title(参考訳): 逐次実世界データセット上の異常検出のための複数インスタンス学習
- Authors: Parastoo Kamranfar, David Lattanzi, Amarda Shehu, Daniel Barbar\'a
- Abstract要約: MIL(Multiple Instance Learning)は、トレーニングデータセットにおけるラベルの不完全な知識に関する問題に対して有効であることが示されている。
MILに基づく定式化と,異なる設計決定に基づいて,このフレームワークの様々なアルゴリズムのインスタンス化を提案する。
このフレームワークは、さまざまな現実世界のアプリケーションドメインから生じる多様なデータセットをうまく一般化する。
- 参考スコア(独自算出の注目度): 2.427831679672374
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting anomalies over real-world datasets remains a challenging task. Data
annotation is an intensive human labor problem, particularly in sequential
datasets, where the start and end time of anomalies are not known. As a result,
data collected from sequential real-world processes can be largely unlabeled or
contain inaccurate labels. These characteristics challenge the application of
anomaly detection techniques based on supervised learning. In contrast,
Multiple Instance Learning (MIL) has been shown effective on problems with
incomplete knowledge of labels in the training dataset, mainly due to the
notion of bags. While largely under-leveraged for anomaly detection, MIL
provides an appealing formulation for anomaly detection over real-world
datasets, and it is the primary contribution of this paper. In this paper, we
propose an MIL-based formulation and various algorithmic instantiations of this
framework based on different design decisions for key components of the
framework. We evaluate the resulting algorithms over four datasets that capture
different physical processes along different modalities. The experimental
evaluation draws out several observations. The MIL-based formulation performs
no worse than single instance learning on easy to moderate datasets and
outperforms single-instance learning on more challenging datasets. Altogether,
the results show that the framework generalizes well over diverse datasets
resulting from different real-world application domains.
- Abstract(参考訳): 現実世界のデータセット上の異常を検出することは、依然として難しい課題だ。
データアノテーションは集中的な人的労働問題であり、特に連続したデータセットでは、異常の開始と終了が分かっていない。
その結果、シーケンシャルな実世界のプロセスから収集されたデータは、ほとんどラベル付けされないか、不正確なラベルを含むことができる。
これらの特徴は教師付き学習に基づく異常検出手法の適用に挑戦する。
対照的に、MIL(Multiple Instance Learning)は、主にバッグの概念のため、トレーニングデータセットにおけるラベルの不完全な知識の問題に有効であることが示されている。
MILは, 異常検出にはあまり役に立たないが, 実世界のデータセット上での異常検出に魅力的な定式化を提供する。
本稿では,MIL ベースの定式化と,フレームワークのキーコンポーネントに対する異なる設計決定に基づく様々なアルゴリズムインスタンス化を提案する。
得られたアルゴリズムを4つのデータセット上で評価し,様々な物理プロセスを異なるモダリティに沿ってキャプチャする。
実験ではいくつかの観察結果が得られた。
MILベースの定式化は、容易に適度なデータセットでシングルインスタンス学習をし、より困難なデータセットでシングルインスタンス学習を上回ります。
その結果,実世界の異なるアプリケーションドメインから得られる多種多様なデータセットに対して,フレームワークが十分に一般化していることが判明した。
関連論文リスト
- Contrastive Multiple Instance Learning for Weakly Supervised Person ReID [50.04900262181093]
本稿では、より効果的に教師付きされたReIDに適した新しいフレームワークであるContrastive Multiple Instance Learning (CMIL)を紹介する。
CMILは、対照的な損失を生かしながら、単一のモデルと擬似ラベルを必要とせず、自分自身を区別する。
PerformancePhoto.coの実際のアプリケーションから自然に発生する弱いラベルを特徴とするMUDDデータセットの拡張であるWL-MUDDデータセットをリリースする。
論文 参考訳(メタデータ) (2024-02-12T14:48:31Z) - Binary Quantification and Dataset Shift: An Experimental Investigation [54.14283123210872]
量子化は教師付き学習タスクであり、未学習データの集合のクラス有病率の予測器を訓練する。
定量化と他のタイプのデータセットシフトの関係は、いまだ大きく、未調査のままである。
本稿では,これらのシフトに影響を受けるデータセットの生成プロトコルを確立することにより,データセットシフトの種類を詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2023-10-06T20:11:27Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Adversarial Deep Feature Extraction Network for User Independent Human
Activity Recognition [4.988898367111902]
本稿では,人間行動認識のための最大平均不一致(MMD)正則化を用いた対向的対象非依存特徴抽出法を提案する。
本手法は,ユーザに依存しない性能を著しく向上し,結果のばらつきを低減できることを示す,よく知られた公開データセット上での評価を行う。
論文 参考訳(メタデータ) (2021-10-23T07:50:32Z) - Multiscale Laplacian Learning [3.24029503704305]
本稿では,機械学習タスクに対する2つの革新的なマルチスケールラプラシアン学習手法を提案する。
マルチカーネル多様体学習(MML)と呼ばれる最初のアプローチは、マルチカーネル情報と多様体学習を統合する。
2つ目のアプローチは、MBO (Multiscale MBO) 法と呼ばれ、有名な古典的なメリマン・バーンス=オッシャースキームの修正にマルチスケールのラプラシアンを導入している。
論文 参考訳(メタデータ) (2021-09-08T15:25:32Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Comparative Analysis of Extreme Verification Latency Learning Algorithms [3.3439097577935213]
本稿では、EVLアルゴリズムのいくつかの弱点と強みを指摘するための総合的な調査と比較分析を行う。
この研究は、この分野の既存のアルゴリズムのレビューを研究コミュニティに提供するための、非常に最初の取り組みである。
論文 参考訳(メタデータ) (2020-11-26T16:34:56Z) - Out-Of-Bag Anomaly Detection [0.9449650062296822]
データ異常は、実世界のデータセットでユビキタスであり、機械学習(ML)システムに悪影響を及ぼす可能性がある。
本稿では,新しいモデルに基づく異常検出手法を提案し,その手法をアウト・オブ・バグ検出と呼ぶ。
本手法は,家庭評価のケーススタディを通じて,データ前処理のステップとして,MLシステムの精度と信頼性を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-09-20T06:01:52Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z) - Meta Learning for Causal Direction [29.00522306460408]
小型データ設定における原因と効果の区別を可能にする新しい生成モデルを提案する。
提案手法は, 各種合成データと実世界のデータを用いて実証し, 種々のデータセットサイズにおける方向検出の精度を高い精度で維持可能であることを示す。
論文 参考訳(メタデータ) (2020-07-06T15:12:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。