論文の概要: Learning to Detect Interesting Anomalies
- arxiv url: http://arxiv.org/abs/2210.16334v1
- Date: Fri, 28 Oct 2022 18:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 16:14:44.298785
- Title: Learning to Detect Interesting Anomalies
- Title(参考訳): 興味ある異常を検出するための学習
- Authors: Alireza Vafaei Sadr, Bruce A. Bassett, Emmanuel Sekyi
- Abstract要約: AHUNTはMNIST, CIFAR10, Galaxy-DESIデータに対して優れた性能を示す。
AHUNTはまた、Oracleの評価に応じて、異常クラスの数を有機的に成長させることを可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection algorithms are typically applied to static, unchanging,
data features hand-crafted by the user. But how does a user systematically
craft good features for anomalies that have never been seen? Here we couple
deep learning with active learning -- in which an Oracle iteratively labels
small amounts of data selected algorithmically over a series of rounds -- to
automatically and dynamically improve the data features for efficient outlier
detection. This approach, AHUNT, shows excellent performance on MNIST, CIFAR10,
and Galaxy-DESI data, significantly outperforming both standard anomaly
detection and active learning algorithms with static feature spaces. Beyond
improved performance, AHUNT also allows the number of anomaly classes to grow
organically in response to Oracle's evaluations. Extensive ablation studies
explore the impact of Oracle question selection strategy and loss function on
performance. We illustrate how the dynamic anomaly class taxonomy represents
another step towards fully personalized rankings of different anomaly classes
that reflect a user's interests, allowing the algorithm to learn to ignore
statistically significant but uninteresting outliers (e.g., noise). This should
prove useful in the era of massive astronomical datasets serving diverse sets
of users who can only review a tiny subset of the incoming data.
- Abstract(参考訳): 異常検出アルゴリズムは通常、ユーザーが手作りの静的で不変なデータ特徴に適用される。
しかし、ユーザがこれまで見たことのない異常に対して、どのようにして優れた機能を体系的に構築するのか?
ここでは、oracleが一連のラウンドを通じてアルゴリズムで選択した少数のデータを反復的にラベル付けするアクティブラーニングとディープラーニングを組み合わせることで、効率的な異常検出のためにデータ機能を自動的かつ動的に改善します。
このアプローチであるAHUNTは、MNIST、CIFAR10、Galaxy-DESIデータに対して優れた性能を示し、静的な特徴空間を持つ標準的な異常検出とアクティブな学習アルゴリズムの両方を著しく上回っている。
パフォーマンスの改善に加えて、AHUNTはOracleの評価に応じて、異常なクラスの数を有機的に成長させることもできる。
広範囲なアブレーション研究は、oracleの質問選択戦略と損失関数がパフォーマンスに与える影響を探求する。
動的異常クラス分類は、ユーザの興味を反映した様々な異常クラスの完全パーソナライズされたランキングへの別のステップを示し、アルゴリズムが統計的に有意だが興味のないアウトリーチ(ノイズなど)を無視することを学習できるようにする。
これは、受信したデータの小さなサブセットのみをレビューできる多様なユーザのセットを提供する大規模な天文学データセットの時代において有用であることが証明される。
関連論文リスト
- LLM-assisted Explicit and Implicit Multi-interest Learning Framework for Sequential Recommendation [50.98046887582194]
本研究では,ユーザの興味を2つのレベル – 行動と意味論 – でモデル化する,明示的で暗黙的な多目的学習フレームワークを提案する。
提案するEIMFフレームワークは,小型モデルとLLMを効果的に組み合わせ,多目的モデリングの精度を向上させる。
論文 参考訳(メタデータ) (2024-11-14T13:00:23Z) - Cluster Metric Sensitivity to Irrelevant Features [0.0]
異なる種類の無関係変数が、異なる方法で$k$-meansからクラスタリングの結果にどのように影響するかを示す。
以上の結果から,シルエット係数とデイビー=ボルディンスコアは,無関係な付加機能に対して最も敏感であることが示唆された。
論文 参考訳(メタデータ) (2024-02-19T10:02:00Z) - Can Tree Based Approaches Surpass Deep Learning in Anomaly Detection? A
Benchmarking Study [0.6291443816903801]
本稿では,機械学習に基づく異常検出アルゴリズムの多種多様さを評価する。
本論文は, 種々の異常検出アルゴリズムの非バイアス比較を行うことにより, 顕著に寄与する。
論文 参考訳(メタデータ) (2024-02-11T19:12:51Z) - Active anomaly detection based on deep one-class classification [9.904380236739398]
我々は,Deep SVDDにおけるアクティブラーニングの2つの重要な課題,すなわちクエリ戦略と半教師付きラーニング手法に対処する。
まず、単に異常を識別するのではなく、適応境界に従って不確実なサンプルを選択する。
第2に、ラベル付き正規データと異常データの両方を効果的に組み込むために、一級分類モデルの訓練にノイズコントラスト推定を適用した。
論文 参考訳(メタデータ) (2023-09-18T03:56:45Z) - Learning Objective-Specific Active Learning Strategies with Attentive
Neural Processes [72.75421975804132]
学び アクティブラーニング(LAL)は、アクティブラーニング戦略自体を学ぶことを提案し、与えられた設定に適応できるようにする。
能動学習問題の対称性と独立性を利用した新しい分類法を提案する。
私たちのアプローチは、筋電図から学ぶことに基づいており、モデルに標準ではない目的に適応する能力を与えます。
論文 参考訳(メタデータ) (2023-09-11T14:16:37Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Neural Active Learning on Heteroskedastic Distributions [29.01776999862397]
ヘテロスケダスティックデータセット上でのアクティブ学習アルゴリズムの破滅的な失敗を実証する。
本稿では,各データポイントにモデル差分スコアリング関数を組み込んで,ノイズの多いサンプルとサンプルクリーンなサンプルをフィルタするアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-11-02T07:30:19Z) - Representation Learning for the Automatic Indexing of Sound Effects
Libraries [79.68916470119743]
タスク固有のがデータセットに依存しない表現は、クラス不均衡、一貫性のないクラスラベル、不十分なデータセットサイズなどのデータ問題にうまく対処できることを示す。
詳細な実験結果は、メトリック学習アプローチと異なるデータセット間の学習方法が表現効率に与える影響を示している。
論文 参考訳(メタデータ) (2022-08-18T23:46:13Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z) - Active learning for reducing labeling effort in text classification
tasks [3.8424737607413153]
アクティブラーニング(英: Active Learning, AL)は、使用済みモデルが最も有益とみなすデータのみを使用することでラベル付けの労力を削減することを目的としたパラダイムである。
本稿では,異なる不確実性に基づくアルゴリズム BERT$_base$ を比較した実験的検討を行った。
その結果,BERT$base$で不確実性に基づくALを用いることで,データのランダムサンプリングに優れることがわかった。
論文 参考訳(メタデータ) (2021-09-10T13:00:36Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。