論文の概要: Meta-survey on outlier and anomaly detection
- arxiv url: http://arxiv.org/abs/2312.07101v1
- Date: Tue, 12 Dec 2023 09:29:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-13 16:50:13.343918
- Title: Meta-survey on outlier and anomaly detection
- Title(参考訳): 異常値と異常検出に関するメタサーベイ
- Authors: Madalina Olteanu (CEREMADE), Fabrice Rossi (CEREMADE), Florian Yger
(MILES, LAMSADE)
- Abstract要約: 本稿では,一般的な調査の体系的メタサーベイと,異常検出と異常検出に関するレビューを実装した。
2つの専門的な科学的な検索エンジンを使って500近い論文を集めている。
本稿は,20年間にわたる外乱検出フィールドの進化を考察し,新たなテーマと方法を明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The impact of outliers and anomalies on model estimation and data processing
is of paramount importance, as evidenced by the extensive body of research
spanning various fields over several decades: thousands of research papers have
been published on the subject. As a consequence, numerous reviews, surveys, and
textbooks have sought to summarize the existing literature, encompassing a wide
range of methods from both the statistical and data mining communities. While
these endeavors to organize and summarize the research are invaluable, they
face inherent challenges due to the pervasive nature of outliers and anomalies
in all data-intensive applications, irrespective of the specific application
field or scientific discipline. As a result, the resulting collection of papers
remains voluminous and somewhat heterogeneous. To address the need for
knowledge organization in this domain, this paper implements the first
systematic meta-survey of general surveys and reviews on outlier and anomaly
detection. Employing a classical systematic survey approach, the study collects
nearly 500 papers using two specialized scientific search engines. From this
comprehensive collection, a subset of 56 papers that claim to be general
surveys on outlier detection is selected using a snowball search technique to
enhance field coverage. A meticulous quality assessment phase further refines
the selection to a subset of 25 high-quality general surveys. Using this
curated collection, the paper investigates the evolution of the outlier
detection field over a 20-year period, revealing emerging themes and methods.
Furthermore, an analysis of the surveys sheds light on the survey writing
practices adopted by scholars from different communities who have contributed
to this field. Finally, the paper delves into several topics where consensus
has emerged from the literature. These include taxonomies of outlier types,
challenges posed by high-dimensional data, the importance of anomaly scores,
the impact of learning conditions, difficulties in benchmarking, and the
significance of neural networks. Non-consensual aspects are also discussed,
particularly the distinction between local and global outliers and the
challenges in organizing detection methods into meaningful taxonomies.
- Abstract(参考訳): モデル推定とデータ処理に対する外れ値と異常の影響は、数十年にわたって様々な分野にまたがる広範な研究機関によって証明されているように、最も重要視されている。
その結果、多くのレビュー、調査、教科書が既存の文献をまとめようとしており、統計学とデータマイニングのコミュニティから幅広い方法を取り上げている。
研究を組織化し、まとめるこれらの取り組みは重要ではないが、特定の応用分野や科学分野に関係なく、あらゆるデータ集約型アプリケーションにおいて、外れ値や異常が広範に存在しているため、固有の課題に直面している。
その結果、結果として得られた論文の収集は、鮮やかで幾分異質なままである。
この領域における知識組織の必要性に対処するため、本論文では、一般的な調査の体系的なメタサーベイと、異常検出と異常検出に関するレビューを実装した。
古典的な体系的な調査手法を用いて、2つの専門的な科学検索エンジンを用いて500近い論文を収集している。
この包括的収集から、アウトリーバー検出に関する一般的な調査であると主張する56の論文のサブセットが雪球探索技術を用いて選択され、フィールドカバレッジが向上する。
微妙な品質評価フェーズは、さらに25の高品質な総合調査のサブセットに選択を洗練させる。
このキュレートされたコレクションを用いて,20年間にわたる外乱検出フィールドの進化を解明し,新たなテーマと手法を明らかにした。
さらに,本調査の分析は,この分野に貢献した地域社会の学者が採用した調査書記の実践に光を当てている。
最後に、論文は文学からコンセンサスが生まれているいくつかのトピックを取り上げている。
これには、外れ値型の分類、高次元データによる課題、異常スコアの重要性、学習条件の影響、ベンチマークの困難さ、ニューラルネットワークの重要性などが含まれる。
非コンセンサス的な側面も議論され、特に局所的および大域的外れ値の区別と、検出方法を有意義な分類法に整理する上での課題が論じられた。
関連論文リスト
- Spurious Correlations in Machine Learning: A Survey [69.89249134046086]
機械学習システムは、入力の偏りのある特徴と対応するラベルの間の急激な相関に敏感である。
これらの特徴とそのラベルとの相関は"spurious"として知られている。
我々は、機械学習モデルにおける素早い相関に対処する現在の最先端の手法の分類とともに、この問題を包括的にレビューする。
論文 参考訳(メタデータ) (2024-02-20T04:49:34Z) - A Comprehensive Survey of Forgetting in Deep Learning Beyond Continual
Learning [76.47138162283714]
蓄積とは、以前取得した情報や知識の喪失または劣化を指す。
フォッテッティングは、深層学習における様々な研究領域でよく見られる現象である。
調査では、忘れることは二重刃の剣であり、ある場合には有益で望ましいと論じている。
論文 参考訳(メタデータ) (2023-07-16T16:27:58Z) - Rare Yet Popular: Evidence and Implications from Labeled Datasets for
Network Anomaly Detection [9.717823994163277]
本稿では,ネットワーク環境における異常検出のための,公開・非公開の真理を体系的に分析する。
解析の結果, 異常は時間的に稀な事象であるが, 空間的特徴から, 異常が比較的多いことが明らかとなった。
論文 参考訳(メタデータ) (2022-11-18T10:14:03Z) - A Comparative Study on Unsupervised Anomaly Detection for Time Series:
Experiments and Analysis [28.79393419730138]
時系列異常検出は、信頼性と安全性を実現するためにしばしば不可欠である。
近年,時系列データの異常検出が盛んに行われている。
データ、メソッド、評価戦略について紹介する。
我々は,最先端技術とディープラーニング技術とを体系的に評価し,比較した。
論文 参考訳(メタデータ) (2022-09-10T10:44:25Z) - Deep Learning for Unsupervised Anomaly Localization in Industrial
Images: A Survey [3.281166249990719]
実際の産業シナリオでは、欠陥サンプルの不足、アノテーションのコスト、欠陥に関する事前知識の欠如は、教師付き手法を効果的にしない可能性がある。
近年, 産業検査作業において, 教師なしの異常局所化アルゴリズムが広く用いられている。
論文 参考訳(メタデータ) (2022-07-21T04:26:48Z) - A Unified Survey on Anomaly, Novelty, Open-Set, and Out-of-Distribution
Detection: Solutions and Future Challenges [28.104112546546936]
機械学習モデルは、トレーニング分布から分岐したサンプルに遭遇することが多い。
類似した共有概念にもかかわらず、アウト・オブ・ディストリビューション、オープン・セット、異常検出は独立して研究されている。
本調査は,各分野における多数の卓越した作品について,クロスドメインかつ包括的レビューを行うことを目的としている。
論文 参考訳(メタデータ) (2021-10-26T22:05:31Z) - A Comprehensive Survey on Graph Anomaly Detection with Deep Learning [37.83120827837028]
異常は稀な観測(例えば、データ記録や出来事)であり、他のものとは大きく異なる。
本研究では,グラフ異常検出のための現代のディープラーニング技術について,体系的かつ包括的にレビューすることを目的とする。
論文 参考訳(メタデータ) (2021-06-14T06:04:57Z) - Through the Data Management Lens: Experimental Analysis and Evaluation
of Fair Classification [75.49600684537117]
データ管理研究は、データとアルゴリズムの公平性に関連するトピックに対する存在感と関心が高まっている。
我々は,その正しさ,公平性,効率性,スケーラビリティ,安定性よりも,13の公正な分類アプローチと追加の変種を幅広く分析している。
我々の分析は、異なるメトリクスとハイレベルなアプローチ特性がパフォーマンスの異なる側面に与える影響に関する新しい洞察を強調します。
論文 参考訳(メタデータ) (2021-01-18T22:55:40Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Deep Learning for Anomaly Detection: A Review [150.9270911031327]
本稿では,3つの高レベルカテゴリと11の細粒度カテゴリの進歩を網羅した包括的分類法による深部異常検出の研究について調査する。
我々は、それらの重要な直観、客観的機能、基礎となる仮定、利点とデメリットをレビューし、上記の課題にどのように対処するかについて議論する。
論文 参考訳(メタデータ) (2020-07-06T02:21:16Z) - Anomalous Example Detection in Deep Learning: A Survey [98.2295889723002]
本調査は,ディープラーニングアプリケーションにおける異常検出の研究について,構造化された包括的概要を提供する。
既存の技術に対する分類法を,その基礎となる前提と採用アプローチに基づいて提案する。
本稿では,DLシステムに異常検出技術を適用しながら未解決の研究課題を取り上げ,今後の課題について述べる。
論文 参考訳(メタデータ) (2020-03-16T02:47:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。