論文の概要: Detecting Localized Density Anomalies in Multivariate Data via Coin-Flip Statistics
- arxiv url: http://arxiv.org/abs/2503.23927v1
- Date: Mon, 31 Mar 2025 10:20:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:38:49.767776
- Title: Detecting Localized Density Anomalies in Multivariate Data via Coin-Flip Statistics
- Title(参考訳): コインフリップ統計による多変量データの局所密度異常の検出
- Authors: Sebastian Springer, Andre Scaffidi, Maximilian Autenrieth, Gabriella Contardo, Alessandro Laio, Roberto Trotta, Heikki Haario,
- Abstract要約: 本稿では,2つのデータセットを比較する異常検出手法であるEagleEyeを紹介する。
異常は、各点について、隣人の登録ラベルの順序付けられたシーケンスをモデル化することによって検出される。
人工と実世界の両方のデータセットの実験を通して、その効果を実証する。
- 参考スコア(独自算出の注目度): 38.24458888666912
- License:
- Abstract: Detecting localized density differences in multivariate data is a crucial task in computational science. Such anomalies can indicate a critical system failure, lead to a groundbreaking scientific discovery, or reveal unexpected changes in data distribution. We introduce EagleEye, an anomaly detection method to compare two multivariate datasets with the aim of identifying local density anomalies, namely over- or under-densities affecting only localised regions of the feature space. Anomalies are detected by modelling, for each point, the ordered sequence of its neighbours' membership label as a coin-flipping process and monitoring deviations from the expected behaviour of such process. A unique advantage of our method is its ability to provide an accurate, entirely unsupervised estimate of the local signal purity. We demonstrate its effectiveness through experiments on both synthetic and real-world datasets. In synthetic data, EagleEye accurately detects anomalies in multiple dimensions even when they affect a tiny fraction of the data. When applied to a challenging resonant anomaly detection benchmark task in simulated Large Hadron Collider data, EagleEye successfully identifies particle decay events present in just 0.3% of the dataset. In global temperature data, EagleEye uncovers previously unidentified, geographically localised changes in temperature fields that occurred in the most recent years. Thanks to its key advantages of conceptual simplicity, computational efficiency, trivial parallelisation, and scalability, EagleEye is widely applicable across many fields.
- Abstract(参考訳): 多変量データの局所密度差の検出は計算科学において重要な課題である。
このような異常は、重要なシステム障害を示し、画期的な科学的発見につながるか、データ分布の予期せぬ変化を明らかにする可能性がある。
特徴空間の局所化領域にのみ影響する局所密度異常、すなわち過密度または下密度の同定を目的とした2つの多変量データセットを比較する異常検出手法であるEagleEyeを紹介する。
異常は、各点において、近隣の会員ラベルの順序付けられたシーケンスをコインフライングプロセスとして検出し、そのようなプロセスの期待される振る舞いから逸脱を監視することによって検出される。
この手法の独特な利点は、局所的な信号純度を正確に、完全に教師なしで見積もることができることである。
人工と実世界の両方のデータセットの実験を通して、その効果を実証する。
合成データでは、EagleEyeはデータのごく一部に影響を与えても、複数の次元の異常を正確に検出する。
シミュレーションされた大型ハドロン衝突型加速器データにおける不規則な共鳴異常検出ベンチマークタスクに適用すると、EagleEyeはデータセットのわずか0.3%に存在する粒子崩壊事象の同定に成功した。
地球の気温データによると、EagleEyeは過去数年間に起きた、地理的に地理的な温度変化を未同定で明らかにしている。
概念的単純さ、計算効率、自明な並列化、スケーラビリティの主な利点のおかげで、EagleEyeは多くの分野に広く適用できる。
関連論文リスト
- Adaptive Deviation Learning for Visual Anomaly Detection with Data Contamination [20.4008901760593]
そこで本研究では,偏差学習を応用して,異常スコアをエンドツーエンドに計算する手法を提案する。
提案手法は競合する手法を超越し,データ汚染の存在下での安定性とロバスト性を示す。
論文 参考訳(メタデータ) (2024-11-14T16:10:15Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - SeMAnD: Self-Supervised Anomaly Detection in Multimodal Geospatial
Datasets [0.0]
SeMAnDは現実世界の欠陥を検出し、ドメインに依存しない異常検出戦略を4.8-19.7%上回る。
モデル性能は,入力モダリティの増大に伴い20.4%,トレーニングデータの増大に伴い22.9%に向上した。
論文 参考訳(メタデータ) (2023-09-26T20:18:31Z) - Exploring Global and Local Information for Anomaly Detection with Normal
Samples [23.68962459770419]
異常検出は、通常のパターンに従わないデータを検出することを目的としており、そのようなデータはoutliersとも呼ばれる。
多くの現実的なシナリオでは、正常な振る舞いに従うサンプルのみが観察されるが、異常な情報はほとんど得られない。
本稿では, 異常検出手法であるGALDetectorを提案する。
論文 参考訳(メタデータ) (2023-06-03T06:51:22Z) - HFN: Heterogeneous Feature Network for Multivariate Time Series Anomaly
Detection [2.253268952202213]
MTSのためのヘテロジニアス特徴ネットワーク(HFN)に基づく,新しい半教師付き異常検出フレームワークを提案する。
まず、センサ埋め込みによって生成された埋め込み類似性グラフと、センサ値によって生成された特徴値類似性グラフを組み合わせて、時系列不均一グラフを構築する。
このアプローチは、ヘテロジニアスグラフ構造学習(HGSL)と表現学習の最先端技術を融合させる。
論文 参考訳(メタデータ) (2022-11-01T05:01:34Z) - Latent Outlier Exposure for Anomaly Detection with Contaminated Data [31.446666264334528]
異常検出は、ラベルなしデータセットの大多数のデータから体系的なずれを示すデータポイントを特定することを目的としている。
本稿では,広範囲のモデルと互換性のあるラベルのない異常が存在する場合に,異常検知器を訓練するための戦略を提案する。
論文 参考訳(メタデータ) (2022-02-16T14:21:28Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。