論文の概要: AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning
- arxiv url: http://arxiv.org/abs/2505.03509v1
- Date: Tue, 06 May 2025 13:19:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-07 18:50:11.38545
- Title: AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning
- Title(参考訳): AnomalyMatch: セミ教師付きアクティブラーニングによる興味の対象の発見
- Authors: Pablo Gómez, David O'Ryan,
- Abstract要約: AnomalyMatchは、半教師付きFixMatchアルゴリズムとアクティブラーニングを組み合わせた、異常検出フレームワークである。
AnomalyMatchは大規模アプリケーション向けに最適化されており、単一のGPU上で3日以内に1億イメージの予測を効率的に処理する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in large datasets is essential in fields such as astronomy and computer vision; however, supervised methods typically require extensive anomaly labelling, which is often impractical. We present AnomalyMatch, an anomaly detection framework combining the semi-supervised FixMatch algorithm using EfficientNet classifiers with active learning. By treating anomaly detection as a semi-supervised binary classification problem, we efficiently utilise limited labelled and abundant unlabelled images. We allow iterative model refinement in a user interface for expert verification of high-confidence anomalies and correction of false positives. Built for astronomical data, AnomalyMatch generalises readily to other domains facing similar data challenges. Evaluations on the GalaxyMNIST astronomical dataset and the miniImageNet natural-image benchmark under severe class imbalance (1% anomalies for miniImageNet) display strong performance: starting from five to ten labelled anomalies and after three active learning cycles, we achieve an average AUROC of 0.95 (miniImageNet) and 0.86 (GalaxyMNIST), with respective AUPRC of 0.77 and 0.71. After active learning cycles, anomalies are ranked with 71% (miniImageNet) to 93% precision in the 1% of the highest-ranked images. AnomalyMatch is tailored for large-scale applications, efficiently processing predictions for 100 million images within three days on a single GPU. Integrated into ESAs Datalabs platform, AnomalyMatch facilitates targeted discovery of scientifically valuable anomalies in vast astronomical datasets. Our results underscore the exceptional utility and scalability of this approach for anomaly discovery, highlighting the value of specialised approaches for domains characterised by severe label scarcity.
- Abstract(参考訳): 大規模なデータセットにおける異常検出は天文学やコンピュータビジョンなどの分野において不可欠であるが、教師付き手法では一般に広範囲な異常ラベリングを必要とする。
AnomalyMatchは、効率的なネット分類器とアクティブラーニングを組み合わせた半教師付きFixMatchアルゴリズムを組み合わせた異常検出フレームワークである。
異常検出を半教師付きバイナリ分類問題として扱うことにより,ラベル付き画像や豊富な未ラベル画像の有効利用が可能となる。
高信頼度異常の専門的検証と偽陽性の訂正のためのユーザインタフェースにおける反復的モデル改善を可能にする。
天文学的なデータのために構築されたAnomalyMatchは、同様のデータ課題に直面している他のドメインに容易に一般化する。
GalaxyMNIST天文データセットとminiImageNet自然画像ベンチマークの評価では,5~10個のラベル付き異常から3回のアクティブ学習サイクルを経て,平均AUROCが0.95(miniImageNet),0.86(GalaxyMNIST)となり,それぞれ0.77,0.71であった。
アクティブな学習サイクルの後、異常は71%(miniImageNet)から93%の精度で上位画像の1%にランクされる。
AnomalyMatchは大規模アプリケーション向けに最適化されており、単一のGPU上で3日以内に1億イメージの予測を効率的に処理する。
ESAs Datalabsプラットフォームに統合されたAnomalyMatchは、巨大な天文学データセットで科学的に価値のある異常をターゲットとする発見を容易にする。
本研究は,本手法の異常発見における特異な有用性と拡張性を強調し,重度ラベルの不足を特徴とする領域に対する特殊化アプローチの価値を強調した。
関連論文リスト
- ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Self-supervised learning for classifying paranasal anomalies in the maxillary sinus [31.45131665942058]
自己教師付き学習は、ラベルのないデータから表現を学習するために使用することができる。
上顎洞の副鼻腔奇形を分類する下流タスクのために設計されたSSLメソッドはない。
提案手法では,教師なし異常検出フレームワークで訓練された3次元畳み込みオートエンコーダを用いる。
論文 参考訳(メタデータ) (2024-04-29T11:14:11Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - EfficientAD: Accurate Visual Anomaly Detection at Millisecond-Level
Latencies [1.1602089225841632]
本稿では,最新のGPU上で1ミリ秒未満で画像を処理する軽量な特徴抽出器を提案する。
次に,生徒-教員のアプローチを用いて異常な特徴を検出する。
3つの産業的異常検出データセットから抽出した32個のデータセットからEfficientADという手法を評価した。
論文 参考訳(メタデータ) (2023-03-25T18:48:33Z) - From Unsupervised to Few-shot Graph Anomaly Detection: A Multi-scale Contrastive Learning Approach [26.973056364587766]
グラフデータからの異常検出は、ソーシャルネットワーク、金融、eコマースなど、多くのアプリケーションにおいて重要なデータマイニングタスクである。
マルチスケールcONtrastive lEarning(略してANEMONE)を用いた新しいフレームワーク, graph Anomaly dEtection フレームワークを提案する。
グラフニューラルネットワークをバックボーンとして、複数のグラフスケール(ビュー)から情報をエンコードすることで、グラフ内のノードのより良い表現を学習する。
論文 参考訳(メタデータ) (2022-02-11T09:45:11Z) - Multi-Perspective Anomaly Detection [3.3511723893430476]
我々は,ディープサポートベクトルデータ記述アルゴリズムを構築し,マルチパースペクティブな異常検出に対処する。
我々は、少ない一級データを扱うために、デノナイジングプロセスで異なる拡張手法を採用する。
2つの異なる視点からの画像を用いて新しいダイスデータセットのアプローチを評価し、標準MNISTデータセットのベンチマークを行った。
論文 参考訳(メタデータ) (2021-05-20T17:07:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。