論文の概要: Towards Automated Self-Supervised Learning for Truly Unsupervised Graph Anomaly Detection
- arxiv url: http://arxiv.org/abs/2501.14694v1
- Date: Fri, 24 Jan 2025 18:13:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:57:50.906857
- Title: Towards Automated Self-Supervised Learning for Truly Unsupervised Graph Anomaly Detection
- Title(参考訳): 完全教師なしグラフ異常検出のための自己教師付き学習の自動化に向けて
- Authors: Zhong Li, Yuhang Wang, Matthijs van Leeuwen,
- Abstract要約: 自己教師付き学習(SSL)は、データ自体から生成された監視信号を利用する新興パラダイムである。
ほとんどのSSLベースのグラフ異常検出手法は、SSL戦略を任意または選択的に選択することでこれらの問題を回避している。
漏洩は「データマイニングのミスのトップ10の1つ」と批判されている
- 参考スコア(独自算出の注目度): 26.127540618407878
- License:
- Abstract: Self-supervised learning (SSL) is an emerging paradigm that exploits supervisory signals generated from the data itself, and many recent studies have leveraged SSL to conduct graph anomaly detection. However, we empirically found that three important factors can substantially impact detection performance across datasets: 1) the specific SSL strategy employed; 2) the tuning of the strategy's hyperparameters; and 3) the allocation of combination weights when using multiple strategies. Most SSL-based graph anomaly detection methods circumvent these issues by arbitrarily or selectively (i.e., guided by label information) choosing SSL strategies, hyperparameter settings, and combination weights. While an arbitrary choice may lead to subpar performance, using label information in an unsupervised setting is label information leakage and leads to severe overestimation of a method's performance. Leakage has been criticized as "one of the top ten data mining mistakes", yet many recent studies on SSL-based graph anomaly detection have been using label information to select hyperparameters. To mitigate this issue, we propose to use an internal evaluation strategy (with theoretical analysis) to select hyperparameters in SSL for unsupervised anomaly detection. We perform extensive experiments using 10 recent SSL-based graph anomaly detection algorithms on various benchmark datasets, demonstrating both the prior issues with hyperparameter selection and the effectiveness of our proposed strategy.
- Abstract(参考訳): 自己教師付き学習(SSL)は、データ自体から生成された監視信号を利用する新興パラダイムであり、最近の多くの研究では、SSLを活用してグラフ異常検出を行っている。
しかし、我々は3つの重要な要因がデータセット間の検出性能に重大な影響を与えることを実証的に見出した。
1) 特定のSSL戦略
2) 戦略のハイパーパラメータのチューニング,及び
3)複数戦略を用いた場合の組合せ重みの割り当て。
ほとんどのSSLベースのグラフ異常検出手法は、SSL戦略、ハイパーパラメータ設定、組み合わせ重みの選択を任意または選択的に(ラベル情報によってガイドされる)に行うことでこれらの問題を回避している。
任意の選択がサブパーパフォーマンスにつながるが、教師なし設定でのラベル情報の使用はラベル情報漏洩であり、メソッドのパフォーマンスを過度に過大評価する。
漏洩は「トップ10のデータマイニングミスの1つ」と批判されてきたが、SSLベースのグラフ異常検出に関する最近の多くの研究は、ラベル情報を使用してハイパーパラメータを選択している。
この問題を軽減するために、内部評価戦略(理論的解析を含む)を用いてSSL内のハイパーパラメータを非教師付き異常検出に使用することを提案する。
我々は、SSLベースのグラフ異常検出アルゴリズムを、様々なベンチマークデータセット上で10種類の実験を行い、従来のハイパーパラメータ選択の問題と提案手法の有効性を実証した。
関連論文リスト
- Self-Supervised Anomaly Detection in the Wild: Favor Joint Embeddings Methods [12.277762115388187]
Self-Supervised Learning (SSL)は、ラベルのないデータから堅牢な表現を学習することで、有望なアプローチを提供する。
本稿では,下水道インフラに着目した実世界の異常検出のためのSSL手法の包括的評価を行う。
論文 参考訳(メタデータ) (2024-10-05T21:27:47Z) - A Closer Look at Benchmarking Self-Supervised Pre-training with Image Classification [51.35500308126506]
自己教師付き学習(SSL)は、データ自体が監視を提供する機械学習アプローチであり、外部ラベルの必要性を排除している。
SSLの分類に基づく評価プロトコルがどのように相関し、異なるデータセットのダウンストリーム性能を予測するかを検討する。
論文 参考訳(メタデータ) (2024-07-16T23:17:36Z) - Anomaly Detection of Tabular Data Using LLMs [54.470648484612866]
我々は,事前訓練された大規模言語モデル (LLM) がゼロショットバッチレベルの異常検出器であることを示す。
本稿では,実異常検出におけるLCMの潜在性を明らかにするために,エンドツーエンドの微調整手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T04:17:03Z) - Hypergraph Self-supervised Learning with Sampling-efficient Signals [36.670771080732486]
自己教師付き学習(SSL)は、高額なラベルなしでハイパーグラフ上で表現学習を行うための有望な代替手段を提供する。
既存のハイパーグラフSSLモデルは、主にインスタンスレベルの識別戦略と対照的な手法に基づいている。
3つのサンプリング効率の自己教師型信号を持つハイパーグラフSSLフレームワークであるSE-HSSLを提案する。
論文 参考訳(メタデータ) (2024-04-18T01:14:50Z) - Making Self-supervised Learning Robust to Spurious Correlation via
Learning-speed Aware Sampling [26.444935219428036]
自己教師付き学習(SSL)は、ラベルのないデータからリッチな表現を学ぶための強力なテクニックとして登場した。
現実の環境では、いくつかの属性(例えば、人種、性別、年齢)と下流タスクのラベルの間に急激な相関関係がしばしば存在する。
学習速度に逆相関する確率でトレーニングデータをサンプリングする学習速度対応SSL(LA-SSL)アプローチを提案する。
論文 参考訳(メタデータ) (2023-11-27T22:52:45Z) - Self-Supervision for Tackling Unsupervised Anomaly Detection: Pitfalls
and Opportunities [50.231837687221685]
自己教師付き学習(SSL)は、機械学習とその多くの現実世界のアプリケーションに変化をもたらした。
非教師なし異常検出(AD)は、自己生成性擬似異常によりSSLにも乗じている。
論文 参考訳(メタデータ) (2023-08-28T07:55:01Z) - Active Semi-Supervised Learning by Exploring Per-Sample Uncertainty and
Consistency [30.94964727745347]
そこで我々は,ASSL(Active Semi-supervised Learning)と呼ばれる手法を提案し,低コストでモデルの精度を向上させる。
ASSLには、ラベルなしデータの使用により、アクティブラーニング(AL)よりもダイナミックなモデル更新が含まれている。
ASSLは同じ性能を保ちながら、半教師あり学習(SSL)の約5.3倍の計算効率を達成した。
論文 参考訳(メタデータ) (2023-03-15T22:58:23Z) - OpenLDN: Learning to Discover Novel Classes for Open-World
Semi-Supervised Learning [110.40285771431687]
半教師付き学習(SSL)は、教師付き学習のアノテーションボトルネックに対処する主要なアプローチの1つである。
最近のSSLメソッドは、ラベルなしデータの大規模なリポジトリを有効活用して、ラベル付きデータの小さなセットに依存しながら、パフォーマンスを向上させることができる。
この研究は、ペアワイズ類似度損失を利用して新しいクラスを発見するOpenLDNを導入している。
論文 参考訳(メタデータ) (2022-07-05T18:51:05Z) - Collaborative Intelligence Orchestration: Inconsistency-Based Fusion of
Semi-Supervised Learning and Active Learning [60.26659373318915]
アクティブラーニング(AL)と半教師付きラーニング(SSL)は2つの効果があるが、しばしば孤立している。
本稿では、SSL-ALの潜在的な優位性をさらに調査するために、革新的な一貫性に基づく仮想aDvErialアルゴリズムを提案する。
2つの実世界のケーススタディは、提案したデータサンプリングアルゴリズムの適用と展開の実践的な産業価値を可視化する。
論文 参考訳(メタデータ) (2022-06-07T13:28:43Z) - Robust Deep Semi-Supervised Learning: A Brief Introduction [63.09703308309176]
半教師付き学習(SSL)は、ラベルが不十分なときにラベル付きデータを活用することにより、学習性能を向上させることを目的としている。
ディープモデルによるSSLは、標準ベンチマークタスクで成功したことが証明されている。
しかし、それらは現実世界のアプリケーションにおける様々な堅牢性に対する脅威に対して依然として脆弱である。
論文 参考訳(メタデータ) (2022-02-12T04:16:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。