論文の概要: Enhanced Federated Anomaly Detection Through Autoencoders Using Summary Statistics-Based Thresholding
- arxiv url: http://arxiv.org/abs/2410.09284v1
- Date: Fri, 11 Oct 2024 22:21:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 15:23:18.120506
- Title: Enhanced Federated Anomaly Detection Through Autoencoders Using Summary Statistics-Based Thresholding
- Title(参考訳): 概要統計に基づく閾値を用いたオートエンコーダによるフェデレーション異常検出の高速化
- Authors: Sofiane Laridi, Gregory Palmer, Kam-Ming Mark Tam,
- Abstract要約: フェデレートラーニング(FL)では、データの分散性のため、異常検出は難しい課題である。
本研究では,正規データと異常データの両方からの要約統計を利用した新しいフェデレーションしきい値計算手法を提案する。
提案手法は, クライアント間の局所的な要約統計データを集約し, 正常データから異常を最適に分離する大域しきい値を算出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In Federated Learning (FL), anomaly detection (AD) is a challenging task due to the decentralized nature of data and the presence of non-IID data distributions. This study introduces a novel federated threshold calculation method that leverages summary statistics from both normal and anomalous data to improve the accuracy and robustness of anomaly detection using autoencoders (AE) in a federated setting. Our approach aggregates local summary statistics across clients to compute a global threshold that optimally separates anomalies from normal data while ensuring privacy preservation. We conducted extensive experiments using publicly available datasets, including Credit Card Fraud Detection, Shuttle, and Covertype, under various data distribution scenarios. The results demonstrate that our method consistently outperforms existing federated and local threshold calculation techniques, particularly in handling non-IID data distributions. This study also explores the impact of different data distribution scenarios and the number of clients on the performance of federated anomaly detection. Our findings highlight the potential of using summary statistics for threshold calculation in improving the scalability and accuracy of federated anomaly detection systems.
- Abstract(参考訳): フェデレートラーニング(FL)では、データ分散の性質と非IIDデータ分布の存在のため、異常検出(AD)は難しい課題である。
本研究では,正規データと異常データの両方からの要約統計を利用して,自動エンコーダ(AE)を用いた異常検出の精度とロバスト性を向上させる新しいフェデレーションしきい値計算手法を提案する。
当社のアプローチでは,クライアント間の局所的な要約統計を集約して,異常を正常データから最適に分離し,プライバシー保護を確保するグローバルしきい値を算出する。
我々は、さまざまなデータ配信シナリオ下で、Credit Card Fraud Detection、Shuttle、Covertypeなどの公開データセットを使用して、広範な実験を行った。
その結果,本手法は既存のフェデレーションおよび局所しきい値計算手法,特に非IIDデータ分布の処理において一貫した性能を発揮した。
また,異なるデータ分散シナリオとクライアント数の違いが,フェデレートされた異常検出の性能に与える影響についても検討した。
本研究は,フェデレートされた異常検出システムのスケーラビリティと精度を向上させるために,しきい値計算に要約統計を用いることの可能性を強調した。
関連論文リスト
- FedAD-Bench: A Unified Benchmark for Federated Unsupervised Anomaly Detection in Tabular Data [11.42231457116486]
FedAD-Benchは、フェデレート学習の文脈における教師なし異常検出アルゴリズムを評価するためのベンチマークである。
モデル集約の非効率性やメトリクスの不確実性といった重要な課題を特定します。
本研究は,フェデレートされた異常検出における今後の研究・開発を導くための標準化されたベンチマークを確立することを目的としている。
論文 参考訳(メタデータ) (2024-08-08T13:14:19Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Anomaly Detection with Score Distribution Discrimination [4.468952886990851]
本稿では,スコア分布の観点から,異常スコア関数の最適化を提案する。
正常試料と異常試料のスコア分布の重なりを最小化するオーバーラップ損失と呼ばれる新しい損失関数を設計する。
論文 参考訳(メタデータ) (2023-06-26T03:32:57Z) - CADIS: Handling Cluster-skewed Non-IID Data in Federated Learning with
Clustered Aggregation and Knowledge DIStilled Regularization [3.3711670942444014]
フェデレーション学習は、エッジデバイスがデータを公開することなく、グローバルモデルを協調的にトレーニングすることを可能にする。
我々は、実際のデータセットで発見されたクラスタスキュード非IIDと呼ばれる新しいタイプの非IIDデータに取り組む。
本稿では,クラスタ間の平等を保証するアグリゲーション方式を提案する。
論文 参考訳(メタデータ) (2023-02-21T02:53:37Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Federated Anomaly Detection over Distributed Data Streams [0.0]
本稿では,異常検出,フェデレート学習,データストリーム間のブリッジ構築手法を提案する。
作業の包括的な目標は、分散データストリーム上でのフェデレーション環境での異常を検出することだ。
論文 参考訳(メタデータ) (2022-05-16T17:38:58Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - Am I Rare? An Intelligent Summarization Approach for Identifying Hidden
Anomalies [0.0]
本稿では,INSIDENTと呼ばれる隠れ異常を識別するインテリジェント・サマリゼーション手法を提案する。
提案手法は,各クラスタの特徴を局所重み付けすることにより,特徴空間を特徴空間に動的にマッピングするクラスタリングに基づくアルゴリズムである。
また、クラスタサイズに基づく代表者の選択は、集計データ内の元のデータと同じ分布を保持する。
論文 参考訳(メタデータ) (2020-12-24T23:22:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。