論文の概要: EMA: Auditing Data Removal from Trained Models
- arxiv url: http://arxiv.org/abs/2109.03675v1
- Date: Wed, 8 Sep 2021 14:22:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-09 18:36:20.961039
- Title: EMA: Auditing Data Removal from Trained Models
- Title(参考訳): EMA: トレーニング済みモデルからのデータ削除を監査
- Authors: Yangsibo Huang, Xiaoxiao Li, Kai Li
- Abstract要約: 本研究では,これらの制限を克服するために,データ削除を監査するためのEMA(Ensembled Membership Auditing)と呼ばれる新しい手法を提案する。
提案手法の故障事例を含む各種条件下では,EMAは堅牢であることを示す。
- 参考スコア(独自算出の注目度): 21.11589211007747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data auditing is a process to verify whether certain data have been removed
from a trained model. A recently proposed method (Liu et al. 20) uses
Kolmogorov-Smirnov (KS) distance for such data auditing. However, it fails
under certain practical conditions. In this paper, we propose a new method
called Ensembled Membership Auditing (EMA) for auditing data removal to
overcome these limitations. We compare both methods using benchmark datasets
(MNIST and SVHN) and Chest X-ray datasets with multi-layer perceptrons (MLP)
and convolutional neural networks (CNN). Our experiments show that EMA is
robust under various conditions, including the failure cases of the previously
proposed method. Our code is available at: https://github.com/Hazelsuko07/EMA.
- Abstract(参考訳): データ監査は、トレーニングされたモデルから特定のデータが削除されたかどうかを検証するプロセスである。
最近提案された手法(liu et al。
20) Kolmogorov-Smirnov (KS) 距離を用いてデータ監査を行う。
しかし、一定の条件下では失敗する。
本稿では,これらの制限を克服するために,データ削除を監査するためのEMA(Ensembled Membership Auditing)と呼ばれる新しい手法を提案する。
ベンチマークデータセット(mnistおよびsvhn)と胸部x線データセットと多層パーセプトロン(mlp)と畳み込みニューラルネットワーク(cnn)を用いた2つの手法を比較した。
提案手法の故障事例を含む様々な条件下でのemaの耐障害性を示す実験を行った。
私たちのコードは、https://github.com/Hazelsuko07/EMA.comで利用可能です。
関連論文リスト
- mDAE : modified Denoising AutoEncoder for missing data imputation [0.0]
本稿では,DAE(Denoising AutoEncoder)をベースとした手法を提案する。
Ablation study showed the benefit of using this modified loss function and a Overcomplete structure, terms of Root Mean Squared Error (RMSE) of reconstruction。
平均距離ベスト(Mean Distance to Best、MDB)と呼ばれる基準が提案され、すべてのデータセットでメソッドがグローバルにどのように機能するかを測定する。
論文 参考訳(メタデータ) (2024-11-19T20:31:53Z) - Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.04370580292727]
研究テーマは、圧縮測定によるデータ駆動ベイズ状態推定である。
状態の基本的な力学モデルは未知であると仮定される。
既存の2つの教師なし学習ベースのデータ駆動手法は、BSCMの問題に対処できない。
論文 参考訳(メタデータ) (2024-07-10T05:03:48Z) - Detecting Pretraining Data from Large Language Models [90.12037980837738]
事前学習データ検出問題について検討する。
事前学習データを知ることなく、テキスト片とLCMへのブラックボックスアクセスを条件に、モデルが提供されたテキストでトレーニングされたかどうかを判断できますか?
簡単な仮説に基づく新しい検出手法Min-K% Probを提案する。
論文 参考訳(メタデータ) (2023-10-25T17:21:23Z) - IRTCI: Item Response Theory for Categorical Imputation [5.9952530228468754]
欠落したデータをスタンドイン値に置き換えるために、いくつかの計算手法が設計されている。
ここで紹介された作品は、アイテム応答理論(IRT)に基づく分類論的計算の新しい手段を提供する。
これらの手法を比較した分析は、3つの異なるデータセットで行われた。
論文 参考訳(メタデータ) (2023-02-08T16:17:20Z) - FewSOME: One-Class Few Shot Anomaly Detection with Siamese Networks [0.5735035463793008]
FewSOME (Few Shot anOMaly Detection) は深層一級異常検出アルゴリズムであり、異常を正確に検出できる。
FewSOMEは、Siamese Networksをベースとしたアーキテクチャで事前訓練されたウェイトによって支援されている。
我々の実験は、ベンチマークデータセット上でFewSOMEのパフォーマンスを最先端レベルで実証した。
論文 参考訳(メタデータ) (2023-01-17T15:32:34Z) - Knockoffs-SPR: Clean Sample Selection in Learning with Noisy Labels [56.81761908354718]
雑音ラベルを用いた学習のための,理論的に保証されたクリーンサンプル選択フレームワークを提案する。
Knockoffs-SPRは、標準的な教師付きトレーニングパイプラインのサンプル選択モジュールと見なすことができる。
さらに、ラベルなしデータとしてノイズデータのサポートを利用する半教師付きアルゴリズムと組み合わせる。
論文 参考訳(メタデータ) (2023-01-02T07:13:28Z) - Semi-Supervised Temporal Action Detection with Proposal-Free Masking [134.26292288193298]
PropOsal-free Temporal mask (SPOT) に基づく新しい半教師付き時間行動検出モデルを提案する。
SPOTは最先端の代替品よりも優れている。
論文 参考訳(メタデータ) (2022-07-14T16:58:47Z) - Continual Learning for Fake Audio Detection [62.54860236190694]
本論文では,連続学習に基づく手法である忘れずに偽物を検出することで,モデルに新たなスプーフィング攻撃をインクリメンタルに学習させる手法を提案する。
ASVspoof 2019データセットで実験が行われる。
論文 参考訳(メタデータ) (2021-04-15T07:57:05Z) - The Integrity of Machine Learning Algorithms against Software Defect
Prediction [0.0]
本報告では,Liangらが開発したオンラインシーケンス・エクストリーム・ラーニング・マシン(OS-ELM)の性能を解析する。
OS-ELMは従来のディープニューラルネットワークよりも高速にトレーニングし、常にグローバルな最適解に収束する。
この分析は、NASAグループが実施する3つのプロジェクトKC1、PC4、PC3で実施される。
論文 参考訳(メタデータ) (2020-09-05T17:26:56Z) - Unsupervised anomaly detection for discrete sequence healthcare data [1.2667973028134798]
不正検出を教師なしで自動化する機械学習モデルを提案する。
2つのディープラーニングアプローチには、次の患者訪問を予測するLSTMニューラルネットワークと、Seq2seqモデルがある。
バリデーションには、アリアンツ社の患者訪問データ列の実際のデータを使用する。
論文 参考訳(メタデータ) (2020-07-20T13:42:21Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。