論文の概要: Privacy-Preserving Feature Selection with Secure Multiparty Computation
- arxiv url: http://arxiv.org/abs/2102.03517v1
- Date: Sat, 6 Feb 2021 05:33:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 15:23:17.655391
- Title: Privacy-Preserving Feature Selection with Secure Multiparty Computation
- Title(参考訳): セキュアなマルチパーティ計算によるプライバシー保護機能選択
- Authors: Xiling Li and Rafael Dowsley and Martine De Cock
- Abstract要約: フィルタ法に基づくプライベートな特徴選択のための最初のMPCベースのプロトコルを提案する。
本稿では,提案プロトコルによるセキュアな特徴選択により,様々な実世界のデータセットの分類器の精度が向上することを示す。
- 参考スコア(独自算出の注目度): 9.478262337000066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing work on privacy-preserving machine learning with Secure Multiparty
Computation (MPC) is almost exclusively focused on model training and on
inference with trained models, thereby overlooking the important data
pre-processing stage. In this work, we propose the first MPC based protocol for
private feature selection based on the filter method, which is independent of
model training, and can be used in combination with any MPC protocol to rank
features. We propose an efficient feature scoring protocol based on Gini
impurity to this end. To demonstrate the feasibility of our approach for
practical data science, we perform experiments with the proposed MPC protocols
for feature selection in a commonly used machine-learning-as-a-service
configuration where computations are outsourced to multiple servers, with
semi-honest and with malicious adversaries. Regarding effectiveness, we show
that secure feature selection with the proposed protocols improves the accuracy
of classifiers on a variety of real-world data sets, without leaking
information about the feature values or even which features were selected.
Regarding efficiency, we document runtimes ranging from several seconds to an
hour for our protocols to finish, depending on the size of the data set and the
security settings.
- Abstract(参考訳): Secure Multiparty Computation (MPC)による既存のプライバシ保護機械学習の研究は、モデルトレーニングとトレーニングされたモデルによる推論に集中しており、重要なデータ前処理ステージを見下ろしている。
本研究では,モデル学習とは無関係なフィルタ法を用いて,MPCプロトコルと組み合わせて特徴のランク付けを行うことのできる,プライベートな特徴選択のための最初のMPCベースのプロトコルを提案する。
本稿では,Gini不純物に基づく効率的な特徴スコアリングプロトコルを提案する。
実用データサイエンスにおける我々のアプローチの実現可能性を示すために,提案したMPCプロトコルを用いて,複数のサーバに計算をアウトソースする機械学習・アズ・ア・サービス構成による特徴選択実験を行った。
有効性については,提案プロトコルによるセキュアな特徴選択は,特徴値や選択された特徴に関する情報を漏らさずに,様々な実世界のデータセット上の分類器の精度を向上することを示す。
効率性については、データセットのサイズとセキュリティ設定に応じて、プロトコルが終了するまで数秒から1時間までのランタイムを文書化します。
関連論文リスト
- Provable Mutual Benefits from Federated Learning in Privacy-Sensitive
Domains [3.686808512438363]
クロスサイロフェデレーション学習により、データ所有者は、互いにプライベートデータセットから利益を得て、正確な機械学習モデルをトレーニングできる。
プライバシーに敏感なドメインへのクライアントの参加を促進するために、FLプロトコルはプライバシー保証とエンドモデル精度の微妙なバランスをとる必要がある。
我々は、サーバがFLプロトコルを設計できる時期と方法について、すべての参加者にとって有益であるかどうかを調査する。
論文 参考訳(メタデータ) (2024-03-11T12:43:44Z) - Feature Selection via Maximizing Distances between Class Conditional
Distributions [9.596923373834093]
積分確率測定(IPMs)により測定されたクラス条件分布間の距離に基づく新しい特徴選択フレームワークを提案する。
本フレームワークは, 教師付き分類のための分布感覚における特徴の識別的情報を直接探索する。
実験により,本フレームワークは,摂動に対する分類精度とロバスト性の観点から,最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-01-15T06:10:10Z) - Secure and Effective Data Appraisal for Machine Learning [17.828547661524688]
本稿では,データ選択を実践する革新的な手法を提案する。
提案手法はトランスフォーマーモデルとNLP/CVベンチマークを用いて評価する。
対象モデルの直接的MPCに基づく評価と比較して,本手法は,選択したデータを用いたトレーニングにおいて,数千時間から数十時間までの要時間を大幅に短縮する。
論文 参考訳(メタデータ) (2023-10-03T18:52:57Z) - Privacy Side Channels in Machine Learning Systems [82.85919161427604]
プライバシサイドチャネルは、システムレベルのコンポーネントを利用してプライベート情報を抽出する攻撃である。
機械学習ライフサイクル全体にわたるサイドチャネルの4つのカテゴリを提案する。
我々の結果は、全体的なエンドツーエンドのプライバシー分析の必要性を示しています。
論文 参考訳(メタデータ) (2023-09-11T16:49:05Z) - Tuning Pre-trained Model via Moment Probing [62.445281364055795]
本稿では,LP の可能性を探るため,新しい Moment Probing (MP) 法を提案する。
MPは、最終特徴の平均に基づいて線形分類ヘッドを実行する。
当社のMPはLPを著しく上回り、トレーニングコストの低い相手と競争しています。
論文 参考訳(メタデータ) (2023-07-21T04:15:02Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - Byzantine-Robust Federated Learning with Optimal Statistical Rates and
Privacy Guarantees [123.0401978870009]
ほぼ最適な統計率を持つビザンチン・ロバスト・フェデレーション学習プロトコルを提案する。
競合プロトコルに対してベンチマークを行い、提案プロトコルの実証的な優位性を示す。
我々のバケットプロトコルは、プライバシー保証手順と自然に組み合わせて、半正直なサーバに対するセキュリティを導入することができる。
論文 参考訳(メタデータ) (2022-05-24T04:03:07Z) - Training Differentially Private Models with Secure Multiparty
Computation [12.628792164922864]
複数のデータ所有者に起源を持つデータから機械学習モデルを学習する問題に対処する。
差分プライバシー(DP)に基づく既存のソリューションは、精度の低下を犠牲にしてこれを達成している。
提案手法はモデルトレーニングのためのMPCプロトコルと,学習したモデル係数をLaplaceノイズで摂動するMPCプロトコルに依存している。
論文 参考訳(メタデータ) (2022-02-05T20:00:37Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - PRICURE: Privacy-Preserving Collaborative Inference in a Multi-Party
Setting [3.822543555265593]
本稿では,セキュアなマルチパーティ計算とディファレンシャルプライバシの補完的強みを組み合わせたシステムpricureを提案する。
PRICUREは、複数のモデルオーナー間のプライバシー保護共同予測を可能にします。
ベンチマーク医療画像分類データセットを含む4つのデータセットのニューラルネットワーク上でPRICUREを評価する。
論文 参考訳(メタデータ) (2021-02-19T05:55:53Z) - User-Level Privacy-Preserving Federated Learning: Analysis and
Performance Optimization [77.43075255745389]
フェデレートラーニング(FL)は、データを有用なモデルにトレーニングしながら、モバイル端末(MT)からプライベートデータを保存することができる。
情報理論の観点からは、MTがアップロードした共有モデルから、好奇心の強いサーバがプライベートな情報を推測することが可能である。
サーバにアップロードする前に、共有モデルに人工ノイズを加えることで、ユーザレベルの差分プライバシー(UDP)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-29T10:13:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。