Fugu-MT 論文翻訳(概要): Generating private data with user customization

論文の概要: Generating private data with user customization

arxiv url: http://arxiv.org/abs/2012.01467v1
Date: Wed, 2 Dec 2020 19:13:58 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-25 03:44:25.408453
Title: Generating private data with user customization
Title（参考訳）: ユーザカスタマイズによるプライベートデータ生成
Authors: Xiao Chen, Thomas Navidi, Ram Rajagopal
Abstract要約: モバイルデバイスは大量のデータを生成、保存し、機械学習モデルを強化することができる。しかし、このデータには、データのリリースを防止するデータ所有者特有のプライベート情報が含まれている可能性がある。有用な情報を保持しつつ、ユーザ固有のプライベート情報とデータとの相関を小さくしたい。
参考スコア（独自算出の注目度）: 9.415164800448853
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Personal devices such as mobile phones can produce and store large amounts of data that can enhance machine learning models; however, this data may contain private information specific to the data owner that prevents the release of the data. We want to reduce the correlation between user-specific private information and the data while retaining the useful information. Rather than training a large model to achieve privatization from end to end, we first decouple the creation of a latent representation, and then privatize the data that allows user-specific privatization to occur in a setting with limited computation and minimal disturbance on the utility of the data. We leverage a Variational Autoencoder (VAE) to create a compact latent representation of the data that remains fixed for all devices and all possible private labels. We then train a small generative filter to perturb the latent representation based on user specified preferences regarding the private and utility information. The small filter is trained via a GAN-type robust optimization that can take place on a distributed device such as a phone or tablet. Under special conditions of our linear filter, we disclose the connections between our generative approach and renyi differential privacy. We conduct experiments on multiple datasets including MNIST, UCI-Adult, and CelebA, and give a thorough evaluation including visualizing the geometry of the latent embeddings and estimating the empirical mutual information to show the effectiveness of our approach.
Abstract（参考訳）: 携帯電話などのパーソナルデバイスは、大量のデータを生成・保存して機械学習モデルを強化することができるが、このデータは、データのリリースを防止するデータ所有者特有のプライベート情報を含む可能性がある。有用な情報を保持しつつ、ユーザ固有のプライベート情報とデータとの相関を小さくしたい。最終段階から最終段階までの民営化を達成するために大きなモデルを訓練する代わりに、まず潜在表現の作成を分離し、次に、限られた計算量とデータの実用上の最小限の障害を伴う設定において、ユーザ固有の民営化を許容するデータを民営化する。可変オートエンコーダ(VAE)を利用して、すべてのデバイスと可能なすべてのプライベートラベルに固定されたデータのコンパクトな潜在表現を生成する。次に,プライベート情報とユーティリティ情報に関するユーザの指定した嗜好に基づいて,潜在表現を摂動させる小さな生成フィルタを訓練する。小型フィルタは、携帯電話やタブレットなどの分散デバイス上で起こり得る、GANタイプの堅牢な最適化を通じてトレーニングされる。線形フィルタの特別な条件下では、生成的アプローチとrenyi差分プライバシーの関係を明らかにする。我々はMNIST, UCI-Adult, CelebAなどの複数のデータセットで実験を行い, 潜伏埋め込みの幾何学を可視化し, 経験的相互情報を推定し, アプローチの有効性を示す。

関連論文リスト

Improving Noise Efficiency in Privacy-preserving Dataset Distillation [59.57846442477106]
本稿では,最適化からサンプリングを分離してコンバージェンスを向上し,信号品質を向上させる新しいフレームワークを提案する。 CIFAR-10では,従来の最先端手法の蒸留セットサイズを5分の1に減らして,クラス毎50イメージでtextbf10.0%,クラス毎50イメージで textbf8.3%向上した。
論文参考訳（メタデータ） (2025-08-03T13:15:52Z)
Machine Learning with Privacy for Protected Attributes [56.44253915927481]
差分プライバシー(DP)の定義を洗練し、機能差分プライバシー(FDP)と呼ばれるより汎用的で柔軟なフレームワークを作成する。私たちの定義はシミュレーションに基づいており、プライバシの追加/削除と置き換えの両方が可能で、保護された機能と非保護された機能の任意の分離を処理できます。各種機械学習タスクにフレームワークを適用し,パブリック機能が利用可能であればDP学習モデルの実用性を大幅に向上させることができることを示す。
論文参考訳（メタデータ） (2025-06-24T17:53:28Z)
Do You Really Need Public Data? Surrogate Public Data for Differential Privacy on Tabular Data [10.1687640711587]
これは、プライバシ損失の予算を消費せず、公開スキーマやメタデータからのみ構築される。大規模言語モデル(LLM)を用いたサロゲート公開データ生成プロセスを自動化する。特に,CSVファイルとして直接レコード生成を行う方法と,サンプリングのための自動構造因果モデル(SCM)の構築を提案する。
論文参考訳（メタデータ） (2025-04-19T17:55:10Z)
Segmented Private Data Aggregation in the Multi-message Shuffle Model [6.436165623346879]
我々は、差分プライバシーのマルチメッセージシャッフルモデルにおいて、セグメント化されたプライベートデータアグリゲーションの研究を開拓した。当社のフレームワークでは,ユーザに対するフレキシブルなプライバシ保護と,アグリゲーションサーバのための拡張ユーティリティを導入している。提案手法は,既存手法と比較して推定誤差を約50%削減する。
論文参考訳（メタデータ） (2024-07-29T01:46:44Z)
Privacy Amplification for the Gaussian Mechanism via Bounded Support [64.86780616066575]
インスタンスごとの差分プライバシー(pDP)やフィッシャー情報損失(FIL)といったデータ依存のプライバシ会計フレームワークは、固定されたトレーニングデータセット内の個人に対してきめ細かいプライバシー保証を提供する。本稿では,データ依存会計下でのプライバシ保証を向上することを示すとともに,バウンドサポートによるガウス機構の簡単な修正を提案する。
論文参考訳（メタデータ） (2024-03-07T21:22:07Z)
Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文参考訳（メタデータ） (2023-12-10T07:38:56Z)
Privacy Preserving Large Language Models: ChatGPT Case Study Based Vision and Framework [6.828884629694705]
本稿では,LLMのプライバシ生成モデルであるPrivChatGPTという概念モデルを提案する。 PrivChatGPTは、データキュレーション/前処理中にユーザのプライバシを保護し、プライベートコンテキストの保存と大規模データのプライベートトレーニングプロセスという2つの主要コンポーネントから構成される。
論文参考訳（メタデータ） (2023-10-19T06:55:13Z)
Probing the Transition to Dataset-Level Privacy in ML Models Using an Output-Specific and Data-Resolved Privacy Profile [23.05994842923702]
差分プライバシーメカニズムを用いてデータセットでトレーニングされたモデルが、近隣のデータセットでトレーニングされた結果の分布によってカバーされる範囲を定量化するプライバシー指標について検討する。プライバシプロファイルは、近隣のディストリビューションで発生する不明瞭性への観察された遷移を、$epsilon$の減少として調査するために使用できることを示す。
論文参考訳（メタデータ） (2023-06-27T20:39:07Z)
How Do Input Attributes Impact the Privacy Loss in Differential Privacy? [55.492422758737575]
DPニューラルネットワークにおけるオブジェクトごとの規範と個人のプライバシ損失との関係について検討する。プライバシ・ロス・インプット・サセプティビリティ(PLIS)と呼ばれる新しい指標を導入し、被験者のプライバシ・ロスを入力属性に適応させることを可能にした。
論文参考訳（メタデータ） (2022-11-18T11:39:03Z)
Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-07T10:02:55Z)
Differentially Private Multi-Party Data Release for Linear Regression [40.66319371232736]
Differentially Private (DP) データリリースは、データ対象のプライバシを損なうことなくデータを広める、有望なテクニックである。本稿では、異なる利害関係者が同じデータ対象グループに属する不整合な属性セットを所有するマルチパーティ設定に焦点を当てる。提案手法は,データセットサイズが増大する最適(プライベートでない)解に収束することを示す。
論文参考訳（メタデータ） (2022-06-16T08:32:17Z)
Mixed Differential Privacy in Computer Vision [133.68363478737058]
AdaMixは、プライベートとパブリックの両方の画像データを使用して、ディープニューラルネットワーク分類器をトレーニングするための適応型微分プライベートアルゴリズムである。プライベートデータを無視する数ショットあるいはゼロショットの学習ベースラインは、大規模なプライベートデータセットの微調整よりも優れています。
論文参考訳（メタデータ） (2022-03-22T06:15:43Z)
Personalized PATE: Differential Privacy for Machine Learning with Individual Privacy Guarantees [1.2691047660244335]
トレーニングデータ内に、パーソナライズされたプライバシ保証の異なるMLモデルのトレーニングを支援する3つの新しい方法を提案する。実験により, 個人化されたプライバシ手法は, 非個人化されたベースラインよりも高い精度のモデルが得られることがわかった。
論文参考訳（メタデータ） (2022-02-21T20:16:27Z)
Don't Generate Me: Training Differentially Private Generative Models with Sinkhorn Divergence [73.14373832423156]
そこで我々はDP-Sinkhornを提案する。DP-Sinkhornは個人データからデータ分布を差分プライバシで学習するための新しいトランスポートベース生成手法である。差分的にプライベートな生成モデルを訓練するための既存のアプローチとは異なり、我々は敵の目的に頼らない。
論文参考訳（メタデータ） (2021-11-01T18:10:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。