論文の概要: Releasing survey microdata with exact cluster locations and additional
privacy safeguards
- arxiv url: http://arxiv.org/abs/2205.12260v1
- Date: Tue, 24 May 2022 19:37:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 17:12:18.496616
- Title: Releasing survey microdata with exact cluster locations and additional
privacy safeguards
- Title(参考訳): 正確なクラスタ位置と追加プライバシ保護を備えた調査用マイクロデータのリリース
- Authors: Till Koebe and Alejandra Arias-Salazar
- Abstract要約: 本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。
当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60~80%削減する。
- 参考スコア(独自算出の注目度): 77.34726150561087
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Household survey programs around the world publish fine-granular
georeferenced microdata to support research on the interdependence of human
livelihoods and their surrounding environment. To safeguard the respondents'
privacy, micro-level survey data is usually (pseudo)-anonymized through
deletion or perturbation procedures such as obfuscating the true location of
data collection. This, however, poses a challenge to emerging approaches that
augment survey data with auxiliary information on a local level. Here, we
propose an alternative microdata dissemination strategy that leverages the
utility of the original microdata with additional privacy safeguards through
synthetically generated data using generative models. We back our proposal with
experiments using data from the 2011 Costa Rican census and satellite-derived
auxiliary information. Our strategy reduces the respondents' re-identification
risk for any number of disclosed attributes by 60-80\% even under
re-identification attempts.
- Abstract(参考訳): 世界の家庭調査プログラムは、人の生活と周囲環境の相互依存に関する研究を支援するために、微粒なジオレファレンスマイクロデータを公開している。
回答者のプライバシを保護するため、マイクロレベル調査データは通常、削除やデータ収集の真の位置を隠蔽するなどの摂動手順を通じて匿名化される。
しかし、これは調査データを地域レベルで補助的な情報で強化する新たなアプローチへの挑戦である。
本稿では,生成モデルを用いた合成データによるプライバシ保護を付加した,オリジナルのマイクロデータの有用性を活用した代替的マイクロデータ普及戦略を提案する。
2011年コスタリカ国勢調査のデータと衛星からの補助情報を用いて,提案を裏付ける。
当社の戦略は, 再識別の試みにおいても, 開示属性数に対する再識別リスクを60~80%削減する。
関連論文リスト
- Model Inversion Attacks: A Survey of Approaches and Countermeasures [59.986922963781]
近年、新しいタイプのプライバシ攻撃であるモデル反転攻撃(MIA)は、トレーニングのためのプライベートデータの機密性を抽出することを目的としている。
この重要性にもかかわらず、総合的な概要とMIAに関する深い洞察を提供する体系的な研究が欠如している。
本調査は、攻撃と防御の両方において、最新のMIA手法を要約することを目的としている。
論文 参考訳(メタデータ) (2024-11-15T08:09:28Z) - Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。
RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。
検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文 参考訳(メタデータ) (2024-06-20T22:53:09Z) - RASE: Efficient Privacy-preserving Data Aggregation against Disclosure Attacks for IoTs [2.1765174838950494]
センサデバイスが生み出すデータを収集・保護する新たなパラダイムについて検討する。
データアグリゲーションとプライバシ保護の共同設計に関するこれまでの研究は、信頼されたフュージョンセンターがプライバシ体制に準拠していることを前提としている。
本稿では,3段階の逐次手順,雑音付加,ランダムな置換,パラメータ推定に一般化可能な新しいパラダイム(RASE)を提案する。
論文 参考訳(メタデータ) (2024-05-31T15:21:38Z) - Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。
我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文 参考訳(メタデータ) (2024-04-15T19:06:37Z) - Privacy risk in GeoData: A survey [3.7228963206288967]
我々は、地理データにおける個人のプライバシーを保護するために提案された異なるジオマスキング手法を分析した。
本稿では,これらの手法を様々な次元にわたって特徴付ける分類法を提案する。
提案した分類学は,データカストディアンの実践的資源として機能し,既存のプライバシーメカニズムの広範囲をナビゲートする手段を提供する。
論文 参考訳(メタデータ) (2024-02-06T00:55:06Z) - A Summary of Privacy-Preserving Data Publishing in the Local Setting [0.6749750044497732]
統計開示制御は、機密情報を匿名化して暴露するリスクを最小限にすることを目的としている。
マイクロデータの復号化に使用される現在のプライバシ保存技術について概説し、様々な開示シナリオに適したプライバシ対策を掘り下げ、情報損失と予測性能の指標を評価する。
論文 参考訳(メタデータ) (2023-12-19T04:23:23Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - GenSyn: A Multi-stage Framework for Generating Synthetic Microdata using
Macro Data Sources [21.32471030724983]
人口を特徴付ける個人レベルのデータ(マイクロデータ)は多くの現実世界の問題を研究するのに不可欠である。
本研究では,高分解能データの抽出方法として合成データ生成について検討する。
論文 参考訳(メタデータ) (2022-12-08T01:22:12Z) - Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。
既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。
我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文 参考訳(メタデータ) (2022-11-07T10:02:55Z) - DP2-Pub: Differentially Private High-Dimensional Data Publication with
Invariant Post Randomization [58.155151571362914]
本稿では,2つのフェーズで動作する差分プライベートな高次元データパブリッシング機構(DP2-Pub)を提案する。
属性をクラスタ内凝集度の高い低次元クラスタに分割し、クラスタ間の結合度を低くすることで、適切なプライバシ予算を得ることができる。
また、DP2-Pubメカニズムを、ローカルの差分プライバシーを満たす半正直なサーバでシナリオに拡張します。
論文 参考訳(メタデータ) (2022-08-24T17:52:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。