Fugu-MT 論文翻訳(概要): Releasing survey microdata with exact cluster locations and additional privacy safeguards

論文の概要: Releasing survey microdata with exact cluster locations and additional privacy safeguards

arxiv url: http://arxiv.org/abs/2205.12260v1
Date: Tue, 24 May 2022 19:37:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 17:12:18.496616
Title: Releasing survey microdata with exact cluster locations and additional privacy safeguards
Title（参考訳）: 正確なクラスタ位置と追加プライバシ保護を備えた調査用マイクロデータのリリース
Authors: Till Koebe and Alejandra Arias-Salazar
Abstract要約: 本稿では,プライバシ保護を付加した独自のマイクロデータの有用性を活用した,代替的なマイクロデータ配信戦略を提案する。当社の戦略は, 再識別の試みにおいても, 任意の属性に対する再識別リスクを60～80%削減する。
参考スコア（独自算出の注目度）: 77.34726150561087
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Household survey programs around the world publish fine-granular georeferenced microdata to support research on the interdependence of human livelihoods and their surrounding environment. To safeguard the respondents' privacy, micro-level survey data is usually (pseudo)-anonymized through deletion or perturbation procedures such as obfuscating the true location of data collection. This, however, poses a challenge to emerging approaches that augment survey data with auxiliary information on a local level. Here, we propose an alternative microdata dissemination strategy that leverages the utility of the original microdata with additional privacy safeguards through synthetically generated data using generative models. We back our proposal with experiments using data from the 2011 Costa Rican census and satellite-derived auxiliary information. Our strategy reduces the respondents' re-identification risk for any number of disclosed attributes by 60-80\% even under re-identification attempts.
Abstract（参考訳）: 世界の家庭調査プログラムは、人の生活と周囲環境の相互依存に関する研究を支援するために、微粒なジオレファレンスマイクロデータを公開している。回答者のプライバシを保護するため、マイクロレベル調査データは通常、削除やデータ収集の真の位置を隠蔽するなどの摂動手順を通じて匿名化される。しかし、これは調査データを地域レベルで補助的な情報で強化する新たなアプローチへの挑戦である。本稿では,生成モデルを用いた合成データによるプライバシ保護を付加した,オリジナルのマイクロデータの有用性を活用した代替的マイクロデータ普及戦略を提案する。 2011年コスタリカ国勢調査のデータと衛星からの補助情報を用いて,提案を裏付ける。当社の戦略は, 再識別の試みにおいても, 開示属性数に対する再識別リスクを60～80%削減する。

関連論文リスト

Extension of Spatial k-Anonymity: New Metrics for Assessing the Anonymity of Geomasked Data Considering Realistic Attack Scenarios [0.0]
匿名化されたジオ参照データセットの匿名性の度合いは、しばしば空間的k-匿名性の計量によって測定される。本稿では、匿名化されたジオレファレンスマイクロデータのコンテキストにおいて、潜在的なデータアタックシナリオを分類し、潜在的なデータアタックシナリオに適合した匿名性の総合的な評価を可能にする適切なメトリクスを導入する。
論文参考訳（メタデータ） (2025-09-09T08:38:52Z)
Statistics-Friendly Confidentiality Protection for Establishment Data, with Applications to the QCEW [39.69299537637253]
本稿では、政策立案者に対する解釈可能性に着目した、ビジネスデータのための新たな機密性フレームワークを提案する。ノイズの多い問合せ回答を秘密保持マイクロデータに変換する際に生じる新たな課題を解析する。
論文参考訳（メタデータ） (2025-09-01T16:29:54Z)
A Privacy-Preserving Data Collection Method for Diversified Statistical Analysis [11.135689359531105]
本稿では, リアルタイム情報収集分野において, RVNS と呼ばれる新しい実値負のサーベイモデルを提案する。 RVNSモデルは、データを識別する必要性からユーザーを除外し、実際の機密情報から逸脱した範囲からデータ一式をサンプリングすることのみを要求する。
論文参考訳（メタデータ） (2025-07-23T04:05:33Z)
A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文参考訳（メタデータ） (2025-04-28T01:16:27Z)
Augmenting Anonymized Data with AI: Exploring the Feasibility and Limitations of Large Language Models in Data Enrichment [3.459382629188014]
大規模言語モデル(LLM)は、テキスト生成と理解の両方において高度な機能を示している。データアーカイブへのそれらの適用は、データ対象に関する機密情報の民営化を促進する可能性がある。このデータは、保護されていないとしても、開示と身元確認の両方の観点からプライバシー上のリスクをもたらす可能性がある。
論文参考訳（メタデータ） (2025-04-03T13:26:59Z)
Investigating Vulnerabilities of GPS Trip Data to Trajectory-User Linking Attacks [49.1574468325115]
単一旅行からなるGPS旅行データセットにおいて,ユーザ識別子を再構築する新たな攻撃を提案する。個人識別が削除された場合でも再識別のリスクは大きい。さらなる調査では、少数の人しか訪れていない場所を頻繁に訪れているユーザーは、再識別に弱い傾向にあることが示されている。
論文参考訳（メタデータ） (2025-02-12T08:54:49Z)
Model Inversion Attacks: A Survey of Approaches and Countermeasures [59.986922963781]
近年、新しいタイプのプライバシ攻撃であるモデル反転攻撃(MIA)は、トレーニングのためのプライベートデータの機密性を抽出することを目的としている。この重要性にもかかわらず、総合的な概要とMIAに関する深い洞察を提供する体系的な研究が欠如している。本調査は、攻撃と防御の両方において、最新のMIA手法を要約することを目的としている。
論文参考訳（メタデータ） (2024-11-15T08:09:28Z)
Mitigating the Privacy Issues in Retrieval-Augmented Generation (RAG) via Pure Synthetic Data [51.41288763521186]
Retrieval-augmented Generation (RAG)は、外部知識ソースから取得した関連情報を統合することにより、言語モデルの出力を強化する。 RAGシステムは、プライベートデータを取得する際に深刻なプライバシーリスクに直面する可能性がある。検索データに対するプライバシー保護の代替として,合成データを用いる方法を提案する。
論文参考訳（メタデータ） (2024-06-20T22:53:09Z)
RASE: Efficient Privacy-preserving Data Aggregation against Disclosure Attacks for IoTs [2.1765174838950494]
センサデバイスが生み出すデータを収集・保護する新たなパラダイムについて検討する。データアグリゲーションとプライバシ保護の共同設計に関するこれまでの研究は、信頼されたフュージョンセンターがプライバシ体制に準拠していることを前提としている。本稿では,3段階の逐次手順,雑音付加,ランダムな置換,パラメータ推定に一般化可能な新しいパラダイム(RASE)を提案する。
論文参考訳（メタデータ） (2024-05-31T15:21:38Z)
Synthetic Census Data Generation via Multidimensional Multiset Sum [7.900694093691988]
我々は、Censusの統計データのみから合成マイクロデータを生成するツールを提供する。我々は,本手法が実際にうまく機能していることを示し,その性能を説明する理論的議論を行う。
論文参考訳（メタデータ） (2024-04-15T19:06:37Z)
Privacy risk in GeoData: A survey [3.7228963206288967]
我々は、地理データにおける個人のプライバシーを保護するために提案された異なるジオマスキング手法を分析した。本稿では,これらの手法を様々な次元にわたって特徴付ける分類法を提案する。提案した分類学は,データカストディアンの実践的資源として機能し,既存のプライバシーメカニズムの広範囲をナビゲートする手段を提供する。
論文参考訳（メタデータ） (2024-02-06T00:55:06Z)
A Summary of Privacy-Preserving Data Publishing in the Local Setting [0.6749750044497732]
統計開示制御は、機密情報を匿名化して暴露するリスクを最小限にすることを目的としている。マイクロデータの復号化に使用される現在のプライバシ保存技術について概説し、様々な開示シナリオに適したプライバシ対策を掘り下げ、情報損失と予測性能の指標を評価する。
論文参考訳（メタデータ） (2023-12-19T04:23:23Z)
Membership Inference Attacks against Synthetic Data through Overfitting Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文参考訳（メタデータ） (2023-02-24T11:27:39Z)
GenSyn: A Multi-stage Framework for Generating Synthetic Microdata using Macro Data Sources [21.32471030724983]
人口を特徴付ける個人レベルのデータ(マイクロデータ)は多くの現実世界の問題を研究するのに不可欠である。本研究では,高分解能データの抽出方法として合成データ生成について検討する。
論文参考訳（メタデータ） (2022-12-08T01:22:12Z)
Private Set Generation with Discriminative Information [63.851085173614]
異なるプライベートなデータ生成は、データプライバシの課題に対する有望な解決策である。既存のプライベートな生成モデルは、合成サンプルの有用性に苦慮している。我々は,最先端アプローチのサンプルユーティリティを大幅に改善する,シンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (2022-11-07T10:02:55Z)
DP2-Pub: Differentially Private High-Dimensional Data Publication with Invariant Post Randomization [58.155151571362914]
本稿では,2つのフェーズで動作する差分プライベートな高次元データパブリッシング機構(DP2-Pub)を提案する。属性をクラスタ内凝集度の高い低次元クラスタに分割し、クラスタ間の結合度を低くすることで、適切なプライバシ予算を得ることができる。また、DP2-Pubメカニズムを、ローカルの差分プライバシーを満たす半正直なサーバでシナリオに拡張します。
論文参考訳（メタデータ） (2022-08-24T17:52:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。