論文の概要: SoK: Reconstruction Attacks on Synthetic Tabular Data (Insights from Winning the NIST CRC)
- arxiv url: http://arxiv.org/abs/2606.08372v1
- Date: Sat, 06 Jun 2026 23:39:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.068438
- Title: SoK: Reconstruction Attacks on Synthetic Tabular Data (Insights from Winning the NIST CRC)
- Title(参考訳): SoK:合成語彙データによる再構成攻撃(NIST CRCの勝利から)
- Authors: Steven Golob, Sikha Pentyala, Martine De Cock,
- Abstract要約: 本報告では,非同定・合成データに対する再構成攻撃の最初の体系化について述べる。
方法の選択は攻撃の選択よりもリスクをはるかに支配していることを示す。
2025年の国立標準技術研究所(National Institute of Standards and Technology, NIST)共同研究サイクルで、すべてのレッドチームの中で、第1位となる結果が得られました。
- 参考スコア(独自算出の注目度): 4.995853115126354
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data is increasingly promoted as a privacy-preserving substitute for releasing sensitive tabular records, yet its central adversarial threat ("reconstruction", the recovery of an individual's hidden attribute values from a synthetic release and a handful of known quasi-identifiers) has been studied only in scattered, hard-to-compare settings. We present the first systematization of reconstruction (equivalently, attribute inference) attacks on de-identified and synthetic tabular data. We contribute a taxonomy that organizes attacks by the structure they exploit; the most systematic empirical evaluation to date, pitting fourteen attacks against nine synthetic data generation (SDG) methods across five benchmark datasets; and a set of new attacks that fill gaps in the taxonomy, one of which (CoBP-RA) is the strongest attack we measure. Crucially, we introduce a methodology for interpreting what attack success means: a memorization test that distinguishes reconstruction of the population distribution from memorization of training records, and a reduction that places reconstruction and membership inference on a single comparable scale. Our findings: the choice of SDG method governs risk far more than the choice of attack; differential privacy protects mainly at small budgets ($\varepsilon\lesssim1$), above which protection plateaus, bounded by the synthesizer's capacity rather than its noise; de-identification methods are the most exposed; and most reconstruction reflects distributional structure rather than memorization, concentrating individual risk on atypical records. The attacks and infrastructure are externally validated by our first-place finish among all red teams in the 2025 \textit{National Institute of Standards and Technology} (NIST) Collaborative Research Cycle.
- Abstract(参考訳): 合成データは、センシティブな表紙記録を公開するためのプライバシー保護の代用としてますます推進されているが、その中央の敵対的脅威(再構成、合成されたリリースから隠れた属性値の回復、およびいくつかの既知の準識別器)は、散在し難い環境でのみ研究されている。
本報告では,非同定・合成表型データに対する再構成(属性推論と同等)の最初の体系化について述べる。
我々は、彼らが活用する構造による攻撃を組織する分類学、最も体系的な経験的評価、そして5つのベンチマークデータセットにまたがる9つの合成データ生成(SDG)メソッドに対する14の攻撃、そして分類のギャップを埋める一連の新しい攻撃、そしてそのうちの1つ(CoBP-RA)が私たちが計測する最強の攻撃である。
重要なことは、攻撃成功の意味を解釈する方法論として、トレーニング記録の記憶から人口分布の再構築を区別する記憶テストと、単一の規模に再構築と会員推定を配置する減量テストを紹介する。
SDG法の選択は攻撃の選択よりもリスクをはるかに多く支配する; 差分プライバシーは、主に小さな予算で保護される("\varepsilon\lesssim1$")。
攻撃とインフラは、2025年の「textit{National Institute of Standards and Technology} (NIST) Collaborative Research Cycle」において、すべての赤チームの中で、私たちの第1位で検証されています。
関連論文リスト
- Beyond Homophily: Towards Generalized Graph Reconstruction Attack and Defense [80.28330585803133]
グラフニューラルネットワーク(GNN)は、計算データに広くデプロイされているが、トレーニンググラフの隣接性に関する機密情報やプロプライエタリ情報を漏洩することができる。
本研究は、訓練されたGNNからトレーニング隣接性を再構築するモデル逆転の一形態であるグラフ再構成攻撃(GRA)について研究する。
本稿では, MC-GRA(+)を提案する。これは, GNNにより誘導される表現が対象モデルのそれと一致した代理隣接を最適化することにより, 隣接性を再構築する。
防衛面では, MC-GPB (+) を提案する。
論文 参考訳(メタデータ) (2026-06-06T09:29:27Z) - Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation [50.87199039334856]
Retrieval-Augmented Generation (RAG) は知識集約型アプリケーションの基礎となっている。
近年の研究では、悪意あるクエリによって知識抽出攻撃が機密知識ベースコンテンツを回復できることが示されている。
本稿では,RAGシステムに対する知識抽出攻撃のための最初の体系的ベンチマークを紹介する。
論文 参考訳(メタデータ) (2026-02-10T01:27:46Z) - Debiased Dual-Invariant Defense for Adversarially Robust Person Re-Identification [52.63017280231648]
人物再識別(ReID)は、歩行者軌道追跡などの現実の多くの応用において、基本的な課題である。
Person ReIDモデルは、歩行者画像に対する知覚不能な摂動が完全に誤った予測を引き起こすような、敵の攻撃に非常に敏感である。
本稿では,2つの相からなる二重不変防衛フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-13T03:56:40Z) - Revisiting the Privacy Risks of Split Inference: A GAN-Based Data Reconstruction Attack via Progressive Feature Optimization [49.32786615205064]
Split Inference (SI)は、エッジデバイスとクラウドの間の計算を分割することで、レイテンシを低減し、ユーザのプライバシを保護する。
データ再構成攻撃(DRA)の最近の進歩は、SIで交換された中間的特徴を利用して機密入力データを復元できることを明らかにしている。
既存のDRAは一般的に浅いモデルにのみ有効であり、セマンティックな事前を十分に活用できない。
本稿では,プログレッシブ・フィーチャー・オプティマイゼーション(PFO)を用いた新しいGANベースのDRAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T10:00:39Z) - From Mean to Extreme: Formal Differential Privacy Bounds on the Success of Real-World Data Reconstruction Attacks [54.25638567385662]
機械学習における微分プライバシーは、しばしばメンバーシップ推論に対する保証として解釈される。
DP予算を定量的な保護に翻訳することで、データ再構築の脅威を悪化させることは、依然として困難な課題である。
本稿では、実証された"ゼロスクラッチ"攻撃のメカニズムに合わせた、最初の公式なプライバシー境界を導出することで、臨界ギャップを埋める。
論文 参考訳(メタデータ) (2024-02-20T09:52:30Z) - A Linear Reconstruction Approach for Attribute Inference Attacks against Synthetic Data [1.5293427903448022]
合成データに対する新しい属性推論攻撃を導入する。
攻撃は任意の記録でも極めて正確であることを示す。
次に、プライバシー保護と統計ユーティリティ保護のトレードオフを評価する。
論文 参考訳(メタデータ) (2023-01-24T14:56:36Z) - Exploring the Security Boundary of Data Reconstruction via Neuron
Exclusivity Analysis [23.07323180340961]
線形整列ユニット(ReLUs)を用いたニューラルネットワーク上の微視的視点による勾配からのデータ再構成のセキュリティ境界について検討する。
ニューラルネットワークの安全性の低い境界にある訓練バッチの再構築において,従来の攻撃よりも大幅に優れる新しい決定論的攻撃アルゴリズムを構築した。
論文 参考訳(メタデータ) (2020-10-26T05:54:47Z) - privGAN: Protecting GANs from membership inference attacks at low cost [5.735035463793008]
Generative Adversarial Networks (GAN)は、合成画像のリリースを、オリジナルのデータセットを公開せずにデータを共有するための実行可能なアプローチにした。
近年の研究では、GANモデルとその合成データを用いて、相手によるトレーニングセットメンバーシップを推測できることが示されている。
ここでは、ジェネレータが識別器を騙すだけでなく、メンバーシップ推論攻撃を防御するために訓練される新しいGANアーキテクチャ(privGAN)を開発する。
論文 参考訳(メタデータ) (2019-12-31T20:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。