論文の概要: MIA-EPT: Membership Inference Attack via Error Prediction for Tabular Data
- arxiv url: http://arxiv.org/abs/2509.13046v1
- Date: Tue, 16 Sep 2025 13:03:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 17:50:53.088658
- Title: MIA-EPT: Membership Inference Attack via Error Prediction for Tabular Data
- Title(参考訳): MIA-EPT:単語データの誤り予測による会員推測攻撃
- Authors: Eyal German, Daniel Samira, Yuval Elovici, Asaf Shabtai,
- Abstract要約: 新たなブラックボックス攻撃であるタブラルデータに対するエラー予測によるMIAEPT, メンバーシップ推論攻撃について紹介する。
MIA-EPTは、ターゲットレコードの属性をマスキングして再構成することで、エラーベースの特徴ベクトルを構築する。
我々の結果は、合成データが本質的にプライバシー保護であるという仮定に挑戦する。
- 参考スコア(独自算出の注目度): 24.54021019214072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data generation plays an important role in enabling data sharing, particularly in sensitive domains like healthcare and finance. Recent advances in diffusion models have made it possible to generate realistic, high-quality tabular data, but they may also memorize training records and leak sensitive information. Membership inference attacks (MIAs) exploit this vulnerability by determining whether a record was used in training. While MIAs have been studied in images and text, their use against tabular diffusion models remains underexplored despite the unique risks of structured attributes and limited record diversity. In this paper, we introduce MIAEPT, Membership Inference Attack via Error Prediction for Tabular Data, a novel black-box attack specifically designed to target tabular diffusion models. MIA-EPT constructs errorbased feature vectors by masking and reconstructing attributes of target records, disclosing membership signals based on how well these attributes are predicted. MIA-EPT operates without access to the internal components of the generative model, relying only on its synthetic data output, and was shown to generalize across multiple state-of-the-art diffusion models. We validate MIA-EPT on three diffusion-based synthesizers, achieving AUC-ROC scores of up to 0.599 and TPR@10% FPR values of 22.0% in our internal tests. Under the MIDST 2025 competition conditions, MIA-EPT achieved second place in the Black-box Multi-Table track (TPR@10% FPR = 20.0%). These results demonstrate that our method can uncover substantial membership leakage in synthetic tabular data, challenging the assumption that synthetic data is inherently privacy-preserving. Our code is publicly available at https://github.com/eyalgerman/MIA-EPT.
- Abstract(参考訳): 合成データ生成は、データ共有、特に医療や金融といった繊細な分野において、重要な役割を果たす。
拡散モデルの最近の進歩により、現実的で高品質な表形式データを生成することが可能になったが、トレーニング記録を記憶したり、機密情報を漏洩したりすることもできる。
メンバーシップ推論攻撃(MIA)は、トレーニングでレコードが使用されたかどうかを判断することで、この脆弱性を悪用する。
MIAは画像やテキストで研究されているが、構造化属性の特異なリスクとレコードの多様性の制限にもかかわらず、表層拡散モデルに対する使用はいまだに探索されていない。
本稿では,表層拡散モデルをターゲットにした新しいブラックボックス攻撃であるMIAEPT, Membership Inference Attack via Error Prediction for Tabular Dataを紹介する。
MIA-EPTは、ターゲットレコードの属性をマスキングして再構成し、それらの属性の予測精度に基づいてメンバーシップ信号を公開することで、エラーベースの特徴ベクトルを構築する。
MIA-EPTは、生成モデルの内部コンポーネントへのアクセスなしに動作し、その合成データ出力のみに依存し、複数の最先端拡散モデルにまたがって一般化することが示されている。
AUC-ROCスコアは0.599, TPR@10% FPR値は22.0%であった。
MIDST 2025では、MIA-EPTはブラックボックス・マルチテーブル・トラック(TPR@10% FPR = 20.0%)で2位を獲得した。
これらの結果から,本手法は,合成表データの実質的な漏洩を解明し,合成データが本質的にプライバシ保存であるという仮定に挑戦できることを示した。
私たちのコードはhttps://github.com/eyalgerman/MIA-EPT.comで公開されています。
関連論文リスト
- Privacy Auditing Synthetic Data Release through Local Likelihood Attacks [7.780592134085148]
遺伝子様比攻撃(Gen-LRA)
Gen-LRAは、サロゲートモデルによる合成データに対する局所確率比の推定において、テスト観測が与える影響を評価して攻撃を定式化する。
その結果、Gen-LRAは、合成データのリリースのためのプライバシ監査ツールとしての有効性を裏付けている。
論文 参考訳(メタデータ) (2025-08-28T18:27:40Z) - Winning the MIDST Challenge: New Membership Inference Attacks on Diffusion Models for Tabular Data Synthesis [10.682673935815547]
既存のプライバシー評価は、しばしばメトリクスや弱いメンバーシップ推論攻撃(MIA)に依存している。
本研究では,拡散に基づく合成に関する厳密なMIA研究を行い,画像モデル用に設計された最先端の攻撃がこの環境で失敗することを明らかにする。
本手法は,ライトウェイト駆動方式で実装され,手動最適化の必要性をなくし,メンバーシップシグナルを効果的に学習する。
論文 参考訳(メタデータ) (2025-03-15T06:13:27Z) - The Canary's Echo: Auditing Privacy Risks of LLM-Generated Synthetic Text [23.412546862849396]
我々は、敵がLarge Language Models(LLMs)によって生成された合成データにアクセス可能であると仮定する。
我々は、データ合成に使用されるLPMを微調整するために使用されるトレーニングデータをターゲットに、メンバーシップ推論攻撃(MIA)を設計する。
モデルに基づくMIAのために作られたカナリアは、合成データのみを公開する場合、プライバシー監査のサブ最適化であることがわかった。
論文 参考訳(メタデータ) (2025-02-19T15:30:30Z) - Nob-MIAs: Non-biased Membership Inference Attacks Assessment on Large Language Models with Ex-Post Dataset Construction [37.69303106863453]
メンバーシップ推論攻撃 (MIA) は、特定の文書が与えられたLarge Language Models (LLM) プリトレーニングで使用されたかどうかを検出することを目的としている。
本稿では,LLMにおけるMIAの評価について述べる。
我々は、より公平なMIA評価のために、非バイアス'と非分類'のデータセットを作成するアルゴリズムを提案し、検証する。
論文 参考訳(メタデータ) (2024-08-12T07:49:28Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Assessing Privacy Risks in Language Models: A Case Study on
Summarization Tasks [65.21536453075275]
我々は要約作業に焦点をあて、会員推測(MI)攻撃について調査する。
テキストの類似性や文書修正に対するモデルの抵抗をMI信号として活用する。
我々は、MI攻撃から保護するための要約モデルの訓練と、プライバシとユーティリティの本質的にのトレードオフについて議論する。
論文 参考訳(メタデータ) (2023-10-20T05:44:39Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。