論文の概要: Quality Degradation Attack in Synthetic Data
- arxiv url: http://arxiv.org/abs/2601.02947v1
- Date: Tue, 06 Jan 2026 11:43:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.912905
- Title: Quality Degradation Attack in Synthetic Data
- Title(参考訳): 合成データにおける品質劣化攻撃
- Authors: Qinyi Liu, Dong Liu, Farhad Vadiee, Mohammad Khalil, Pedro P. Vergara Barrios,
- Abstract要約: 本研究では,実際のデータセットへのアクセスや生成プロセスの制御を行う敵による品質攻撃について検討する。
我々は、対応する脅威モデルを形式化し、実データのターゲット操作の有効性を実証的に評価する。
- 参考スコア(独自算出の注目度): 5.461072909384133
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Synthetic Data Generation (SDG) can be used to facilitate privacy-preserving data sharing. However, most existing research focuses on privacy attacks where the adversary is the recipient of the released synthetic data and attempts to infer sensitive information from it. This study investigates quality degradation attacks initiated by adversaries who possess access to the real dataset or control over the generation process, such as the data owner, the synthetic data provider, or potential intruders. We formalize a corresponding threat model and empirically evaluate the effectiveness of targeted manipulations of real data (e.g., label flipping and feature-importance-based interventions) on the quality of generated synthetic data. The results show that even small perturbations can substantially reduce downstream predictive performance and increase statistical divergence, exposing vulnerabilities within SDG pipelines. This study highlights the need to integrate integrity verification and robustness mechanisms, alongside privacy protection, to ensure the reliability and trustworthiness of synthetic data sharing frameworks.
- Abstract(参考訳): 合成データ生成(SDG)は、プライバシー保護データ共有を容易にするために用いられる。
しかし、既存の研究のほとんどは、敵がリリースした合成データの受信者であり、機密情報を推測しようとするプライバシー攻撃に焦点を当てている。
本研究では,データ所有者,合成データ提供者,潜在的侵入者など,実際のデータセットへのアクセスや生成プロセスの制御を行う敵による品質劣化攻撃について検討する。
我々は、対応する脅威モデルを定式化し、生成した合成データの品質に対する実データ(ラベルフリップや特徴重要度に基づく介入など)のターゲット操作の有効性を実証的に評価する。
その結果、小さな摂動でさえ、下流での予測性能を大幅に低下させ、統計的ばらつきを増大させ、SDGパイプライン内の脆弱性を露呈することを示した。
この研究は、総合データ共有フレームワークの信頼性と信頼性を確保するために、プライバシー保護とともに、整合性検証と堅牢性メカニズムを統合する必要性を強調した。
関連論文リスト
- Privacy Auditing Synthetic Data Release through Local Likelihood Attacks [7.780592134085148]
遺伝子様比攻撃(Gen-LRA)
Gen-LRAは、サロゲートモデルによる合成データに対する局所確率比の推定において、テスト観測が与える影響を評価して攻撃を定式化する。
その結果、Gen-LRAは、合成データのリリースのためのプライバシ監査ツールとしての有効性を裏付けている。
論文 参考訳(メタデータ) (2025-08-28T18:27:40Z) - SMOTE-DP: Improving Privacy-Utility Tradeoff with Synthetic Data [13.699107354397286]
合成データ生成の適切なメカニズムにより、大きなユーティリティ損失を伴わずに、強力なプライバシ保護を実現することができることを示す。
我々は,このSMOTE-DP技術が,堅牢なプライバシ保護を保証するだけでなく,下流学習タスクにおいて有効性を維持する合成データを生成することを理論的および実証的な実証を通じて証明した。
論文 参考訳(メタデータ) (2025-06-02T17:27:10Z) - Quantitative Auditing of AI Fairness with Differentially Private Synthetic Data [0.30693357740321775]
AIシステムの公正監査はバイアスを特定し定量化することができる。
現実世界のデータを使った従来の監査は、セキュリティとプライバシーの懸念を引き起こす。
本稿では,AIシステムの公正性を評価するために,微分プライベートな合成データを活用するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-30T13:36:27Z) - Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。
合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文 参考訳(メタデータ) (2024-04-11T06:34:17Z) - Instance-Level Safety-Aware Fidelity of Synthetic Data and Its Calibration [5.089356301032639]
4種類のインスタンスレベルの忠実さを導入し、安全クリティカルなアプリケーションにおけるその役割に焦点を当てる。
目的は、合成データにテストを適用することによって、現実世界の安全性の問題を明らかにすることだ。
論文 参考訳(メタデータ) (2024-02-10T19:45:40Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - The Use of Synthetic Data to Train AI Models: Opportunities and Risks
for Sustainable Development [0.6906005491572401]
本稿では,合成データの生成,利用,普及を規定する政策について検討する。
優れた合成データポリシーは、プライバシの懸念とデータの有用性のバランスを取らなければならない。
論文 参考訳(メタデータ) (2023-08-31T23:18:53Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。