論文の概要: Black-box Membership Inference Attacks on the Pre-training Data of Image-generation Models
- arxiv url: http://arxiv.org/abs/2605.27020v1
- Date: Tue, 26 May 2026 13:38:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.192055
- Title: Black-box Membership Inference Attacks on the Pre-training Data of Image-generation Models
- Title(参考訳): 画像生成モデルの事前学習データに対するブラックボックスメンバーシップ推論攻撃
- Authors: Tao Qi, Huili Wang, Yuanhong Huang, Wendan Wang, Lianchao Zhao, Jinrui Wang, Zichen Qin, Shangguang Wang, Yongfeng Huang,
- Abstract要約: メンバーシップ推論攻撃(MIA)は、モデルトレーニング中に不正なデータの使用を識別するための有望なツールとして登場した。
拡散モデルにおける事前学習データを検出するために,クロスモーダルデータ機構を利用するブラックボックスメンバシップ推論攻撃フレームワーク(SD-MIA)を提案する。
- 参考スコア(独自算出の注目度): 23.57577038946099
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid advancement of diffusion-based image generation models has raised serious concerns regarding potential copyright and privacy infringements involving human-created data. Membership inference attacks (MIAs) have emerged as a promising tool for identifying unauthorized data usage during model training. Existing methods typically assess the ability of model to denoise perturbed suspect images as an indicator of membership status. However, the discriminative power of such features is highly dependent on the degree of model memorization and deteriorates significantly when applied to less exposed data (e.g., pre-training data). Although several methods attempt to enhance detection by leveraging internal model features, these features are generally inaccessible in mainstream closed-source image generation platforms, limiting their practicality. In this paper, we demonstrate that analyzing how a black-box diffusion model denoises a target image and corresponding perturbed textual instructions can reveal more distinctive membership cues. Based on this insight, we propose a black-box membership inference attack framework (named SD-MIA) that leverages a cross-modal data perturbation mechanism to detect pre-training data in diffusion models. We conduct extensive experiments on both a public benchmark dataset and a newly constructed dataset, each comprising pre-training membership and non-membership samples with identical distributions. Experimental results demonstrate that SD-MIA achieves superior performance compared to existing baselines, including those with the unfair advantage of accessing internal model features.
- Abstract(参考訳): 拡散に基づく画像生成モデルの急速な進歩は、人間が作成したデータを含む著作権やプライバシー侵害に関する深刻な懸念を引き起こしている。
メンバーシップ推論攻撃(MIA)は、モデルトレーニング中に不正なデータの使用を識別するための有望なツールとして登場した。
既存の手法は、典型的には、メンバーシップステータスの指標として、混乱した疑似イメージを識別するモデルの能力を評価する。
しかし、そのような特徴の識別力は、モデル記憶の度合いに大きく依存しており、露出の少ないデータ(例えば、事前学習データ)に適用すると著しく低下する。
いくつかの手法は内部モデルの特徴を活用して検出を強化しようとするが、これらの特徴は主流のクローズドソース画像生成プラットフォームでは一般にアクセスできないため、実用性は制限される。
本稿では,ブラックボックス拡散モデルがターゲット画像とそれに対応する乱雑なテキスト命令をどう認識するかを解析することにより,より独特なメンバーシップの手がかりを明らかにすることを実証する。
この知見に基づき、拡散モデルにおける事前学習データを検出するために、クロスモーダルデータ摂動機構を利用するブラックボックスメンバーシップ推論攻撃フレームワーク(SD-MIA)を提案する。
我々は、公開ベンチマークデータセットと新しく構築されたデータセットの両方について広範な実験を行い、それぞれ同じ分布を持つ事前学習メンバーシップと非メンバーシップサンプルからなる。
実験結果から,SD-MIAは内部モデル機能に不公平な優位性を持つものを含め,既存のベースラインに比べて優れた性能を示すことが示された。
関連論文リスト
- Noise as a Probe: Membership Inference Attacks on Diffusion Models Leveraging Initial Noise [51.179816451161635]
拡散モデルは画像生成において顕著な進歩を遂げているが、そのデプロイの増加はプライバシに関する深刻な懸念を引き起こす。
広範に使われているノイズスケジュールは、画像のセマンティック情報を完全に排除することができない。
本稿では,初期雑音に意味情報を注入し,モデル生成結果を解析してメンバーシップを推定する,シンプルで効果的なメンバーシップ推論攻撃を提案する。
論文 参考訳(メタデータ) (2026-01-29T12:29:01Z) - Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Unveiling Impact of Frequency Components on Membership Inference Attacks for Diffusion Models [51.179816451161635]
メンバーシップ推論アタック(MIA)は、モデルのトレーニングフェーズで特定のデータが使用されたかどうかを確認するように設計されている。
我々はそれらを、会員識別のための会員スコアを計算する統一的な汎用パラダイムに定式化する。
このパラダイムの下では、拡散モデルが高周波情報を処理する方法において、既存の攻撃が固有の欠陥を見落としていることを実証的に見出す。
本稿では, プラグアンドプレイ方式の高周波フィルタモジュールを提案する。
論文 参考訳(メタデータ) (2025-05-27T09:50:11Z) - Membership Inference on Text-to-Image Diffusion Models via Conditional Likelihood Discrepancy [36.156856772794065]
テキスト・画像拡散モデルにおける条件付きオーバーフィッティング現象を提案する。
提案手法は, 各種データおよびデータセットのスケールにおいて, 従来手法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2024-05-23T17:09:51Z) - Model Will Tell: Training Membership Inference for Diffusion Models [15.16244745642374]
トレーニングメンバーシップ推論(TMI)タスクは、ターゲットモデルのトレーニングプロセスで特定のサンプルが使用されているかどうかを判断することを目的としている。
本稿では,拡散モデル内における本質的な生成先行情報を活用することで,TMIタスクの新たな視点を探求する。
論文 参考訳(メタデータ) (2024-03-13T12:52:37Z) - The Journey, Not the Destination: How Data Guides Diffusion Models [75.19694584942623]
大規模なデータセットでトレーニングされた拡散モデルは、顕著な品質と多様性のフォトリアリスティックなイメージを合成することができる。
i)拡散モデルの文脈でデータ属性の形式的概念を提供し、(ii)そのような属性を反実的に検証することを可能にする枠組みを提案する。
論文 参考訳(メタデータ) (2023-12-11T08:39:43Z) - Data Forensics in Diffusion Models: A Systematic Analysis of Membership
Privacy [62.16582309504159]
本研究では,拡散モデルに対するメンバシップ推論攻撃の系統的解析を開発し,各攻撃シナリオに適した新しい攻撃手法を提案する。
提案手法は容易に入手可能な量を利用して,現実的なシナリオにおいてほぼ完全な攻撃性能 (>0.9 AUCROC) を達成することができる。
論文 参考訳(メタデータ) (2023-02-15T17:37:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。