論文の概要: Towards Effective Prompt Stealing Attack against Text-to-Image Diffusion Models
- arxiv url: http://arxiv.org/abs/2508.06837v1
- Date: Sat, 09 Aug 2025 05:38:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.574238
- Title: Towards Effective Prompt Stealing Attack against Text-to-Image Diffusion Models
- Title(参考訳): テキスト・画像拡散モデルに対する効果的なプロンプトステアリング攻撃に向けて
- Authors: Shiqian Zhao, Chong Wang, Yiming Li, Yihao Huang, Wenjie Qu, Siew-Kei Lam, Yi Xie, Kangjie Chen, Jie Zhang, Tianwei Zhang,
- Abstract要約: Prometheusは、トレーニングなし、プロキシ・イン・ザ・ループ、検索ベースのプロンプト・ステーリング攻撃である。
ローカルプロキシモデルと対話することで、ショーケースの貴重なプロンプトをリバースエンジニアリングする。
Prometheusは、PromptBaseやAIFrogのような人気のあるプラットフォームからプロンプトを抽出することに成功した。
- 参考スコア(独自算出の注目度): 31.159162126762975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-to-Image (T2I) models, represented by DALL$\cdot$E and Midjourney, have gained huge popularity for creating realistic images. The quality of these images relies on the carefully engineered prompts, which have become valuable intellectual property. While skilled prompters showcase their AI-generated art on markets to attract buyers, this business incidentally exposes them to \textit{prompt stealing attacks}. Existing state-of-the-art attack techniques reconstruct the prompts from a fixed set of modifiers (i.e., style descriptions) with model-specific training, which exhibit restricted adaptability and effectiveness to diverse showcases (i.e., target images) and diffusion models. To alleviate these limitations, we propose Prometheus, a training-free, proxy-in-the-loop, search-based prompt-stealing attack, which reverse-engineers the valuable prompts of the showcases by interacting with a local proxy model. It consists of three innovative designs. First, we introduce dynamic modifiers, as a supplement to static modifiers used in prior works. These dynamic modifiers provide more details specific to the showcases, and we exploit NLP analysis to generate them on the fly. Second, we design a contextual matching algorithm to sort both dynamic and static modifiers. This offline process helps reduce the search space of the subsequent step. Third, we interact with a local proxy model to invert the prompts with a greedy search algorithm. Based on the feedback guidance, we refine the prompt to achieve higher fidelity. The evaluation results show that Prometheus successfully extracts prompts from popular platforms like PromptBase and AIFrog against diverse victim models, including Midjourney, Leonardo.ai, and DALL$\cdot$E, with an ASR improvement of 25.0\%. We also validate that Prometheus is resistant to extensive potential defenses, further highlighting its severity in practice.
- Abstract(参考訳): DALL$\cdot$EとMidjourneyが代表するテキスト・ツー・イメージ(T2I)モデルは、リアルなイメージを作成することで大きな人気を集めている。
これらの画像の品質は、貴重な知的財産となる、慎重に設計されたプロンプトに依存している。
熟練したプロンプトは、購入者を惹きつけるために、自分のAI生成アートを市場で披露するが、このビジネスは偶然にも、それらを‘textit{prompt stealing attacks}’に公開する。
既存の最先端攻撃技術は、モデル固有の訓練で固定された修飾子(スタイル記述)からプロンプトを再構築し、様々なショーケース(ターゲット画像)や拡散モデルへの適応性と有効性を制限した。
これらの制限を緩和するために、プロメテウス(Prometheus)を提案する。プロメテウス(Prometheus)は、ローカルプロキシモデルと対話することで、ショーケースの貴重なプロンプトをリバースエンジニアリングする、トレーニングフリーで、プロキシ・イン・ザ・ループ、サーチベースのプロンプト・ステーリング攻撃である。
3つの革新的なデザインで構成されている。
まず,前処理で使用する静的修飾器の補足として動的修飾器を導入する。
これらの動的修飾器はショーケースに特有な詳細を提供し、我々はNLP解析を利用してその場で生成する。
第2に、動的および静的な修飾子をソートする文脈マッチングアルゴリズムを設計する。
このオフラインプロセスは、その後のステップの検索スペースを減らすのに役立つ。
第三に、我々は局所プロキシモデルと対話して、欲求探索アルゴリズムでプロンプトを反転させる。
フィードバックガイダンスに基づいて,高い忠実度を達成するためのプロンプトを改良する。
評価の結果,Prometheusは,Midjourney,Leonardo.ai,DALL$\cdot$Eなどのさまざまな犠牲者モデルに対して,PromptBaseやAIFrogなどの人気プラットフォームからプロンプトを抽出し,ASRの改善率を25.0\%とした。
また,プロメテウスは広範囲の防御に耐性があることを検証し,その重篤さをさらに強調した。
関連論文リスト
- RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning [88.14234949860105]
RePromptは、強化学習による迅速な強化プロセスに明示的な推論を導入する、新しいリプロンプトフレームワークである。
提案手法は,人手による注釈付きデータなしでエンドツーエンドのトレーニングを可能にする。
論文 参考訳(メタデータ) (2025-05-23T06:44:26Z) - HTS-Attack: Heuristic Token Search for Jailbreaking Text-to-Image Models [28.28898114141277]
テキスト・トゥ・イメージ(T2I)モデルは画像生成と編集において顕著な成功を収めた。
これらのモデルには、特に不適切な、あるいは安全でない(NSFW)コンテンツを生成する場合に、多くの潜在的な問題がある。
本稿では,トークン探索攻撃手法であるHTS-Attackを提案する。
論文 参考訳(メタデータ) (2024-08-25T17:33:40Z) - An Analysis of Recent Advances in Deepfake Image Detection in an Evolving Threat Landscape [11.45988746286973]
ディープフェイクまたは合成画像は、オンラインプラットフォームに深刻なリスクをもたらす。
われわれは8つの最先端の検出器を研究し、配備の準備が整っていないと論じている。
論文 参考訳(メタデータ) (2024-04-24T21:21:50Z) - Dynamic Prompt Optimizing for Text-to-Image Generation [63.775458908172176]
テキストから画像への生成モデルを改善するために,textbfPrompt textbfAuto-textbfEditing (PAE)法を導入する。
我々は、各単語の重みと射出時間ステップを探索するために、オンライン強化学習戦略を採用し、動的微調整プロンプトを導いた。
論文 参考訳(メタデータ) (2024-04-05T13:44:39Z) - Adversarial Prompt Tuning for Vision-Language Models [86.5543597406173]
AdvPT(Adversarial Prompt Tuning)は、視覚言語モデル(VLM)における画像エンコーダの対向ロバスト性を高める技術である。
我々は,AdvPTが白箱攻撃や黒箱攻撃に対する抵抗性を向上し,既存の画像処理による防御技術と組み合わせることで相乗効果を示すことを示した。
論文 参考訳(メタデータ) (2023-11-19T07:47:43Z) - Prompt Stealing Attacks Against Text-to-Image Generation Models [27.7826502104361]
専門のマーケットプレースで高品質なプロンプトを取引するトレンドが生まれている。
迅速な盗難攻撃が成功すると、プロンプトエンジニアの知的財産を直接侵害する。
本稿では,PmptStealer を用いた簡易かつ効果的なプロンプト盗難攻撃を提案する。
論文 参考訳(メタデータ) (2023-02-20T11:37:28Z) - Attend-and-Excite: Attention-Based Semantic Guidance for Text-to-Image
Diffusion Models [103.61066310897928]
最近のテキスト・ツー・イメージ生成モデルは、ターゲットのテキスト・プロンプトによって導かれる多様な創造的な画像を生成する非例外的な能力を実証している。
革命的ではあるが、現在の最先端拡散モデルは、与えられたテキストプロンプトのセマンティクスを完全に伝達するイメージの生成に失敗する可能性がある。
本研究では, 一般に公開されている安定拡散モデルを分析し, 破滅的無視の有無を評価し, そのモデルが入力プロンプトから1つ以上の被写体を生成するのに失敗した場合について検討する。
提案するジェネレーティブ・セマンティック・ナーシング(GSN)の概念は、推論時間中にハエの生殖過程に介入し、忠実性を改善するものである。
論文 参考訳(メタデータ) (2023-01-31T18:10:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。