論文の概要: DiffusionHijack: Supply-Chain PRNG Backdoor Attack on Diffusion Models and Quantum Random Number Defense
- arxiv url: http://arxiv.org/abs/2605.13115v1
- Date: Wed, 13 May 2026 07:34:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.876624
- Title: DiffusionHijack: Supply-Chain PRNG Backdoor Attack on Diffusion Models and Quantum Random Number Defense
- Title(参考訳): DiffusionHijack: 拡散モデルと量子ランダム数防衛におけるサプライチェーンPRNGバックドア攻撃
- Authors: Ziyang You, Liling Zheng, Xiaoke Yang, Xuxing Lu,
- Abstract要約: 拡散モデルは遅延雑音サンプリングのための擬似ランダム数生成器(PRNG)に依存する。
DiffusionHijackは、PRNGをハイジャックして生成した画像を決定論的に制御するサプライチェーンバックドアアタックである。
- 参考スコア(独自算出の注目度): 0.6455316503462029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models depend on pseudo-random number generators (PRNGs) for latent noise sampling. We present DiffusionHijack, a supply-chain backdoor attack that hijacks the PRNG to deterministically control generated images. A malicious PRNG, injected via compromised packages, forces pixel-perfect reproduction of attacker-chosen content (SSIM = 1.00, N = 100 trials) on Stable Diffusion v1.4, v1.5, and SDXL -- without modifying model weights. The attack is inherently undetectable by existing model auditing and content moderation mechanisms, as it operates entirely outside the neural network computation graph. The attack remains effective under stochastic sampling (eta > 0), bypasses CLIP-based safety checkers (98-100% success), and operates independently of the user's prompt. As a countermeasure, we replace the PRNG with a quantum random number generator (QRNG), which provides information-theoretic unpredictability. Across N = 100 prompt-model combinations, QRNG defense completely neutralizes the attack, reducing output similarity to random baseline levels (SSIM < 0.20 for SD 1.x models, < 0.45 for SDXL). This work exposes a previously overlooked supply-chain vulnerability and offers a hardware-level fundamental mitigation for generative AI systems.
- Abstract(参考訳): 拡散モデルは遅延雑音サンプリングのための擬似ランダム数生成器(PRNG)に依存する。
DiffusionHijackは、PRNGをハイジャックして生成した画像を決定論的に制御するサプライチェーンバックドアアタックである。
悪質なPRNGは、妥協されたパッケージを通じて注入され、モデル重みを変更することなく、安定拡散v1.4、v1.5、SDXLの攻撃的コンテンツ(SSIM = 1.00、N = 100トライアル)のピクセル完全再現を強制する。
この攻撃は、ニューラルネットワーク計算グラフの外部で完全に動作するため、既存のモデル監査とコンテンツモデレーションメカニズムによって本質的に検出不可能である。
この攻撃は、確率的サンプリング(eta > 0)の下で有効であり、CLIPベースの安全チェッカー(98-100%の成功)をバイパスし、ユーザのプロンプトとは独立して動作する。
対策として、PRNGをQRNG(quantum random number generator)に置き換え、情報理論の予測不可能性を提供する。
N = 100のプロンプトモデルの組み合わせでQRNGディフェンスは攻撃を完全に中和し、ランダムなベースラインレベル(SD 1.xモデルのSSIM < 0.20、SDXLのSSIM < 0.45)との出力類似性を減少させる。
この作業は、これまで見過ごされていたサプライチェーンの脆弱性を明らかにし、生成AIシステムに対するハードウェアレベルの基本的な緩和を提供する。
関連論文リスト
- Seed Hijacking of LLM Sampling and Quantum Random Number Defense [3.278025942906412]
大規模言語モデル (LLM) は自己回帰サンプリングのための決定論的擬似乱数生成器 (PRNG) に依存している。
SeedHijackは、PRNG出力を操作するバックドア攻撃で、攻撃者が指定したトークンの選択を強制する。
GPT-2 (124M) の 540-trial ベンチマークでは、9つのサンプリング構成で99.6%の正確なトークン注入を達成した。
論文 参考訳(メタデータ) (2026-05-08T14:17:06Z) - Semi-Device-Independent Quantum Random Number Generator Resistant to General Attacks [6.918556765582295]
量子乱数生成器(QRNG)は、量子理論固有のランダム性に基づいて真の乱数を生成する。
本稿では,有限サイズ効果を考慮した半DIQRNGを提案する。
私たちの研究は、単純な実験的なセットアップで堅牢なセキュリティとハイジェネレーションの両方を達成するための有望なアプローチを提供します。
論文 参考訳(メタデータ) (2026-02-06T03:47:12Z) - Large Language Models Are Bad Dice Players: LLMs Struggle to Generate Random Numbers from Statistical Distributions [50.1404916337174]
大規模言語モデル(LLM)における母国語の確率的サンプリングの大規模,統計的に活用された最初の監査について述べる。
バッチ生成は, ほぼ完全に崩壊する一方, 中央値のパスレートが13%であり, 統計的妥当性はわずかであることがわかった。
現在のLCMには機能的な内部サンプルが欠如しており、統計的保証を必要とするアプリケーションに外部ツールを使う必要があると結論付けている。
論文 参考訳(メタデータ) (2026-01-08T22:33:12Z) - AI-Hybrid TRNG: Kernel-Based Deep Learning for Near-Uniform Entropy Harvesting from Physical Noise [0.0]
AI-Hybrid TRNGは、物理ノイズから直接、ほぼ一様エントロピーを抽出するディープラーニングフレームワークである。
トレーニングには、低コストで親指サイズのRFフロントエンドとCPUを最適化するジッタを使用し、量子化ステップなしで32ビットの高エントロピーストリームを出力する。
論文 参考訳(メタデータ) (2025-06-30T18:01:40Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - Breaking Free: How to Hack Safety Guardrails in Black-Box Diffusion Models! [52.0855711767075]
EvoSeedは、フォトリアリスティックな自然対向サンプルを生成するための進化戦略に基づくアルゴリズムフレームワークである。
我々は,CMA-ESを用いて初期種ベクトルの探索を最適化し,条件付き拡散モデルで処理すると,自然逆数サンプルをモデルで誤分類する。
実験の結果, 生成した対向画像は画像品質が高く, 安全分類器を通過させることで有害なコンテンツを生成する懸念が高まっていることがわかった。
論文 参考訳(メタデータ) (2024-02-07T09:39:29Z) - Machine Learning needs Better Randomness Standards: Randomised Smoothing
and PRNG-based attacks [14.496582479888765]
攻撃者が一般的に依存するランダム性のみを用いて、機械学習システムに侵入できるかどうかを検討する。
我々は、攻撃者が供給されたランダム性をバックドアして、最大81回まで過大評価または過小評価のロバスト性を証明する、全く新しい攻撃を実演する。
我々は、安全クリティカルでセキュリティクリティカルな機械学習アプリケーションにもっと適するように、乱数テストに関するNISTガイドラインの更新を推奨する。
論文 参考訳(メタデータ) (2023-06-24T19:50:08Z) - Testing randomness of series generated in Bell's experiment [62.997667081978825]
おもちゃの光ファイバーをベースとしたセットアップを用いてバイナリシリーズを生成し、そのランダム度をVilleの原理に従って評価する。
標準統計指標の電池、ハースト、コルモゴロフ複雑性、最小エントロピー、埋め込みのTakensarity次元、および拡張ディッキー・フラーとクワイアトコフスキー・フィリップス・シュミット・シン(英語版)でテストされ、ステーション指数をチェックする。
Toeplitz 抽出器を不規則級数に適用することにより得られる系列のランダム性のレベルは、非還元原料のレベルと区別できない。
論文 参考訳(メタデータ) (2022-08-31T17:39:29Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z) - Defence against adversarial attacks using classical and quantum-enhanced
Boltzmann machines [64.62510681492994]
生成モデルはデータセットの基盤となる分布を学習し、それらは本質的に小さな摂動に対してより堅牢である。
MNISTデータセット上のBoltzmannマシンによる攻撃に対して、5%から72%の改良が見られる。
論文 参考訳(メタデータ) (2020-12-21T19:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。