論文の概要: Seed Hijacking of LLM Sampling and Quantum Random Number Defense
- arxiv url: http://arxiv.org/abs/2605.08313v1
- Date: Fri, 08 May 2026 14:17:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.558216
- Title: Seed Hijacking of LLM Sampling and Quantum Random Number Defense
- Title(参考訳): LLMサンプリングのシードハイジャックと量子ランダム数防御
- Authors: Ziyang You, Xiaoke Yang, Zhanling Fan, Feng Guo, Xiaogen Zhou, Xuxing Lu,
- Abstract要約: 大規模言語モデル (LLM) は自己回帰サンプリングのための決定論的擬似乱数生成器 (PRNG) に依存している。
SeedHijackは、PRNG出力を操作するバックドア攻撃で、攻撃者が指定したトークンの選択を強制する。
GPT-2 (124M) の 540-trial ベンチマークでは、9つのサンプリング構成で99.6%の正確なトークン注入を達成した。
- 参考スコア(独自算出の注目度): 3.278025942906412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) rely on deterministic pseudorandom number generators (PRNGs) for autoregressive sampling, creating a critical supply-chain attack surface overlooked by existing defenses. We present SeedHijack, a backdoor attack that manipulates PRNG outputs to force attacker-specified token selection without altering model logits. In a 540-trial benchmark on GPT-2 (124M), the attack achieves 99.6% exact token injection across 9 sampling configurations; it reaches 100% success on four aligned models (1.5B-7B, RLHF/SFT/reasoning distillation) and bypasses all alignment methods tested in this work. We further propose a defense based on a hardware quantum random number generator (QRNG), which neutralizes the attack in our evaluated threat model with negligible median overhead (+0.6% latency, +7.7 MB memory). Our work identifies a critical sampling-layer vulnerability and provides a practical, deployable QRNG-based defense.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自動回帰サンプリングのために決定論的擬似乱数生成器(PRNG)に依存しており、既存の防御によって見落とされた重要なサプライチェーン攻撃面を生成する。
SeedHijackは、PRNG出力を操作するバックドア攻撃で、モデルロジットを変更することなく攻撃者が指定したトークン選択を強制する。
GPT-2 (124M) の540回のベンチマークでは、9つのサンプリング構成で99.6%の正確なトークン注入が達成され、4つのアライメントモデル(1.5B-7B、RLHF/SFT/焼成蒸留)で100%成功し、この研究でテストされた全てのアライメントメソッドをバイパスした。
さらに、ハードウェア量子乱数生成器(QRNG)に基づく防御手法を提案する。これは、評価された脅威モデルの攻撃を無視可能な中央値オーバーヘッド(+0.6%レイテンシ、+7.7MBメモリ)で中和する。
我々の研究は、重要なサンプリング層脆弱性を特定し、実践的でデプロイ可能なQRNGベースの防御を提供する。
関連論文リスト
- Stealthy Backdoor Attack via Confidence-driven Sampling [49.72680157684523]
バックドア攻撃は、悪質なトリガをDNNモデルに過剰に挿入することを目的としており、テストシナリオ中に不正な制御を許可している。
既存の方法では防衛戦略に対する堅牢性が欠如しており、主に無作為な試薬を無作為に選別しながら、引き金の盗難を強化することに重点を置いている。
信頼性スコアの低いサンプルを選別し、これらの攻撃を識別・対処する上で、守備側の課題を著しく増大させる。
論文 参考訳(メタデータ) (2023-10-08T18:57:36Z) - Machine Learning needs Better Randomness Standards: Randomised Smoothing
and PRNG-based attacks [14.496582479888765]
攻撃者が一般的に依存するランダム性のみを用いて、機械学習システムに侵入できるかどうかを検討する。
我々は、攻撃者が供給されたランダム性をバックドアして、最大81回まで過大評価または過小評価のロバスト性を証明する、全く新しい攻撃を実演する。
我々は、安全クリティカルでセキュリティクリティカルな機械学習アプリケーションにもっと適するように、乱数テストに関するNISTガイドラインの更新を推奨する。
論文 参考訳(メタデータ) (2023-06-24T19:50:08Z) - MultiRobustBench: Benchmarking Robustness Against Multiple Attacks [86.70417016955459]
機械学習(ML)モデルに対するマルチアタックを検討するための,最初の統一フレームワークを提案する。
我々のフレームワークは、テストタイムの敵について異なるレベルの学習者の知識をモデル化することができる。
9種類の攻撃に対して16種類の防御モデルの有効性を評価した。
論文 参考訳(メタデータ) (2023-02-21T20:26:39Z) - Source-independent quantum random number generator against tailored
detector blinding attacks [6.86599501487994]
本稿では,原因の脆弱性に対処する量子乱数生成プロトコルを提案する。
本研究では, パルスあたり0.1ビットの生成速度で2次元計測を行うために, ランダム数を生成するプロトコルの有効性を実験的に実証した。
論文 参考訳(メタデータ) (2022-04-26T08:47:37Z) - Defence against adversarial attacks using classical and quantum-enhanced
Boltzmann machines [64.62510681492994]
生成モデルはデータセットの基盤となる分布を学習し、それらは本質的に小さな摂動に対してより堅牢である。
MNISTデータセット上のBoltzmannマシンによる攻撃に対して、5%から72%の改良が見られる。
論文 参考訳(メタデータ) (2020-12-21T19:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。