論文の概要: Sirens' Whisper: Inaudible Near-Ultrasonic Jailbreaks of Speech-Driven LLMs
- arxiv url: http://arxiv.org/abs/2603.13847v1
- Date: Sat, 14 Mar 2026 09:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.44225
- Title: Sirens' Whisper: Inaudible Near-Ultrasonic Jailbreaks of Speech-Driven LLMs
- Title(参考訳): Sirens' Whisper:音声駆動LDMの可聴的近超音波ジェイルブレイク
- Authors: Zijian Ling, Pingyi Hu, Xiuyong Gao, Xiaojing Ma, Man Zhou, Jun Feng, Songfeng Lu, Dongmei Zhang, Bin Benjamin Zhu,
- Abstract要約: 音声駆動型大規模言語モデル(LLM)は音声インタフェースを通じてアクセスされ、オープンアコースティックチャネルを介して新たなセキュリティリスクがもたらされる。
本稿では,Sirens' Whisperについて紹介する。
SWhisperは、任意のベースバンドオーディオを含む、長い、構造化されたプロンプトオン・コモディティデバイスを、頑丈で、不明瞭に配信することを可能にする。
- 参考スコア(独自算出の注目度): 38.35295248094619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Speech-driven large language models (LLMs) are increasingly accessed through speech interfaces, introducing new security risks via open acoustic channels. We present Sirens' Whisper (SWhisper), the first practical framework for covert prompt-based attacks against speech-driven LLMs under realistic black-box conditions using commodity hardware. SWhisper enables robust, inaudible delivery of arbitrary target baseband audio-including long and structured prompts-on commodity devices by encoding it into near-ultrasound waveforms that demodulate faithfully after acoustic transmission and microphone nonlinearity. This is achieved through a simple yet effective approach to modeling nonlinear channel characteristics across devices and environments, combined with lightweight channel-inversion pre-compensation. Building on this high-fidelity covert channel, we design a voice-aware jailbreak generation method that ensures intelligibility, brevity, and transferability under speech-driven interfaces. Experiments across both commercial and open-source speech-driven LLMs demonstrate strong black-box effectiveness. On commercial models, SWhisper achieves up to 0.94 non-refusal (NR) and 0.925 specific-convincing (SC). A controlled user study further shows that the injected jailbreak audio is perceptually indistinguishable from background-only playback for human listeners. Although jailbreaks serve as a case study, the underlying covert acoustic channel enables a broader class of high-fidelity prompt-injection and commandexecution attacks.
- Abstract(参考訳): 音声駆動型大規模言語モデル(LLM)は音声インタフェースを通じてアクセスされ、オープンアコースティックチャネルを介して新たなセキュリティリスクがもたらされる。
本稿では,コモディティハードウェアを用いた現実的なブラックボックス条件下での音声駆動LDMに対するプロンプトによる攻撃を隠蔽する最初の実践的フレームワークであるSirens' Whisper(SWhisper)を紹介する。
SWhisperは、音響伝達とマイクロフォン非線形性の後、忠実に復調するほぼ超音速波形に符号化することで、任意のベースバンドオーディオを含む、長い、構造化されたプロンプトオン・コモディティデバイスを頑丈に提供することができる。
これは、デバイスや環境間の非線形チャネル特性をモデル化するための、シンプルで効果的なアプローチと、軽量なチャネル反転事前補償を組み合わせることで実現される。
この高忠実度サーキットチャネルに基づいて、音声駆動インタフェース下での可知性、簡潔性、伝達性を保証するボイス・アウェア・ジェイルブレイク生成法を設計する。
商用およびオープンソースの音声駆動LLMの実験は、ブラックボックスの有効性を強く示している。
商用モデルでは、SWhisperは最大0.94非拒絶(NR)と0.925特定拘束(SC)を達成する。
制御されたユーザスタディにより、注入されたjailbreakオーディオは、人間のリスナーに対するバックグラウンドのみの再生と知覚的に区別できないことが示されている。
ジェイルブレイクはケーススタディとして機能するが、根底にある秘密の音響チャンネルは、より広いレベルの高忠実なインジェクションとコマンド実行攻撃を可能にする。
関連論文リスト
- Now You Hear Me: Audio Narrative Attacks Against Large Audio-Language Models [26.648297855855432]
我々は、許可されていない指示を物語スタイルのオーディオストリームに埋め込む、テキストからオーディオへのジェイルブレイクを設計する。
この攻撃は構造的および音響的特性を利用して、主にテキストに校正された安全機構を回避する。
結果は、言語的およびパラ言語的表現を共同で理由づける安全フレームワークの必要性を強調している。
論文 参考訳(メタデータ) (2026-01-30T18:23:02Z) - Stream-Voice-Anon: Enhancing Utility of Real-Time Speaker Anonymization via Neural Audio Codec and Language Models [51.7170633585748]
Stream-Voice-Anonは、ストリーミングスピーカーの匿名化に特化して、現代的なLMベースのNACアーキテクチャを適用している。
匿名化アプローチには、擬似話者表現サンプリング、話者埋め込みミキシング、多様なプロンプト選択戦略が組み込まれている。
VoicePrivacy 2024 Challengeプロトコルの下で、Stream-Voice-Anonは知性を大幅に改善した。
論文 参考訳(メタデータ) (2026-01-20T13:23:44Z) - Synthetic Voices, Real Threats: Evaluating Large Text-to-Speech Models in Generating Harmful Audio [63.18443674004945]
この研究は、TSシステムを利用して有害なコンテンツを含む音声を生成する、コンテンツ中心の脅威を探究する。
HARMGENは、これらの課題に対処する2つのファミリーにまとめられた5つの攻撃群である。
論文 参考訳(メタデータ) (2025-11-14T03:00:04Z) - WavInWav: Time-domain Speech Hiding via Invertible Neural Network [78.85443308774484]
従来の音声隠蔽法は、秘密の音声を復元する際に不満足な品質をもたらすことが多い。
フローベースの非可逆ニューラルネットワークを使用して、ステゴオーディオ、カバーオーディオ、シークレットオーディオの直接的なリンクを確立する。
また、隠れたデータを不正アクセスから保護するための暗号化技術も追加します。
論文 参考訳(メタデータ) (2025-10-03T11:36:16Z) - ENJ: Optimizing Noise with Genetic Algorithms to Jailbreak LSMs [61.09812971042288]
進化的騒音ジェイルブレイク(ENJ)
本稿では,環境騒音を受動的干渉から積極的に最適化可能な攻撃キャリアへ変換する遺伝的アルゴリズムを提案する。
複数の主流音声モデルに対する実験により、ENJの攻撃効果は既存のベースライン法よりもかなり優れていることが示された。
論文 参考訳(メタデータ) (2025-09-14T06:39:38Z) - Audio Jailbreak Attacks: Exposing Vulnerabilities in SpeechGPT in a White-Box Framework [6.002582335323663]
白箱シナリオにおけるMLLM(Multimodal Large Language Models)の音声入力を対象とする逆攻撃を提案する。
本稿では,新たなトークンレベルアタックを導入し,モデルの音声トークン化へのアクセスを活用して,逆トークン列を生成する。
当社のアプローチでは,複数の制限されたタスクに対して,最大99%の攻撃成功率を実現しています。
論文 参考訳(メタデータ) (2025-05-24T20:46:36Z) - Audio Jailbreak: An Open Comprehensive Benchmark for Jailbreaking Large Audio-Language Models [19.373533532464915]
LAMのjailbreak脆弱性を評価するために特別に設計された最初のベンチマークであるAJailBenchを紹介します。
このデータセットを使用して、いくつかの最先端のLAMを評価し、攻撃間で一貫性のある堅牢性を示すものはありません。
以上の結果から, セマンティックに保存された摂動でさえ, 先行するLAMの安全性を著しく低下させる可能性が示唆された。
論文 参考訳(メタデータ) (2025-05-21T11:47:47Z) - Multilingual and Multi-Accent Jailbreaking of Audio LLMs [19.5428160851918]
Multi-AudioJailは、マルチリンガルおよびマルチアクセントオーディオジェイルブレイクを利用する最初の体系的なフレームワークである。
音の摂動が言語間音声学とどのように相互作用し、ジェイルブレイクの成功率を急上昇させるかを示す。
クロスモーダル・ディフェンスの研究を促進するためにデータセットをリリースする予定です。
論文 参考訳(メタデータ) (2025-04-01T18:12:23Z) - "I am bad": Interpreting Stealthy, Universal and Robust Audio Jailbreaks in Audio-Language Models [0.9480364746270077]
本稿では,Audio-Language Models(ALMs)を対象とする音声ジェイルブレイクについて検討する。
我々は、プロンプト、タスク、さらにはベースオーディオサンプルをまたいで一般化する対向的摂動を構築する。
我々は、ALMがこれらの音声相手の例をどう解釈するかを分析し、知覚不能な一対一の有毒な音声を符号化する。
論文 参考訳(メタデータ) (2025-02-02T08:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。