論文の概要: Mental Damage: Caption Poisoning Attacks on Retrieval-Augmented Text-to-Music Generation
- arxiv url: http://arxiv.org/abs/2605.30365v1
- Date: Mon, 18 May 2026 02:11:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-07 20:42:22.499136
- Title: Mental Damage: Caption Poisoning Attacks on Retrieval-Augmented Text-to-Music Generation
- Title(参考訳): 精神障害: 検索強化テキスト・ツー・ミュージック・ジェネレーションに対する監禁的攻撃
- Authors: Yizhu Wen, Shuhao Zhang, Nan Zhang, Long Cheng, Hanqing Guo,
- Abstract要約: Retrieval-augmented text-to-music (TTM)システムでは、音楽キャプションデータセットから検索したキャプションを使用して、不特定ユーザプロンプトを増大させる。
攻撃者は少数の曲のキャプションを注入することでデータベースを悪用できることを示す。
そこで本研究では,音楽キャプション中毒攻撃を実現するために,二重層キャプション中毒対策を提案する。
- 参考スコア(独自算出の注目度): 10.724986873079827
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-augmented text-to-music (TTM) systems augment underspecified user prompts using captions retrieved from a music caption dataset. This design introduces an integrity dependency on the music knowledge database. We show that an attacker can poison the database by injecting a small number of crafted music captions, causing the system to retrieve malicious captions that bias prompt augmentation and steer generation away from the user's intended function, without modifying the user prompt, retriever, or generator. To achieve the music caption poisoning attack, we propose a dual-layer caption poisoning strategy that preserves high-level retrieval anchors while injecting low-level acoustic descriptors to steer prompt augmentation and downstream music generation toward an attacker-chosen target intent. In a MusicCaps knowledge database, CLAP retriever, and MusicGen pipeline, poisoned generations move substantially closer to the attacker's target, while remaining comparably aligned with the original user query. These results expose a practical integrity risk for retrieval-augmented creative AI systems. Our demo can be found at: https://yizhu-wen.github.io/Mental-Damage/
- Abstract(参考訳): Retrieval-augmented text-to-music (TTM)システムでは、音楽キャプションデータセットから検索したキャプションを使用して、不特定ユーザプロンプトを増大させる。
この設計は音楽知識データベースに完全性をもたらす。
攻撃者は少数の曲のキャプションを注入することでデータベースを汚染し,ユーザの意図した機能からバイアスを発生させる悪意のあるキャプションを,ユーザのプロンプトやレシーバ,ジェネレータを変更することなく検索することができることを示す。
そこで本研究では,低レベルの音響ディスクリプタを注入し,アタッカー・チョーゼンの目的に対して,アタッカー・チョーゼンの意図に対して,アタッカー・アタッカー・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタックを実現する。
MusicCapsのナレッジデータベース、CLAPレトリバー、MusicGenパイプラインでは、有毒な世代が攻撃者のターゲットにかなり近づきながら、元のユーザクエリと互換性を持ち続ける。
これらの結果は、検索強化されたクリエイティブAIシステムに対して、現実的な完全性リスクを露呈する。
私たちのデモは、https://yizhu-wen.github.io/Mental-Damage/で見ることができます。
関連論文リスト
- Bob's Confetti: Phonetic Memorization Attacks in Music and Video Generation [47.04195212078377]
音楽やビデオのジェネレーティブAIシステムは、著作権のある素材の再生を防ぐためにテキストベースのフィルタを使うことが多い。
本稿では,音声の暗記を利用してこれらの安全を回避できる新たな攻撃であるAdversarial PhoneTic Prompting(APT)を紹介する。
我々は,SUNOやYUEのようなL2S(Lyrics-to-Song)をリードするモデルが,原曲の原曲に顕著なメロディ的・リズミカルな類似性で再生できることを実証した。
論文 参考訳(メタデータ) (2025-07-23T21:11:47Z) - LLM Hypnosis: Exploiting User Feedback for Unauthorized Knowledge Injection to All Users [50.18141341939909]
ユーザフィードバックで訓練された言語モデルにおける脆弱性について説明する。
単一ユーザは、LMの知識と振る舞いを永続的に変更することができる。
この攻撃は、モデルがこれまで持っていなかった事実的知識を挿入するのに有効であることを示す。
論文 参考訳(メタデータ) (2025-07-03T17:55:40Z) - Double Entendre: Robust Audio-Based AI-Generated Lyrics Detection via Multi-View Fusion [11.060929679400667]
本稿では,音声中の歌詞関連情報を自動書き起こした歌詞と音声特徴を組み合わせ,マルチモーダルでモジュール形式のレイトフュージョンパイプラインを提案する。
我々のD-detect法は、既存の歌詞ベースの検出器より優れ、音声の摂動にも頑健である。
論文 参考訳(メタデータ) (2025-06-19T02:56:49Z) - Backdoor Attacks on Dense Retrieval via Public and Unintentional Triggers [46.19574403393449]
本稿では,攻撃者が検索システムを誤認して攻撃者の特定内容を検索する新たな攻撃シナリオについて検討する。
これらのコンテンツは、攻撃者によって検索コーパスに注入され、ヘイトスピーチやスパムのような有害なテキストを含むことができる。
モデル重みに頼り、顕著で不自然な出力を生成する従来の手法とは異なり、文法エラーによって引き起こされる隠れたバックドア攻撃を提案する。
論文 参考訳(メタデータ) (2024-02-21T05:03:07Z) - PoisonedRAG: Knowledge Corruption Attacks to Retrieval-Augmented Generation of Large Language Models [45.409248316497674]
大規模言語モデル(LLM)は、その例外的な生成能力により、顕著な成功を収めた。
Retrieval-Augmented Generation (RAG)は、これらの制限を緩和するための最先端技術である。
RAGシステムにおける知識データベースは,新たな,実用的な攻撃面を導入している。
この攻撃面に基づいて,RAGに対する最初の知識汚職攻撃であるPoisonedRAGを提案する。
論文 参考訳(メタデータ) (2024-02-12T18:28:36Z) - Melody-Conditioned Lyrics Generation with SeqGANs [81.2302502902865]
本稿では,SeqGAN(Sequence Generative Adversarial Networks)に基づく,エンドツーエンドのメロディ条件付き歌詞生成システムを提案する。
入力条件が評価指標に悪影響を及ぼすことなく,ネットワークがより有意義な結果が得られることを示す。
論文 参考訳(メタデータ) (2020-10-28T02:35:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。