論文の概要: FoeGlass: Simple In-Context Learning Is Enough for Red Teaming Audio Deepfake Detectors
- arxiv url: http://arxiv.org/abs/2606.05101v1
- Date: Wed, 03 Jun 2026 17:04:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.910713
- Title: FoeGlass: Simple In-Context Learning Is Enough for Red Teaming Audio Deepfake Detectors
- Title(参考訳): FoeGlass:オーディオ・ディープフェイク・ディテクターと組むためのシンプルなインコンテキスト・ラーニング
- Authors: Sepehr Dehdashtian, Jacob H Seidman, Vishnu N Boddeti, Gaurav Bharaj,
- Abstract要約: 音声のディープフェイク検出モデルは、テキスト音声(TTS)モデルの悪意ある使用に対処するために重要である。
ADDのための最初のブラックボックス自動リピート方式であるFoeGlassを提案する。
また,FoeGlassは,非条件サンプリングベースラインと最近のスプーフィングデータセットの偽陰性率を最大94%向上させることを示した。
- 参考スコア(独自算出の注目度): 16.862375555609663
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Audio deepfake detection (ADD) models are critical for countering the malicious use of text-to-speech (TTS) models. Evaluating and strengthening ADD models requires developing datasets that span the space of generated audio and highlight high-error regions. Existing dataset development strategies face two challenges: (i) manual collection, and (ii) inefficient discovery of blind spots in the ADD models. To address these challenges, we propose FoeGlass, the first black-box automated red-teaming method for ADDs, which effectively discovers ADD failure modes in the space of generated audio underexplored by state-of-the-art deepfake benchmarks. FoeGlass uses the in-context learning capabilities of an LLM to explore the input space of a TTS model, generating audio samples that fool the target ADD using only black-box access to all components. By using a carefully designed context based on diversity measurements, FoeGlass mitigates the common problem of mode collapse in automated red-teaming systems. Empirical evaluations on several open-source ADD and TTS models demonstrate that data generated from FoeGlass substantially improves the false negative rates over unconditional sampling baselines and recent spoofing datasets by up to 94%, while requiring no manual supervision. Furthermore, we show that the attacks generated by FoeGlass are transferable across different target ADDs, demonstrating its broad applicability and ease of use for the automated red teaming of ADD systems. Finally, fine-tuning ADD models on FoeGlass-generated samples notably enhances the robustness of the detectors (up 41%).
- Abstract(参考訳): 音声ディープフェイク検出(ADD)モデルは、テキスト音声(TTS)モデルの悪意ある使用に対抗するために重要である。
ADDモデルの評価と強化には、生成されたオーディオの空間にまたがるデータセットの開発と、ハイエラー領域の強調が必要である。
既存のデータセット開発戦略には2つの課題がある。
(i)手作業による収集、及び
(II)ADDモデルにおける盲点の非効率な発見。
これらの課題に対処するために、我々は、最先端のディープフェイクベンチマークによって探索された生成されたオーディオ空間におけるADD障害モードを効果的に発見する、最初のブラックボックス自動赤チーム方式であるFoeGlassを提案する。
FoeGlass は LLM のコンテキスト内学習機能を使用して TTS モデルの入力空間を探索し、すべてのコンポーネントへのブラックボックスアクセスのみを使用してターゲット ADD を騙したオーディオサンプルを生成する。
多様性測定に基づいて慎重に設計されたコンテキストを用いることで、自動化されたレッドチームシステムにおけるモード崩壊の一般的な問題を緩和する。
いくつかのオープンソースADDおよびTSモデルに対する実証的な評価では、FoeGlassから生成されたデータは、非条件サンプリングベースラインと最近のスプーフィングデータセットに対する偽陰性率を大幅に改善し、手動による監督を必要とせず、最大94%向上している。
さらに、FoeGlassが生成した攻撃は、異なるターゲットADD間で転送可能であることを示し、ADDシステムの自動レッドチーム化の幅広い適用性と使いやすさを示す。
最後に、FoeGlass生成サンプルの微調整ADDモデルでは、検出器の堅牢性(41%)が顕著に向上している。
関連論文リスト
- AFSS: Artifact-Focused Self-Synthesis for Mitigating Bias in Audio Deepfake Detection [1.1091582432763736]
Artifact-Focused Self-Synthesis (AFSS) は、実際のオーディオから擬似フェイクサンプルを生成するために設計された手法である。
AFSSは同一話者制約を強制し、実と擬似フェイクサンプルが同一話者アイデンティティとセマンティックコンテンツを共有することを保証する。
AFSSの最先端性能は平均5.45%で、WaveFakeでは1.23%、In-the-Wildでは2.70%と大幅に低下した。
論文 参考訳(メタデータ) (2026-03-27T13:36:11Z) - DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - Zero-Shot Image Anomaly Detection Using Generative Foundation Models [2.241618130319058]
本研究は,意味的異常検出のための基礎的ツールとしてスコアベース生成モデルの利用について検討する。
スタインスコアの誤差を解析することにより,各ターゲットデータセットの再学習を必要とせず,異常サンプルを識別する新しい手法を提案する。
このアプローチは最先端よりも改善され、ひとつのデータセット — CelebA -- 上で単一のモデルをトレーニングすることに依存しています。
論文 参考訳(メタデータ) (2025-07-30T13:56:36Z) - Noisy Test-Time Adaptation in Vision-Language Models [73.14136220844156]
テスト時間適応(TTA)は、テスト中のターゲットデータのみに依存することにより、ソースデータとターゲットデータの分散シフトに対処することを目的としている。
本稿では、ゼロショット方式で、テスト時にノイズのあるサンプルをターゲットとするデータにモデルを適応させることに焦点を当てたゼロショットノイズTTA(ZS-NTTA)を提案する。
本稿では, 冷凍機の出力を擬似ラベルとして利用し, ノイズ検出器の訓練を行う適応ノイズ検出器(AdaND)を提案する。
論文 参考訳(メタデータ) (2025-02-20T14:37:53Z) - Cross-Domain Audio Deepfake Detection: Dataset and Analysis [11.985093463886056]
オーディオディープフェイク検出(ADD)は、個人の権利やプライバシーを侵害する合成音声の誤用を防ぐために不可欠である。
最近のゼロショット音声合成(TTS)モデルでは、単一の発話で音声をクローンできるため、高いリスクが生じる。
我々は、5つの高度なゼロショットTSモデルによって生成される300時間以上の音声データからなる新しいクロスドメインADDデータセットを構築した。
論文 参考訳(メタデータ) (2024-04-07T10:10:15Z) - Run-time Introspection of 2D Object Detection in Automated Driving
Systems Using Learning Representations [13.529124221397822]
ディープニューラルネットワーク(DNN)に基づく2次元物体検出のための新しいイントロスペクションソリューションを提案する。
KITTIとBDDのデータセットで評価された1段階および2段階のオブジェクト検出器を用いて,2次元オブジェクト検出におけるエラー検出のためのSOTAイントロスペクション機構を実装した。
性能評価の結果,提案手法はSOTA法より優れており,BDDデータセットのエラー率を9%から17%まで絶対的に削減できることがわかった。
論文 参考訳(メタデータ) (2024-03-02T10:56:14Z) - Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。
本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。
本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-01-16T02:14:33Z) - Calibrate and Refine! A Novel and Agile Framework for ASR-error Robust
Intent Detection [8.842878491315124]
本稿では,2つのプラグ・アンド・プレイモジュールを用いたASRエラー頑健な意図検出のためのCR-IDという新しいフレームワークを提案する。
SNIPSデータセットによる実験結果から,提案するCR-IDフレームワークが競合性能を実現することを示す。
論文 参考訳(メタデータ) (2022-05-23T02:54:11Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。