論文の概要: Reliable Audio Deepfake Detection in Variable Conditions via Quantum-Kernel SVMs
- arxiv url: http://arxiv.org/abs/2512.18797v1
- Date: Sun, 21 Dec 2025 16:31:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.509105
- Title: Reliable Audio Deepfake Detection in Variable Conditions via Quantum-Kernel SVMs
- Title(参考訳): 量子カーネルSVMによる可変条件における信頼性の高いディープフェイク検出
- Authors: Lisan Al Amin, Vandana P. Janeja,
- Abstract要約: 音響ディープフェイク検出において量子カーネルを用いることで,モデルサイズを増大させることなく偽陽性率を低減できることを示す。
量子カーネルSVMと従来のSVMを同一のメル-スペクトログラム前処理を用いて比較する。
QSVMは、ASVspoof 5(2024年)で0.183対0.299、ADD23で0.081対0.188、ASVspoof 2019で0.346対0.399、In-the-Wildで0.355対0.413である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Detecting synthetic speech is challenging when labeled data are scarce and recording conditions vary. Existing end-to-end deep models often overfit or fail to generalize, and while kernel methods can remain competitive, their performance heavily depends on the chosen kernel. Here, we show that using a quantum kernel in audio deepfake detection reduces falsepositive rates without increasing model size. Quantum feature maps embed data into high-dimensional Hilbert spaces, enabling the use of expressive similarity measures and compact classifiers. Building on this motivation, we compare quantum-kernel SVMs (QSVMs) with classical SVMs using identical mel-spectrogram preprocessing and stratified 5-fold cross-validation across four corpora (ASVspoof 2019 LA, ASVspoof 5 (2024), ADD23, and an In-the-Wild set). QSVMs achieve consistently lower equalerror rates (EER): 0.183 vs. 0.299 on ASVspoof 5 (2024), 0.081 vs. 0.188 on ADD23, 0.346 vs. 0.399 on ASVspoof 2019, and 0.355 vs. 0.413 In-the-Wild. At the EER operating point (where FPR equals FNR), these correspond to absolute false-positiverate reductions of 0.116 (38.8%), 0.107 (56.9%), 0.053 (13.3%), and 0.058 (14.0%), respectively. We also report how consistent the results are across cross-validation folds and margin-based measures of class separation, using identical settings for both models. The only modification is the kernel; the features and SVM remain unchanged, no additional trainable parameters are introduced, and the quantum kernel is computed on a conventional computer.
- Abstract(参考訳): ラベル付きデータが不足し、記録条件が異なる場合、合成音声の検出は困難である。
既存のエンドツーエンドのディープモデルは、しばしば過度に適合するか、あるいは一般化に失敗し、カーネルメソッドは競争力を維持することができるが、その性能は選択されたカーネルに大きく依存する。
ここでは,音響ディープフェイク検出における量子カーネルの使用により,モデルサイズを増大させることなく,偽陽性率を低減できることを示す。
量子特徴写像はデータを高次元ヒルベルト空間に埋め込み、表現的類似度測度とコンパクトな分類器の使用を可能にする。
このモチベーションに基づいて、量子カーネルSVM(QSVM)を、4つのコーパス(ASVspoof 2019 LA, ASVspoof 5 (2024), ADD23, In-the-Wild set)をまたいで、同一のメル-スペクトログラム前処理と成層5倍のクロスバリデーションを用いて古典的なSVMと比較する。
QSVMは、ASVspoof 5(2024年)で0.183対0.299、ADD23で0.081対0.188、ASVspoof 2019で0.346対0.399、In-the-Wildで0.355対0.413である。
EER操作点(FPRがFNRに等しい)では、それぞれ0.116(38.8%)、0.107(56.9%)、0.053(13.3%)、0.058(14.0%)の絶対偽陽性還元に対応する。
また、両モデルの同一設定を用いて、クロスバリデーション・フォールドとマージンに基づくクラス分離の測定値の整合性についても報告する。
唯一の修正はカーネルであり、機能とSVMは変わらず、追加のトレーニング可能なパラメータは導入されず、量子カーネルは従来のコンピュータで計算される。
関連論文リスト
- Contrastive Deep Learning for Variant Detection in Wastewater Genomic Sequencing [0.0]
本稿では,Vector-Quantized Variational Autoencoders (VQ-VAE) を用いた非教師付きウイルス変異検出のための包括的フレームワークを提案する。
VQ-VAEは、参照ゲノムや変異ラベルを必要とせずに、k-merトークン化配列からゲノムパターンの離散コードブックを学習する。
我々のフレームワークは、ゲノム監視のスケーラブルで解釈可能なアプローチと、公衆衛生モニタリングへの直接的な応用を提供する。
論文 参考訳(メタデータ) (2025-12-02T19:04:05Z) - Ensemble Threshold Calibration for Stable Sensitivity Control [0.0]
本稿では,数千万組の幾何対もの幾何に対して,過度に分散した正確なリコールを実現するエンド・ツー・エンドのフレームワークを提案する。
我々のアプローチは、小さなエラーで常にリコールターゲットにヒットし、他のキャリブレーションと比較して冗長な検証を減らし、単一のTPU v3コア上でエンドツーエンドで実行します。
論文 参考訳(メタデータ) (2025-10-02T15:22:28Z) - ATTS: Asynchronous Test-Time Scaling via Conformal Prediction [112.54016379556073]
大規模な言語モデル(LLM)は、テスト時のスケーリングの恩恵を受けるが、しばしば高い推論遅延によって妨げられる。
統計的に保証された適応スケーリングフレームワークであるATTS(Asynchronous Test-Time Scaling)を紹介する。
ATTSは、テストタイムのスケーリングにおいて最大56.7倍のスピードアップと4.14倍のスループット向上を実現している。
論文 参考訳(メタデータ) (2025-09-18T16:55:09Z) - vCache: Verified Semantic Prompt Caching [95.16654660556975]
本稿では,ユーザ定義エラー率保証を備えた最初の検証済みセマンティックキャッシュであるvCacheを提案する。
オンライン学習アルゴリズムを使用して、キャッシュされたプロンプト毎に最適な閾値を推定し、追加のトレーニングなしで信頼性の高いキャッシュ応答を可能にする。
我々の実験によると、vCacheは特定のエラー境界を一貫して満たし、最先端の静的な閾値と微調整された埋め込みベースラインより優れています。
論文 参考訳(メタデータ) (2025-02-06T04:16:20Z) - Learning Equivariant Non-Local Electron Density Functionals [51.721844709174206]
等変グラフニューラルネットワーク(GNN)に基づく新しい非局所XC関数であるEquivariant Graph Exchange correlation (EG-XC)を導入する。
この点の雲に同変GNNを適用することにより、スケーラブルで正確な分子レンジ相互作用をキャプチャする。
EG-XCは、QM9上のデータ効率と分子サイズの外挿に優れ、5倍以上の分子で訓練された整合力場である。
論文 参考訳(メタデータ) (2024-10-10T14:31:45Z) - PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [6.2921559513184695]
本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文 参考訳(メタデータ) (2024-05-20T17:06:24Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Primal Estimated Subgradient Solver for SVM for Imbalanced
Classification [0.0]
我々は,PEGASOS SVMが8.6:1から130:1までのマイノリティ比に大きく依存する不均衡データセットに対して,優れた性能を達成できることを実証することを目的とする。
学習曲線を調べて評価する。
PEGASOS Cost-Sensitive SVM's results of Ding's LINEAR SVM DECIDL method。
論文 参考訳(メタデータ) (2022-06-19T02:33:14Z) - Q-ASR: Integer-only Zero-shot Quantization for Efficient Speech
Recognition [65.7040645560855]
ASRモデルに対する整数のみのゼロショット量子化スキームであるQ-ASRを提案する。
全精度ベースラインモデルと比較すると,wrの変化は無視できる。
Q-ASRは、WER劣化が少ない4倍以上の圧縮率を示します。
論文 参考訳(メタデータ) (2021-03-31T06:05:40Z) - MSED: a multi-modal sleep event detection model for clinical sleep
analysis [62.997667081978825]
ポリソムノグラムで睡眠イベントを共同検出する,単一のディープニューラルネットワークアーキテクチャを設計した。
モデルの性能は,F1,精度,リコールスコア,および指標値と臨床値との相関で定量化した。
論文 参考訳(メタデータ) (2021-01-07T13:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。