論文の概要: Quantum Kernels for Audio Deepfake Detection Using Spectrogram Patch Features
- arxiv url: http://arxiv.org/abs/2605.06035v1
- Date: Thu, 07 May 2026 11:26:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.722011
- Title: Quantum Kernels for Audio Deepfake Detection Using Spectrogram Patch Features
- Title(参考訳): スペクトログラムパッチ特徴を用いたオーディオディープフェイク検出のための量子カーネル
- Authors: Lisan Al Amin, Rakib Hossain, Mahbubul Islam, Faisal Quader, Thanh Thi Nguyen,
- Abstract要約: メルスペクトルから量子状態への局所的な時間周波数パッチを符号化する,音声に合わせた量子機能マップQ-Patchを提案する。
制御されたバランスの取れたプロトコルを用いて、音声スプーフィング検出タスクにおけるQ-Patchを評価し、サイズマッチングされた古典的ベースラインと比較する。
- 参考スコア(独自算出の注目度): 3.095164402583178
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Quantum machine learning has emerged as a promising tool for pattern recognition, yet many audio-focused approaches still treat spectrograms as generic images and do not explicitly exploit their time-frequency structure. We propose Q-Patch, a quantum feature map tailored to audio that encodes local time-frequency patches from mel-spectrograms into quantum states using shallow, hardware-efficient circuits with adjacency-aware entanglement. Each selected patch is summarized by a compact four-dimensional acoustic descriptor and mapped to a four-qubit circuit with depth at most three, enabling practical quantum kernel construction under near-term constraints. We evaluate Q-Patch on an audio spoofing detection task using a controlled, balanced protocol and compare it with size-matched classical baselines. Q-Patch improves discrimination between bona fide and spoofed samples, achieving an area under the receiver operating characteristic curve (AUROC) of 0.87, compared with 0.82 for a radial basis function support vector machine (RBF-SVM) trained on the same patch-level features. Kernel-space analysis further reveals a clear class structure, with cross-class similarity around 0.615 and within-class self-similarity of 1.00. Overall, Q-Patch provides a practical framework for incorporating time-frequency-aware representations into quantum kernel learning for audio authenticity assessment in low-resource settings.
- Abstract(参考訳): 量子機械学習はパターン認識のための有望なツールとして登場したが、多くのオーディオ中心のアプローチは、分光図を一般的な画像として扱い、その時間周波数構造を明示的に活用していない。
本稿では,メルスペクトルから量子状態への局所的な時間周波数パッチを,隣接性を考慮した浅いハードウェア効率の回路を用いて符号化する,音声に合わせた量子特徴マップQ-Patchを提案する。
選択されたパッチは、コンパクトな4次元音響ディスクリプタで要約され、最大で3つの深さを持つ4ビット回路にマッピングされる。
制御されたバランスの取れたプロトコルを用いて、音声スプーフィング検出タスクにおけるQ-Patchを評価し、サイズマッチングされた古典的ベースラインと比較する。
Q-Patchは、同じパッチレベルで訓練された放射基底関数サポートベクターマシン(RBF-SVM)のレシーバ動作特性曲線(AUROC)0.87の領域を達成し、ボナフィドとスプーフされたサンプルの識別を改善している。
カーネル空間解析はさらに、0.615のクロスクラス類似度と1.00のクラス内自己相似性を持つ明確なクラス構造を明らかにしている。
全体として、Q-Patchは低リソース環境でのオーディオの信頼性評価のための量子カーネル学習に時間周波数対応表現を組み込むための実践的なフレームワークを提供する。
関連論文リスト
- The Impact of Qubit Connectivity on Quantum Advantage in Noisy IQP Circuits [12.732381296045054]
Instantaneous Quantum Polynomial-time (IQP) 回路は、短期的な量子優位性を示す候補である。
分散アーキテクチャでは、長距離通信を実装するために追加のルーティングを必要とするため、この移行においてqubit接続が重要なパラメータであることを示す。
我々は,このアーキテクチャ依存シフトを,コンパイルされた深度オーバーヘッドとそれに対応するシミュラビリティマージンを用いて定量化する。
論文 参考訳(メタデータ) (2026-04-14T12:06:48Z) - QuaRK: A Quantum Reservoir Kernel for Time Series Learning [11.195918728130088]
QuaRKは、ハードウェアリアリスティックな量子貯水池デデューサとカーネルベースの読み出しスキームを結合したエンドツーエンドフレームワークである。
我々は、時間依存データに対する学習理論の保証を提供し、設計と資源選択を有限サンプル性能にリンクする。
論文 参考訳(メタデータ) (2026-02-14T00:04:52Z) - Continual Quantum Architecture Search with Tensor-Train Encoding: Theory and Applications to Signal Processing [68.35481158940401]
CL-QASは連続的な量子アーキテクチャ検索フレームワークである。
振幅のエンコードと変分量子回路の忘れを犠牲にすることの課題を緩和する。
制御可能なロバスト性表現性、サンプル効率の一般化、およびバレンプラトーを使わずに滑らかな収束を実現する。
論文 参考訳(メタデータ) (2026-01-10T02:36:03Z) - Time-adaptive single-shot crosstalk detector on superconducting quantum computer [0.5890690947925292]
量子クロストーク(quantum crosstalk)は、量子プロセッサにおけるノイズやエラーの主な原因である。
クロストークによる摂動を増幅するために、オブザーバ量子ビットと多重量子コヒーレンスを利用する時間適応検出法を提案する。
論文 参考訳(メタデータ) (2025-02-20T03:39:55Z) - Extending Quantum Perceptrons: Rydberg Devices, Multi-Class Classification, and Error Tolerance [67.77677387243135]
量子ニューロモーフィックコンピューティング(QNC)は、量子計算とニューラルネットワークを融合して、量子機械学習(QML)のためのスケーラブルで耐雑音性のあるアルゴリズムを作成する
QNCの中核は量子パーセプトロン(QP)であり、相互作用する量子ビットのアナログダイナミクスを利用して普遍的な量子計算を可能にする。
論文 参考訳(メタデータ) (2024-11-13T23:56:20Z) - Quantum Patch-Based Autoencoder for Anomaly Segmentation [44.99833362998488]
画像の異常セグメンテーションのためのパッチベースの量子オートエンコーダ(QPB-AE)を提案する。
QPB-AEは、組み込まれた入力パッチの量子状態を再構成し、測定から直接異常マップを計算する。
複数のデータセットとパラメータ構成でその性能を評価する。
論文 参考訳(メタデータ) (2024-04-26T08:42:58Z) - High Fidelity Neural Audio Compression [92.4812002532009]
我々は、ニューラルネットワークを利用した最先端のリアルタイム、高忠実、オーディオを導入する。
ストリーミングエンコーダ-デコーダアーキテクチャと、エンドツーエンドでトレーニングされた量子化潜在空間で構成されている。
単一マルチスケール・スペクトログラム・アドバイザリーを用いて、トレーニングを簡素化し、高速化する。
論文 参考訳(メタデータ) (2022-10-24T17:52:02Z) - Deep Spectro-temporal Artifacts for Detecting Synthesized Speech [57.42110898920759]
本稿では,トラック1(低品質フェイク音声検出)とトラック2(部分フェイク音声検出)の総合評価を行う。
本稿では, 原時間信号, スペクトル特性, 深層埋没特性を用いて, 分光時相アーティファクトを検出した。
我々はそれぞれ1番線と2番線で4位と5位にランクインした。
論文 参考訳(メタデータ) (2022-10-11T08:31:30Z) - Optimal quantum control via genetic algorithms for quantum state
engineering in driven-resonator mediated networks [68.8204255655161]
進化的アルゴリズムに基づく量子状態工学には、機械学習によるアプローチを採用しています。
我々は、単一のモード駆動マイクロ波共振器を介して相互作用する、量子ビットのネットワーク(直接結合のない人工原子の状態に符号化された)を考える。
アルゴリズムは理想的なノイズフリー設定で訓練されているにもかかわらず、高い量子忠実度とノイズに対するレジリエンスを観測する。
論文 参考訳(メタデータ) (2022-06-29T14:34:00Z) - Any-to-Many Voice Conversion with Location-Relative Sequence-to-Sequence
Modeling [61.351967629600594]
本稿では,非並列音声変換手法である非並列音声変換法(seq2seq)を提案する。
本手法では,ボトルネック特徴抽出器(BNE)とセック2セック合成モジュールを組み合わせる。
主観的および主観的評価は,提案手法が自然性と話者類似性の両方において優れた音声変換性能を有することを示す。
論文 参考訳(メタデータ) (2020-09-06T13:01:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。