論文の概要: Data Quality as Predictor of Voice Anti-Spoofing Generalization
- arxiv url: http://arxiv.org/abs/2103.14602v1
- Date: Fri, 26 Mar 2021 17:09:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:50:47.483723
- Title: Data Quality as Predictor of Voice Anti-Spoofing Generalization
- Title(参考訳): 音声アンチスポーフィング一般化予測器としてのデータ品質
- Authors: Bhusan Chettri, Rosa Gonz\'alez Hautam\"aki, Md Sahidullah, Tomi
Kinnunen
- Abstract要約: データ品質がアンチスプーフィング性能に与える影響を測る新しいフレームワークについて概説する。
長期的なスペクトル情報,話者人口,信号対雑音比,選択音声品質特性の影響について検討した。
- 参考スコア(独自算出の注目度): 19.737079032489163
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Voice anti-spoofing aims at classifying a given speech input either as a
bonafide human sample, or a spoofing attack (e.g. synthetic or replayed
sample). Numerous voice anti-spoofing methods have been proposed but most of
them fail to generalize across domains (corpora) -- and we do not know
\emph{why}. We outline a novel interpretative framework for gauging the impact
of data quality upon anti-spoofing performance. Our within- and between-domain
experiments pool data from seven public corpora and three anti-spoofing methods
based on Gaussian mixture and convolutive neural network models. We assess the
impacts of long-term spectral information, speaker population (through x-vector
speaker embeddings), signal-to-noise ratio, and selected voice quality
features.
- Abstract(参考訳): ボイス・アンチ・スプーフィング(Voice anti-spoofing)は、与えられた音声入力をボナフィドヒトサンプルまたはスプーフィング攻撃(例)として分類することを目的とする。
合成または再生されたサンプル)
多くの音声アンチスプーフィング手法が提案されているが、そのほとんどが領域(コーポラ)をまたがる一般化に失敗しており、私たちは \emph{why} を知らない。
本稿では,データ品質がアンチスプーフィング性能に与える影響を測る新しい解釈フレームワークについて概説する。
ガウス混合モデルと畳み込みニューラルネットワークモデルに基づく7つのパブリックコーパスと3つのアンチスプーフィング手法から得られたデータの内部およびドメイン間実験を行った。
我々は,長期スペクトル情報,話者集団(xベクトル話者埋め込み),信号対雑音比,選択された音声品質特性の影響を評価する。
関連論文リスト
- Mitigating Unauthorized Speech Synthesis for Voice Protection [7.1578783467799]
悪意のある音声による搾取は 我々の日常生活に大きな危険をもたらしました
個人音声など機密情報を含む公開音声データを保護することが重要である。
本稿では,従来の音声サンプルに知覚不可能な誤り最小化雑音を適用したPivotal Objective Perturbation(POP)を提案する。
論文 参考訳(メタデータ) (2024-10-28T05:16:37Z) - Detecting Adversarial Data via Perturbation Forgery [28.637963515748456]
逆検出は、自然データと逆データの間の分布とノイズパターンの相違に基づいて、データフローから逆データを特定し、フィルタリングすることを目的としている。
不均衡および異方性雑音パターンを回避した生成モデルに基づく新しい攻撃
本研究では,ノイズ分布の摂動,スパースマスク生成,擬似対向データ生成を含む摂動フォージェリを提案し,未知の勾配に基づく,生成モデルに基づく,物理的対向攻撃を検出することができる対向検出器を訓練する。
論文 参考訳(メタデータ) (2024-05-25T13:34:16Z) - ConvNext Based Neural Network for Anti-Spoofing [6.047242590232868]
自動話者認証(ASV)は、実生活においてアイデンティティ認証に広く用いられている。
音声変換, 音声アルゴリズム, 記録装置の品質向上などにより, ASVシステムはスプーフ攻撃に対して脆弱である。
論文 参考訳(メタデータ) (2022-09-14T05:53:37Z) - Leveraging Symmetrical Convolutional Transformer Networks for Speech to
Singing Voice Style Transfer [49.01417720472321]
我々は、入力音声とターゲットメロディのアライメントをモデル化する、SymNetと呼ばれる新しいニューラルネットワークアーキテクチャを開発する。
音声と歌声の並列データからなるNASデータセットとNHSSデータセットで実験を行う。
論文 参考訳(メタデータ) (2022-08-26T02:54:57Z) - A Frequency Perspective of Adversarial Robustness [72.48178241090149]
理論的および経験的知見を参考に,周波数に基づく対向例の理解について述べる。
分析の結果,逆転例は高周波でも低周波成分でもないが,単にデータセット依存であることがわかった。
本稿では、一般に観測される精度対ロバスト性トレードオフの周波数に基づく説明法を提案する。
論文 参考訳(メタデータ) (2021-10-26T19:12:34Z) - LDNet: Unified Listener Dependent Modeling in MOS Prediction for
Synthetic Speech [67.88748572167309]
本稿では,平均世論スコア(MOS)予測のための統合フレームワークLDNetを提案する。
より安定した結果と効率的な計算を提供する2つの推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-18T08:52:31Z) - On Procedural Adversarial Noise Attack And Defense [2.5388455804357952]
逆の例では、ニューラルネットワークが入力画像に小さな修正を加えて予測エラーを発生させる。
本稿では,手続き型雑音関数に基づく2つのユニバーサル対向摂動(UAP)生成手法を提案する。
セマンティック表現を変更することなく、我々の手法によって生成された敵の例は攻撃に対して優れた性能を示す。
論文 参考訳(メタデータ) (2021-08-10T02:47:01Z) - Towards Robust Speech-to-Text Adversarial Attack [78.5097679815944]
本稿では,DeepSpeech,Kaldi,Lingvoなど,最先端の音声テキストシステムに対する新たな逆アルゴリズムを提案する。
本手法は, 逆最適化定式化の従来の歪み条件の拡張を開発することに基づいている。
元のサンプルと反対のサンプルの分布の差を測定するこの測定値の最小化は、正統な音声記録のサブスペースに非常に近い作成信号に寄与する。
論文 参考訳(メタデータ) (2021-03-15T01:51:41Z) - WaveTransform: Crafting Adversarial Examples via Input Decomposition [69.01794414018603]
本稿では,低周波サブバンドと高周波サブバンドに対応する逆雑音を生成するWaveTransformを紹介する。
実験により,提案攻撃は防衛アルゴリズムに対して有効であり,CNN間での転送も可能であることが示された。
論文 参考訳(メタデータ) (2020-10-29T17:16:59Z) - Class-Conditional Defense GAN Against End-to-End Speech Attacks [82.21746840893658]
本稿では,DeepSpeech や Lingvo といった先進的な音声テキストシステムを騙すために開発された,エンドツーエンドの敵対攻撃に対する新しいアプローチを提案する。
従来の防御手法とは異なり、提案手法は入力信号のオートエンコードのような低レベル変換を直接利用しない。
我々の防衛GANは、単語誤り率と文レベルの認識精度において、従来の防衛アルゴリズムよりもかなり優れています。
論文 参考訳(メタデータ) (2020-10-22T00:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。