論文の概要: Voice Morphing: Two Identities in One Voice
- arxiv url: http://arxiv.org/abs/2309.02404v1
- Date: Tue, 5 Sep 2023 17:36:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 13:42:31.497540
- Title: Voice Morphing: Two Identities in One Voice
- Title(参考訳): 音声モーフィング:1声で2つのアイデンティティ
- Authors: Sushanta K. Pani, Anurag Chowdhury, Morgan Sandler, Arun Ross
- Abstract要約: 音声を用いたモーフィング (VIM) を導入し, 音声サンプルを合成し, 個人の声の特徴を識別する。
VIMは成功率(MMPMR)が80%以上で、ミスマッチレートは1%である。
- 参考スコア(独自算出の注目度): 12.404748962951157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a biometric system, each biometric sample or template is typically
associated with a single identity. However, recent research has demonstrated
the possibility of generating "morph" biometric samples that can successfully
match more than a single identity. Morph attacks are now recognized as a
potential security threat to biometric systems. However, most morph attacks
have been studied on biometric modalities operating in the image domain, such
as face, fingerprint, and iris. In this preliminary work, we introduce Voice
Identity Morphing (VIM) - a voice-based morph attack that can synthesize speech
samples that impersonate the voice characteristics of a pair of individuals.
Our experiments evaluate the vulnerabilities of two popular speaker recognition
systems, ECAPA-TDNN and x-vector, to VIM, with a success rate (MMPMR) of over
80% at a false match rate of 1% on the Librispeech dataset.
- Abstract(参考訳): 生体認証システムでは、各生体認証サンプルまたはテンプレートは、典型的には単一のアイデンティティに関連付けられる。
しかし、近年の研究では、1つ以上のアイデンティティに適合する「形態」バイオメトリックなサンプルを生成する可能性を実証している。
morph攻撃は現在、生体認証システムの潜在的なセキュリティ脅威として認識されている。
しかし、ほとんどの形態攻撃は、顔、指紋、虹彩などの画像領域で作用する生体計測のモダリティについて研究されている。
本研究では,音声の個人的特徴を模倣した音声サンプルを合成する音声ベースのモーフィックアタックであるvoice identity morphing (vim)を提案する。
実験では,ECAPA-TDNN と x-vector の2つの話者認識システムの脆弱性を,Lbrispeech データセットで 1% の偽一致率で 80% 以上の成功率 (MMPMR) でVIM に評価した。
関連論文リスト
- Anomalous Sound Detection using Audio Representation with Machine ID
based Contrastive Learning Pretraining [52.191658157204856]
コントラスト学習を用いて、各音声サンプルではなく、各機械IDの音声表現を洗練する。
提案手法では、コントラスト学習を用いて音声表現モデルを事前学習する。
実験の結果,本手法はコントラスト学習や自己教師型分類を用いて最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-07T11:08:31Z) - Untargeted Near-collision Attacks on Biometrics: Real-world Bounds and
Theoretical Limits [0.0]
オンラインとオフラインの両方、そして識別モードと検証モードの両方で実行できる未ターゲティングな攻撃に焦点を当てます。
我々は、これらのシステムのセキュリティに対処するために、False Match Rate(FMR)とFalse Positive Identification Rate(FPIR)を用いる。
この距離空間とシステムパラメータの研究は、標的外攻撃の複雑さと近接衝突の確率を与える。
論文 参考訳(メタデータ) (2023-04-04T07:17:31Z) - OTB-morph: One-Time Biometrics via Morphing [16.23764869038004]
本稿では,生体計測をキャンセル可能な変換関数として活用する新しいアイデアを提案する。
フェースバイオメトリックスに対して提案手法を実験的に実装する。
論文 参考訳(メタデータ) (2023-02-17T18:39:40Z) - Leveraging Diffusion For Strong and High Quality Face Morphing Attacks [2.0795007613453445]
顔形態攻撃は、2つの異なるアイデンティティから生体特性からなる形態像を提示することにより、顔認識(FR)システムを騙そうとする。
画像の視覚的忠実度を改善するために拡散型アーキテクチャを用いた新しいモーフィング攻撃を提案する。
論文 参考訳(メタデータ) (2023-01-10T21:50:26Z) - Facial Soft Biometrics for Recognition in the Wild: Recent Works,
Annotation, and COTS Evaluation [63.05890836038913]
制約のないシナリオにおける人物認識システムを強化するために,ソフトバイオメトリックスが果たす役割について検討する。
1) ソフトバイオメトリックスのマニュアル推定と,2) 市販オフザシェルフシステムによる自動推定の2つの仮定を考察する。
深層学習に基づく2つの最先端顔認識システムを用いた軟式生体計測実験を行った。
論文 参考訳(メタデータ) (2022-10-24T11:29:57Z) - Are GAN-based Morphs Threatening Face Recognition? [3.0921354926071274]
本稿では,4種類のモーフィング攻撃のためのデータセットと対応するコードを提供することにより,このギャップを埋める。
また、4つの最先端の顔認識システムの脆弱性を評価するための広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-05-05T08:19:47Z) - OTB-morph: One-Time Biometrics via Morphing applied to Face Templates [8.623680649444212]
本稿では,テンプレートを潜在的な攻撃から保護することを目的とした,キャンセル可能なバイオメトリックスのための新しい手法を提案する。
フェースバイオメトリックスに対して提案手法を実験的に実装する。
論文 参考訳(メタデータ) (2021-11-25T18:35:34Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Exploring Deep Learning for Joint Audio-Visual Lip Biometrics [54.32039064193566]
音声視覚(AV)リップバイオメトリックスは、音声通信における音声と視覚の両方の利点を利用する有望な認証技術である。
大規模なAVデータベースの欠如は、ディープラーニングベースのオーディオビジュアルリップバイオメトリックの探索を妨げる。
我々は、畳み込みニューラルネットワーク(CNN)ベースのビデオモジュール、時間遅延ニューラルネットワーク(TDNN)ベースのオーディオモジュール、マルチモーダル融合モジュールで実現されたDeepLip AVリップバイオメトリックスシステムを確立する。
論文 参考訳(メタデータ) (2021-04-17T10:51:55Z) - Many-to-Many Voice Transformer Network [55.17770019619078]
本稿では,S2S学習フレームワークに基づく音声変換(VC)手法を提案する。
これにより、音声特性、ピッチ輪郭、入力音声の持続時間の同時変換が可能となる。
論文 参考訳(メタデータ) (2020-05-18T04:02:08Z) - Keystroke Biometrics in Response to Fake News Propagation in a Global
Pandemic [77.79066811371978]
本研究では,キーストロークバイオメトリックスを用いたコンテンツ匿名化手法の提案と解析を行う。
フェイクニュースは、特に主要なイベントにおいて、世論を操作する強力なツールとなっている。
論文 参考訳(メタデータ) (2020-05-15T17:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。