論文の概要: MagLive: Robust Voice Liveness Detection on Smartphones Using Magnetic Pattern Changes
- arxiv url: http://arxiv.org/abs/2404.01106v2
- Date: Sat, 17 Aug 2024 13:41:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 03:08:08.942024
- Title: MagLive: Robust Voice Liveness Detection on Smartphones Using Magnetic Pattern Changes
- Title(参考訳): MagLive: 磁気パターン変化を用いたスマートフォンにおけるロバスト音声のライブ検出
- Authors: Xiping Sun, Jing Chen, Cong Wu, Kun He, Haozhe Xu, Yebo Feng, Ruiying Du, Xianhao Chen,
- Abstract要約: MagLiveは、スマートフォンのための堅牢な音声のライブ検出方式だ。
人間と攻撃者(すなわちスピーカー)を区別する。
以上の結果から,MagLiveは人間と攻撃者を効果的に区別できることが示唆された。
- 参考スコア(独自算出の注目度): 13.859040655124451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Voice authentication has been widely used on smartphones. However, it remains vulnerable to spoofing attacks, where the attacker replays recorded voice samples from authentic humans using loudspeakers to bypass the voice authentication system. In this paper, we present MagLive, a robust voice liveness detection scheme designed for smartphones to mitigate such spoofing attacks. MagLive leverages the differences in magnetic pattern changes generated by different speakers (i.e., humans or loudspeakers) when speaking for liveness detection, which are captured by the built-in magnetometer on smartphones. To extract effective and robust magnetic features, MagLive utilizes a TF-CNN-SAF model as the feature extractor, which includes a time-frequency convolutional neural network (TF-CNN) combined with a self-attention-based fusion (SAF) model. Supervised contrastive learning is then employed to achieve user-irrelevance, device-irrelevance, and content-irrelevance. MagLive imposes no additional burden on users and does not rely on active sensing or specialized hardware. We conducted comprehensive experiments with various settings to evaluate the security and robustness of MagLive. Our results demonstrate that MagLive effectively distinguishes between humans and attackers (i.e., loudspeakers), achieving an average balanced accuracy (BAC) of 99.01% and an equal error rate (EER) of 0.77%.
- Abstract(参考訳): 音声認証はスマートフォンで広く使われている。
しかし、攻撃者は音声認証システムをバイパスするためにスピーカーを用いて、本物の人間の音声サンプルを再生する。
本稿では,スマートフォンによるスプーフィング攻撃の軽減を目的とした,堅牢な音声ライブ検出方式であるMagLiveを提案する。
MagLiveは、スマートフォンに内蔵されている磁気センサで捉えたライブ検出について話すとき、異なる話者(人間やスピーカーなど)が生成する磁気パターンの変化の差を利用する。
有効でロバストな磁気特徴を抽出するために、MagLiveはTF-CNN-SAFモデルを特徴抽出器として使用し、時間周波数畳み込みニューラルネットワーク(TF-CNN)と自己アテンションベース融合(SAF)モデルを組み合わせた。
教師付きコントラスト学習は、ユーザ非関連、デバイス非関連、コンテンツ非関連を達成するために使用される。
MagLiveはユーザーに余計な負担を課さず、アクティブなセンシングや専用ハードウェアに依存しない。
MagLiveの安全性とロバスト性を評価するため,各種設定による総合的な実験を行った。
以上の結果から,MagLiveは人間と攻撃者とを効果的に区別し,平均平衡精度(BAC)が99.01%,誤り率(EER)が0.77%であった。
関連論文リスト
- EarPass: Secure and Implicit Call Receiver Authentication Using Ear Acoustic Sensing [14.78387043362623]
EarPassは、スマートフォンのセキュアで暗黙的なコールレシーバ認証方式である。
イヤーピーススピーカーを通して難聴の音響信号を送信し、外耳を積極的に感知する。
バランスの取れた精度は96.95%で、エラー率は1.53%である。
論文 参考訳(メタデータ) (2024-04-23T13:03:09Z) - Indoor Smartphone SLAM with Learned Echoic Location Features [47.264724701407545]
スマートフォン内蔵オーディオハードウェアと慣性計測ユニット(IMU)を用いた屋内同時位置決めマッピング(SLAM)システムを提案する。
我々のシステムは、スマートフォンのスピーカーを使って、ほぼ可聴のチャープを出力し、マイクを使って室内環境から音響エコーを記録する。
ELFベースのSLAMは、リビングルーム、オフィス、ショッピングモールの再建軌道上で、0.1,textm$、0.53,textm$および0.5,textm$の平均的なローカライゼーション誤差を達成します。
論文 参考訳(メタデータ) (2022-10-16T09:41:09Z) - SuperVoice: Text-Independent Speaker Verification Using Ultrasound
Energy in Human Speech [10.354590276508283]
ボイスアクティベートシステムは、さまざまなデスクトップ、モバイル、IoT(Internet-of-Things)デバイスに統合されている。
既存の話者検証技術は、音声コマンドの可聴周波数範囲から抽出した分光学的特徴により、個々の話者を識別する。
本稿では,特徴融合機構を備えた2ストリームアーキテクチャを用いた話者検証システム SUPERVOICE を提案する。
論文 参考訳(メタデータ) (2022-05-28T18:00:50Z) - Mobile Behavioral Biometrics for Passive Authentication [65.94403066225384]
本研究は, 単モーダルおよび多モーダルな行動的生体特性の比較分析を行った。
HuMIdbは、最大かつ最も包括的なモバイルユーザインタラクションデータベースである。
我々の実験では、最も識別可能な背景センサーは磁力計であり、タッチタスクではキーストロークで最良の結果が得られる。
論文 参考訳(メタデータ) (2022-03-14T17:05:59Z) - On the Detection of Adaptive Adversarial Attacks in Speaker Verification
Systems [0.0]
FAKEBOBのような敵攻撃は、話者認証システムに対して効果的に機能する。
本研究の目的は,敵対的攻撃によって汚染された音声からオリジナル音声を識別できる検出器を設計することである。
提案する検出器は実装が容易で,入力オーディオを高速に処理でき,FAKEBOB攻撃による音声の破損の有無を判定する上で有効であることを示す。
論文 参考訳(メタデータ) (2022-02-11T16:02:06Z) - Machine Learning based COVID-19 Detection from Smartphone Recordings:
Cough, Breath and Speech [7.908757488948712]
本研究は, スマートフォンから発声, 呼吸, 発声を自動検出する実験である。
coswara と compare の2つのデータセットで実験を行い,その内容は,うなずき,呼吸,発話の記録を含む。
発声音声では、covid-19の最も強力な署名は、息とスピーチに続くものだと結論付けている。
論文 参考訳(メタデータ) (2021-04-02T23:21:24Z) - FoolHD: Fooling speaker identification by Highly imperceptible
adversarial Disturbances [63.80959552818541]
話者識別モデルに対する知覚不能な摂動を発生させるホワイトボックス・ステガノグラフィーによる敵攻撃を提案する。
我々のアプローチであるFoolHDは、DCTドメインで動作するGated Convolutional Autoencoderを使用し、多目的損失関数で訓練されている。
我々は,VoxCelebを用いて訓練した250話者識別xベクトルネットワークを用いてFoolHDを検証する。
論文 参考訳(メタデータ) (2020-11-17T07:38:26Z) - Defense for Black-box Attacks on Anti-spoofing Models by Self-Supervised
Learning [71.17774313301753]
本研究では,自己指導型高水準表現の堅牢性について,敵攻撃に対する防御に利用して検討する。
ASVspoof 2019データセットの実験結果は、Mockingjayによって抽出されたハイレベルな表現が、敵の例の転送可能性を妨げることを示した。
論文 参考訳(メタデータ) (2020-06-05T03:03:06Z) - A Framework for Behavioral Biometric Authentication using Deep Metric
Learning on Mobile Devices [17.905483523678964]
バッテリー駆動のモバイルデバイス上でのトレーニングを取り入れた新しいフレームワークを提案する。これにより、プライベートデータはデバイスを離れることなく、実行時の動作パターンに柔軟に適応するようにトレーニングをスケジュールすることができる。
実験では、3つの公開データセットで95%以上の認証精度が示され、データが少ないマルチクラスの分類では15%の精度が向上し、それぞれ99%と90%が成功したブルートフォース攻撃とサイドチャネル攻撃に対する堅牢性が向上した。
その結果,トレーニングはビデオ視聴よりも低エネルギーを消費し,ゲームよりも若干高いエネルギーを消費していることがわかった。
論文 参考訳(メタデータ) (2020-05-26T17:56:20Z) - Characterizing Speech Adversarial Examples Using Self-Attention U-Net
Enhancement [102.48582597586233]
本稿では,U-Net$_At$という,U-Netに基づくアテンションモデルを提案する。
対戦型音声アタックを用いた自動音声認識(ASR)タスクの実験を行った。
論文 参考訳(メタデータ) (2020-03-31T02:16:34Z) - Speech Enhancement using Self-Adaptation and Multi-Head Self-Attention [70.82604384963679]
本稿では,補助的話者認識機能を用いた音声強調のための自己適応手法について検討する。
テスト発話から直接適応に用いる話者表現を抽出する。
論文 参考訳(メタデータ) (2020-02-14T05:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。