論文の概要: One-shot lip-based biometric authentication: extending behavioral
features with authentication phrase information
- arxiv url: http://arxiv.org/abs/2308.06944v1
- Date: Mon, 14 Aug 2023 05:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 14:26:29.484108
- Title: One-shot lip-based biometric authentication: extending behavioral
features with authentication phrase information
- Title(参考訳): ワンショット唇に基づく生体認証 : 認証フレーズ情報による行動特徴の延長
- Authors: Brando Koch, Ratko Grbi\'c
- Abstract要約: リップベースバイオメトリック認証(LBBA)は、カメラセンサが捉えたビデオデータの形態で、音声中の人の唇の動きに基づく認証方法である。
LBBAは、RGBカメラ以外の追加の感覚機器を必要とすることなく、唇の動きの物理的特性と行動的特性を両立させることができる。
- 参考スコア(独自算出の注目度): 3.038642416291856
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lip-based biometric authentication (LBBA) is an authentication method based
on a person's lip movements during speech in the form of video data captured by
a camera sensor. LBBA can utilize both physical and behavioral characteristics
of lip movements without requiring any additional sensory equipment apart from
an RGB camera. State-of-the-art (SOTA) approaches use one-shot learning to
train deep siamese neural networks which produce an embedding vector out of
these features. Embeddings are further used to compute the similarity between
an enrolled user and a user being authenticated. A flaw of these approaches is
that they model behavioral features as style-of-speech without relation to what
is being said. This makes the system vulnerable to video replay attacks of the
client speaking any phrase. To solve this problem we propose a one-shot
approach which models behavioral features to discriminate against what is being
said in addition to style-of-speech. We achieve this by customizing the GRID
dataset to obtain required triplets and training a siamese neural network based
on 3D convolutions and recurrent neural network layers. A custom triplet loss
for batch-wise hard-negative mining is proposed. Obtained results using an
open-set protocol are 3.2% FAR and 3.8% FRR on the test set of the customized
GRID dataset. Additional analysis of the results was done to quantify the
influence and discriminatory power of behavioral and physical features for
LBBA.
- Abstract(参考訳): lip-based bioometric authentication(lbba)は、カメラセンサによってキャプチャされたビデオデータの形で、音声中の唇の動きに基づく認証手法である。
LBBAは、RGBカメラ以外の追加の感覚機器を必要とすることなく、唇の動きの物理的特徴と行動的特性の両方を利用することができる。
State-of-the-art(SOTA)アプローチでは、ワンショット学習を使用してディープサイムニューラルネットワークをトレーニングし、これらの特徴から埋め込みベクターを生成する。
埋め込みはさらに、登録されたユーザと認証されたユーザとの類似性を計算するために使用される。
これらのアプローチの欠点は、何を言っているかとは無関係に、行動的特徴を音声のスタイルとしてモデル化することである。
これにより、任意のフレーズを話すクライアントのビデオ再生攻撃に脆弱なシステムになる。
この問題を解決するために,音声のスタイルに加えて,発話内容と区別する行動特徴をモデル化するワンショットアプローチを提案する。
グリッドデータセットをカスタマイズして必要なトリプレットを取得し,3次元畳み込みとリカレントニューラルネットワーク層に基づいてシャムニューラルネットワークをトレーニングすることで,これを実現する。
バッチワイド硬負鉱業におけるカスタム三重項損失を提案する。
オープンセットプロトコルを用いて得られた結果は、カスタマイズされたグリッドデータセットのテストセットの3.2%、および3.8%frrである。
LBBAの行動的特徴と身体的特徴の影響と識別力を定量化するために, さらなる分析を行った。
関連論文リスト
- A Unified Multi-Task Learning Architecture for Hate Detection Leveraging User-Based Information [23.017068553977982]
ヘイトスピーチ、攻撃的言語、攻撃性、人種差別、性差別、その他の虐待的言語は、ソーシャルメディアでよく見られる現象である。
ヘイトコンテンツを大規模にフィルタリングする人工知能(AI)ベースの介入が必要である。
本稿では,ユーザ内およびユーザ間情報を活用することで,英語のヘイトスピーチ識別を改善するユニークなモデルを提案する。
論文 参考訳(メタデータ) (2024-11-11T10:37:11Z) - LipSim: A Provably Robust Perceptual Similarity Metric [56.03417732498859]
敵攻撃に対するViTベースの特徴抽出器のアンサンブルに基づく,最先端の知覚的類似度指標の脆弱性を示す。
次に、証明可能な保証とともに、LipSimと呼ばれる堅牢な知覚的類似度メトリックをトレーニングするためのフレームワークを提案する。
LipSimは、各データポイント周辺の保護された領域と、$ell$ ball内のすべての摂動の証明書を提供する。
論文 参考訳(メタデータ) (2023-10-27T16:59:51Z) - Privacy Preserving Machine Learning for Behavioral Authentication
Systems [0.0]
行動認証(BA)システムは、ユーザの行動特性を使用して、アイデンティティークレームの検証を行う。
他のニューラルネットワーク(NN)アーキテクチャと同様に、BAシステムのNN分類器は、プライバシ攻撃に対して脆弱である。
我々は、MLベースのプライバシ攻撃を導入し、提案システムは、これや他のプライバシおよびセキュリティ攻撃に対して堅牢である。
論文 参考訳(メタデータ) (2023-08-31T19:15:26Z) - An Approach for Improving Automatic Mouth Emotion Recognition [1.5293427903448025]
この研究は、畳み込みニューラルネットワーク(CNN)を用いた口検出による自動感情認識技術の提案と試験である。
この技術は、コミュニケーションスキルの問題のある健康障害の人々を支援するために応用される。
論文 参考訳(メタデータ) (2022-12-12T16:17:21Z) - Privacy-Preserved Neural Graph Similarity Learning [99.78599103903777]
本稿では,グラフ類似性学習のためのプライバシ保存型ニューラルグラフマッチングネットワークモデルPPGMを提案する。
再構成攻撃を防ぐため、提案モデルではデバイス間でノードレベルの表現を通信しない。
グラフプロパティに対する攻撃を軽減するため、両方のベクトルの情報を含む難読化機能は通信される。
論文 参考訳(メタデータ) (2022-10-21T04:38:25Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Spotting adversarial samples for speaker verification by neural vocoders [102.1486475058963]
我々は、自動話者検証(ASV)のための敵対サンプルを見つけるために、ニューラルボコーダを採用する。
元の音声と再合成音声のASVスコアの違いは、真正と逆正のサンプルの識別に良い指標であることがわかった。
私たちのコードは、将来的な比較作業のためにオープンソースにされます。
論文 参考訳(メタデータ) (2021-07-01T08:58:16Z) - Exploring Deep Learning for Joint Audio-Visual Lip Biometrics [54.32039064193566]
音声視覚(AV)リップバイオメトリックスは、音声通信における音声と視覚の両方の利点を利用する有望な認証技術である。
大規模なAVデータベースの欠如は、ディープラーニングベースのオーディオビジュアルリップバイオメトリックの探索を妨げる。
我々は、畳み込みニューラルネットワーク(CNN)ベースのビデオモジュール、時間遅延ニューラルネットワーク(TDNN)ベースのオーディオモジュール、マルチモーダル融合モジュールで実現されたDeepLip AVリップバイオメトリックスシステムを確立する。
論文 参考訳(メタデータ) (2021-04-17T10:51:55Z) - Activity Recognition with Moving Cameras and Few Training Examples:
Applications for Detection of Autism-Related Headbanging [1.603589863010401]
行動認識コンピュータビジョンアルゴリズムは、自閉症に関連する行動の存在を検出するために使用できる。
ヘッドバンジ検出に適用した場合のアクティビティ認識における現在の特徴表現技術の利点と限界を文書化します。
時間分散畳み込みニューラルネットワークを用いて,ホームビデオのヘッドバンジを検出するコンピュータビジョン分類器を作成する。
論文 参考訳(メタデータ) (2021-01-10T05:37:05Z) - Generalized Iris Presentation Attack Detection Algorithm under
Cross-Database Settings [63.90855798947425]
プレゼンテーションアタックは、バイオメトリックなモダリティの大部分に大きな課題をもたらす。
本稿では,汎用的な深層学習に基づくプレゼンテーション攻撃検出ネットワークであるMVANetを提案する。
これはハイブリッドアルゴリズムの単純さと成功、あるいは複数の検出ネットワークの融合にインスパイアされている。
論文 参考訳(メタデータ) (2020-10-25T22:42:27Z) - 3D Facial Matching by Spiral Convolutional Metric Learning and a
Biometric Fusion-Net of Demographic Properties [0.0]
顔認識は広く受け入れられている生体認証ツールであり、顔には人物の身元に関する情報が多数含まれている。
本研究では,2ステップのニューラルベースパイプラインを用いて3次元顔形状と複数のDNA関連特性をマッチングする。
生体認証のための10倍のクロスバリデーションにより得られた結果は、複数の特性を組み合わせることでより強力な生体認証システムが得られることを示している。
論文 参考訳(メタデータ) (2020-09-10T09:31:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。