論文の概要: CLIPC8: Face liveness detection algorithm based on image-text pairs and
contrastive learning
- arxiv url: http://arxiv.org/abs/2311.17583v1
- Date: Wed, 29 Nov 2023 12:21:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 21:32:37.937339
- Title: CLIPC8: Face liveness detection algorithm based on image-text pairs and
contrastive learning
- Title(参考訳): CLIPC8:画像テキストペアとコントラスト学習に基づく顔の生存度検出アルゴリズム
- Authors: Xu Liu, Shu Zhou, Yurong Song, Wenzhe Luo, Xin Zhang
- Abstract要約: 画像テキストペアとコントラスト学習に基づく顔の生存度検出手法を提案する。
提案手法は,特定のシナリオにおいて,特定の生きた攻撃行動を効果的に検出することができる。
また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
- 参考スコア(独自算出の注目度): 3.90443799528247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Face recognition technology is widely used in the financial field, and
various types of liveness attack behaviors need to be addressed. Existing
liveness detection algorithms are trained on specific training datasets and
tested on testing datasets, but their performance and robustness in
transferring to unseen datasets are relatively poor. To tackle this issue, we
propose a face liveness detection method based on image-text pairs and
contrastive learning, dividing liveness attack problems in the financial field
into eight categories and using text information to describe the images of
these eight types of attacks. The text encoder and image encoder are used to
extract feature vector representations for the classification description text
and face images, respectively. By maximizing the similarity of positive samples
and minimizing the similarity of negative samples, the model learns shared
representations between images and texts. The proposed method is capable of
effectively detecting specific liveness attack behaviors in certain scenarios,
such as those occurring in dark environments or involving the tampering of ID
card photos. Additionally, it is also effective in detecting traditional
liveness attack methods, such as printing photo attacks and screen remake
attacks. The zero-shot capabilities of face liveness detection on five public
datasets, including NUAA, CASIA-FASD, Replay-Attack, OULU-NPU and MSU-MFSD also
reaches the level of commercial algorithms. The detection capability of
proposed algorithm was verified on 5 types of testing datasets, and the results
show that the method outperformed commercial algorithms, and the detection
rates reached 100% on multiple datasets. Demonstrating the effectiveness and
robustness of introducing image-text pairs and contrastive learning into
liveness detection tasks as proposed in this paper.
- Abstract(参考訳): 金融分野では顔認識技術が広く使われており、様々な種類の生き生きとした攻撃行動に対処する必要がある。
既存のライブネス検出アルゴリズムは、特定のトレーニングデータセットでトレーニングされ、テストデータセットでテストされますが、それらのパフォーマンスと未認識データセットへの転送の堅牢性は比較的貧弱です。
そこで本研究では,画像-テキストペアとコントラスト学習に基づく顔のライブネス検出手法を提案し,金融分野におけるライブネス攻撃問題を8つのカテゴリに分け,これら8種類の攻撃の画像をテキスト情報を用いて表現する。
テキストエンコーダと画像エンコーダを用いて、分類記述テキストと顔画像の特徴ベクトル表現をそれぞれ抽出する。
正のサンプルの類似性を最大化し、負のサンプルの類似性を最小化することにより、画像とテキストの共有表現を学習する。
提案手法は,暗黒環境やidカード写真の改ざんを伴うような特定のシナリオにおいて,特定のライブネス攻撃行動を効果的に検出することができる。
また、印刷写真攻撃やスクリーンリメイク攻撃などの従来の生きた攻撃方法の検出にも有効である。
nuaa、casia-fasd、replay-attack、oulu-npu、msu-mfsdの5つのパブリックデータセットのゼロショット検出機能も商用アルゴリズムのレベルに達している。
提案アルゴリズムの検出能力は5種類のテストデータセットで検証され,提案手法は商用アルゴリズムよりも優れており,検出率は複数のデータセットで100%に達した。
本稿では,画像テキストペアの導入の有効性とロバストさを実証し,生活度検出タスクにコントラスト学習を導入することを提案する。
関連論文リスト
- Counterfactual Image Generation for adversarially robust and
interpretable Classifiers [1.3859669037499769]
本稿では,GAN(Generative Adrial Networks)を基盤として,画像から画像への変換を利用した統合フレームワークを提案する。
これは、分類器と識別器を1つのモデルに組み合わせて、実際の画像をそれぞれのクラスに属性付け、生成されたイメージを「フェイク」として生成することで達成される。
モデルが敵攻撃に対するロバスト性の向上を示すことを示すとともに,判別器の「フェイクネス」値が予測の不確かさの指標となることを示す。
論文 参考訳(メタデータ) (2023-10-01T18:50:29Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Adaptive Face Recognition Using Adversarial Information Network [57.29464116557734]
顔認識モデルは、トレーニングデータがテストデータと異なる場合、しばしば退化する。
本稿では,新たな敵情報ネットワーク(AIN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T02:14:11Z) - Building an Invisible Shield for Your Portrait against Deepfakes [34.65356811439098]
本稿では,画像のプロアクティブな保護を目的とした新しいフレームワーク,Integity Encryptorを提案する。
提案手法では,重要な顔属性と密接な関係を持つメッセージを,秘密に符号化する。
修正された顔属性は、デコードされたメッセージの比較を通じて、操作された画像を検出する手段として機能する。
論文 参考訳(メタデータ) (2023-05-22T10:01:28Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Robust Data Hiding Using Inverse Gradient Attention [82.73143630466629]
データ隠蔽タスクでは、異なる耐久性を有するため、カバー画像の各ピクセルを別々に扱う必要がある。
Inverse Gradient Attention (IGA) を用いた新しい深層データ隠蔽方式を提案する。
実証的な実験により、提案モデルが2つの先行するデータセット上で最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-11-21T19:08:23Z) - MixNet for Generalized Face Presentation Attack Detection [63.35297510471997]
我々は、プレゼンテーションアタックを検出するための、TextitMixNetと呼ばれるディープラーニングベースのネットワークを提案している。
提案アルゴリズムは最先端の畳み込みニューラルネットワークアーキテクチャを利用して,各攻撃カテゴリの特徴マッピングを学習する。
論文 参考訳(メタデータ) (2020-10-25T23:01:13Z) - A Study for Universal Adversarial Attacks on Texture Recognition [19.79803434998116]
テストされたテクスチャデータセットの80%以上で、ディープラーニングモデルを騙すことができる画像非依存/普遍的摂動が存在することを示す。
テストデータセット上の様々な攻撃手法を用いた計算摂動は、概して準知覚可能であり、低、中、高周波数成分の構造化パターンを含む。
論文 参考訳(メタデータ) (2020-10-04T08:11:11Z) - Determining Sequence of Image Processing Technique (IPT) to Detect
Adversarial Attacks [4.431353523758957]
本稿では,悪意のある入力を検出するための画像処理手法(IPTS)を自動決定する進化的手法を提案する。
遺伝的アルゴリズム(GA)に基づく検出フレームワークを開発し、最適なIPTSを見つける。
テスト時に動的に選択されるIPTSのセットは、敵攻撃のフィルタとして機能する。
論文 参考訳(メタデータ) (2020-07-01T08:59:14Z) - Face Anti-Spoofing by Learning Polarization Cues in a Real-World
Scenario [50.36920272392624]
顔の偽造は生体認証アプリケーションにおけるセキュリティ侵害を防ぐ鍵となる。
RGBと赤外線画像を用いたディープラーニング手法は,新たな攻撃に対する大量のトレーニングデータを必要とする。
本研究では,実顔の偏光画像の物理的特徴を自動的に学習することにより,現実のシナリオにおける顔のアンチ・スプーフィング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T03:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。